泡泡资讯网

15 场小组赛结束,十二款国产大模型同台预测世界杯的成绩全部出炉,没有自说自话,

15 场小组赛结束,十二款国产大模型同台预测世界杯的成绩全部出炉,没有自说自话,赛果就是最公平的评判标准。
联想联合咪咕推出的预测人机大战,把百度文心、联想天禧、腾讯混元、Kimi、通义千问等主流模型放在同一套规则下比拼,赛前统一公示预测结果,赛后当场核对对错,阶段性排名一目了然:
百度文心猜对 7 场暂时领跑;联想天禧、腾讯混元等四款模型各命中 6 场紧随其后;投入大量推演维度的 Kimi 仅猜对 4 场。
很有意思的一点,强弱差距悬殊的比赛,各家判断基本不会出错;可一旦遇上平局,所有模型集体失准。十五场小组赛出现六场平局,十二款 AI 加起来只猜对四次。
归根到底,各类足球资讯大多围绕胜负展开,少有针对势均力敌对局的分析,机器很难预判赛场各种偶然因素抵消纸面实力后的结果。
以往行业测评充斥专业参数,普通网友很难分辨真实水平高低。而世界杯门槛极低,看懂输赢就能直观分辨差距。
不同于各家单独推出预测功能、只展示自身优势,联想这次搭建了一个全行业同台竞技的公开平台,不只展现自家产品表现,更直白暴露行业普遍存在的短板,格局拉满。
如今赛程才刚起步,还有八十多场比赛,后续强强对决、生死淘汰赛接连上演,各家预测准确率能否反转,值得持续观望。
最后,记得看世界杯上咪咕视频。