当时间来到六月底后,美加墨世界杯的所有小组赛都已经打完,出线的32支球队正陆续开启首场淘汰赛。
有意思的是,就在这届世界杯开启前的6月8日,国内AI巨头Kimi公开宣布要预测104场比赛,标题直言“德国队将爆冷夺冠”,结果德国队止步32强爆冷出局……
Kimi将通过「Agent集群」同时调度 300个子Agent,从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等维度,并行研究104场世界杯赛事,并在每轮赛前公开预测与赛后复盘。

(图源:Kimi公众号)
现在世界杯还在进行,但我们已经可以就小组赛出线名单,和Kimi之前的预测进行比对,看看当下AI对于体育赛事胜负的判断准确率如何。当然,Kimi自己事先就叠了个甲,第一句话就是「我们的预测可能是错的」,这场高调的预测行为,更多是为了探索AI当下的能力和局限性。
32强猜中26个,AI比人类更强?
6月9日,Kimi给出了一份超过200页的详细的世界杯报告,我们先介绍那些密密麻麻的数据统计和分析,直接看AI的32强预测。Kimi并没有直接给出32强的名单,但每个小组的球队,它都给出了出线概率这项数据。

(图源:Kimi)
所以,48支球队中,出线概率排名前32的,基本就可以看作是Kimi的预测名单。按照概率从高到低,Kimi预测出线的球队分别是:
德国(99.4%)、葡萄牙(97.7%)、西班牙(97.3%)、阿根廷(96%)、巴西(92%)、英格兰(91.9%)、法国(90%)、摩洛哥(88.7%)、荷兰(87%)、乌拉圭(85%)、比利时(85%)、厄瓜多尔(83%)、墨西哥(82%)、克罗地亚(80%)、哥伦比亚(78%)、瑞士(78%)、美国(75%)、日本(73%)、韩国(67%)、奥地利(65%)、塞内加尔(65%)、澳大利亚(61%)、苏格兰(60%)、瑞典(60%)、埃及(60%)、土耳其(58%)、挪威(55%)、加拿大(55%)、捷克(55%)、伊朗(53%)、波黑(53%)、科特迪瓦(48%)。
而实际的32强名单则是德国、葡萄牙、西班牙、阿根廷、巴西、英格兰、法国、摩洛哥、荷兰、比利时、厄瓜多尔、墨西哥、克罗地亚、瑞士、美国、日本、奥地利、塞内加尔、澳大利亚、瑞典、埃及、挪威、加拿大、波黑、科特迪瓦、南非、巴拉圭、佛得角、阿尔及利亚、哥伦比亚、刚果(金)、加纳。

(图源:微博)
Kimi预测正确了26支球队、错估了6支球队(乌拉圭、韩国、苏格兰、土耳其、捷克、伊朗没有晋级,南非、巴拉圭、佛得角、阿尔及利亚、刚果(金)、加纳晋级了)。
也就是说,Kimi预测的准确率是81.25%,看起来还挺高的。但是,从48支球队里面猜32支球队,本身难度就没那么大。一个人即便完全不懂球,在48个名单里面完全随机挑32个名额,准确率也能达到66.6%。
另外,我们突然想到,如果只按照FIFA排名这项数据去给这48支球队排序,选取前32支球队,那么名单就是法国、西班牙、阿根廷、英格兰、葡萄牙、巴西、荷兰、摩洛哥、比利时、德国、克罗地亚、哥伦比亚、塞内加尔、墨西哥、美国、乌拉圭、日本、瑞士、伊朗、奥地利、厄瓜多尔、韩国、澳大利亚、埃及、加拿大、科特迪瓦、卡塔尔、阿尔及利亚、瑞典、突尼斯、捷克、土耳其。
如果拿这份数据去比对最终的32强名单,那么命中率为78.125%,「猜中」了25支,猜错了7支球队。看到这里,估计大家心里都会涌起一股深深的荒诞感:国内顶级AI平台调用300多个Agent,综合多项数据、参考多个因素进行分析,结果预测的准确率和直接拉FIFA排名相差无几。这种感觉充满着一种「一顿操作猛如虎、回头一看原地杵」的无力感。
另外,针对这届世界杯的冠军,Kimi也给出了自己的预测,根据它给出的概率数据,夺冠最有可能的5个球队分别是西班牙、法国、阿根廷、英格兰和德国。Kimi的公众号推文甚至把「德国队或爆冷夺冠」放进了标题里。
截至6月30日,1/16淘汰赛已经进行了四场,以上五个球队中暂时只有德国打完了比赛。然而,德国在与巴拉圭的比赛中1:1战平,最后在点球大战中落败,止步于32强。
AI预测世界杯,为什么容易翻车?
坦率说,无论最终的预测结果如何,对于Kimi敢于大胆运用AI参与世界杯预测、并且公开分析报告的行为,我们是非常佩服和赞赏的。说实话,蹭世界杯热点的AI公司很多,参与赛事竞猜的企业也不少。但是,大部分AI公司都是小打小闹,一般只猜测把握比较大的比赛,猜中了就在社交平台上大张旗鼓地宣传,猜错了就当没事发生。
像Kimi这样在世界杯开赛前直接打明牌、直接给预测数据的AI公司,很难得。Kimi并非不知道预测世界杯容易翻车,但它还是勇敢尝试了,并且愿意承担被打脸的风险。
当然,看到这里,很多人更好奇的是:AI这么强了,为什么预测世界杯仍然不够靠谱?
通过Kimi公布的报告,我们了解到了它的预测机制。Kimi采集了大量底层数据,具体包括近期国家队正式比赛、俱乐部数据、Elo评级(基于历史表现动态更新的实力评分)、市场赔率、历史大赛数据、球员市场价值。针对夺冠概率,Kimi的预估模型则还会考虑26人大名单阵容质量、主帅实力、心理负担、单点故障风险等。

(图源:Kimi)
AI堆砌了海量算力、复杂模型和大量Agent,看似算无遗策,但还是翻车了。在雷科技(ID:leitech)看来,这并不是因为AI不够聪明,而是由足球运动的混沌属性、人类情感的复杂性和数学概率的局限性等因素共同决定的。
首先,足球是一项偶然性极高的运动。在足球场上,一次有争议的判罚、一个折射、一次球员意外滑倒,都可能直接改变比赛结果。AI能预测出控球率、预期进球数等数据,但很难预测到红牌罚下、球员突然受伤等突发事件。而这些意外,很容易引发蝴蝶效应,让AI之前严密的推演全部被推翻。
其次,AI高度依赖底层数据,而球赛中充满着非数据因素。足球运动中,球员的情感状态、人际关系等因素往往发挥着关键作用,比如球员之间是否有矛盾、教练对更衣室的控制力度等等,都会影响比赛,但这些不公开的信息很难被AI捕捉到。
另外,概率和结果很容易出现错位。AI给出的预测是概率,比如一场比赛巴西队赢的概率是80%,那么在一个平行宇宙里,巴西队踢100场完全一样的比赛,赢的次数会接近80场。但在现实中,当20%的小概率事件发生、巴西输球时,人们就会认为AI预测错了。
此外,AI猜比赛存在过拟合风险。Kimi预测世界杯的过程中,引入了300多个Agent和多个维度的变量。换句话说,AI考虑的因素太多了,当它把天气、草皮这类数据都计算进去时,整个预测系统就变得太过复杂和庞大。这种情况下,预测系统会变得非常脆弱,很可能底层数据的一次微小偏差,就被多层Agent无限放大,导致结论走向相反的方向。

(图源:Kimi)
相比之下,传统博彩企业的赔率计算更加简单一些,它主要参考结构化的传统数据,比如历史交锋、进球数、伤停名单、Elo积分等。更重要的是,博彩企业的赔率是动态的,会根据投注比例做调整。而且,博彩企业的盈利模式不光是对赌,还包括抽成等模式。因此,博彩企业有一整套成熟的系统让自己稳赚不赔。
用AI来预测比赛,并非无意义
Kimi对世界杯的预测,看起来有点翻车,但AI参与的这场大型试验,很有意义。我们认为,它是一次验证多Agent在复杂真实世界任务中可用性的积极尝试。过去一两年,AI的竞争焦点从大模型转移到了Agent上,人们更关注AI如何解决现实问题。并且,大家使用AI的方式逐渐从用单一Agent解决单一问题过渡到尝试用多个Agent解决复杂的难题。
世界杯预测就是一个很好的公开试验,它极度复杂、信息繁杂但又不完全、充满博弈因素。如果多个Agent组成的系统能在这种复杂的现实场景中展现出比人类更强的分析能力和判断能力,那么会极大地提升大家对Agent工作流的信心。实际上,Kimi的AI预测世界杯项目,已经证明,当下AI具备了深度的数据挖掘和决策辅助能力。

(图源:Kimi)
既然今天AI可以用来分析48支球队、104场比赛的胜率,那么明天这套多Agent预测系统就可以迁移到企业的商业决策框架中。比如说,现在存储芯片价格暴涨,导致手机成本压力倍增,如果通过类似的系统将存储、手机、芯片等行业以及各大品牌的详细数据进行挖掘和分析,是不是就能预估不同手机品牌定价策略和出货量情况。
另外,我们认为,在很多重大的商业决策中,AI更关键的能力是通过数据挖掘提供信息,而非替人类做决定。就像Kimi公布的这份报告,针对每支球队,它都提供了大量梳理好的数据,这些数据要怎么用、不同维度数据的权重要怎么分配,其实还是看决策人自己。
所以,AI的作用并非预知未来,而是更大程度地消灭信息差,将可量化的概率量化,尽量降低决策者因为信息盲区而出现误判。只要能做到这点,AI对于各行各业、对于大部分普通人,就会有意义。
美加墨世界杯的比赛还在继续,爆冷、惊喜、失落的各种故事每场比赛都在上演,未知和不确定性恰好就是足球比赛的魅力。就这个角度而言,AI猜不中比赛,对我们来说并不是坏事。

雷科技





































