迈克尔·刘易斯的《点球成金》中有个有趣又有启发性的小故事,却鲜为人知——因为故事里没有比利·比恩,自然也就没被布拉德·皮特搬上大银幕。
20世纪70年代末80年代初,休斯顿太空人队委托开展了一项研究,探讨若将外场围栏向本垒移近,球队表现可能会受到何种影响。他们想移近围栏,是认为这样能增加本垒打数量;而球迷喜欢本垒打,球队就能卖出更多门票。但研究作者却发现,鉴于休斯顿队阵容中的击球手和投手类型,移近围栏实际上会导致球队输球更多。
于是,休斯顿的决策者看了数据,然后决定……下令永远不公开这项研究。他们早已决定移近围栏,只想用数据来佐证这个选择。
一位在足球行业工作超过十年的人士也给我讲过一个类似的故事。某职业足球俱乐部委托他为三名球员撰写球探报告。他对每位球员都做了详细分析,结论却如出一辙:这三名球员都不应该签下。俱乐部的回应是问他能否为每位球员出具正面的球探报告——他们早已决定签下这三个人。
这两个故事里,机构都想利用数据,却不是为了做出更优决策,而是为了给早已定好的决策找理由。
如今,这些故事听起来或许像来自更简单的年代。几乎每支棒球队都在用远比公众能接触到的更先进的分析模型运营。足球数据现在也随处可见:亚马逊为德甲转播提供技术支持,“预期进球”几乎成了所有英语解说员的常用词汇。
然而,虽然棒球队大多已不再用数据来重申和佐证自身根深蒂固的偏见,但足球俱乐部却仍未摆脱这一困境,甚至还差得远。不信?你只需看看那支据报道曾考虑告诉自家球迷“已重新定义现代足球俱乐部”的球队。
换句话说,你只需看看热刺。
足球数据分析运动的核心洞见,或许是每个人早已心知肚明的事实:最好的球队并非总能赢球。
这本质上就是预期进球(xG)告诉我们的。在赛季的几乎任何阶段,一支球队的预期进球差,都比射门次数、进球数或积分等其他顶级数据更能预测其未来表现。如果最好的球队总能赢球,那么过去的胜场就能直接告诉我们谁是最佳球队,而这些胜场也能预测未来。
相反,事实似乎是:最佳球队是那些在比赛中获得更高比例预期进球的队伍。如果把这个概念从“为每场比赛的每次射门赋予特定转化率的实时更新算法”这种抽象表述简化一下,那么最佳球队其实就是那些比对手创造出更好机会的队伍。
任何长期踢球或看球的人,其实都在内心深处明白这一点——无论他们是否愿意承认。但承认这一点,就意味着我们接受足球比赛结果存在大量随机性:用形状并不规则的脚去踢一颗弹跳的球,还要把球送过场上唯一能用手的人(门将),这本身就充满了不确定性。
英超赛季不算长,每个赛季约有20支球队各自进行“实验”。那么十年下来,就有200个这样的“小实验”。在这200个赛季里,我们理应能看到几例随机性一整个赛季都在助推或惩罚某支球队的情况。
现实也确实如此。以下是2010年以来每个英超赛季,按球队实际表现与预期进球差的偏差程度排列:
最靠右的那个点是2016-17赛季的热刺。如果让你选一个最靠左的点,2025-26赛季的热刺似乎是个不错的选择,对吧?作为全球市值前十的球队之一,却在赛季还剩六场时陷入保级战,这肯定得有“历史性坏运气”的因素吧?
不。最靠左的是2023-24赛季的谢菲尔德联。
本赛季,热刺根本不算 outliers。他们的实际进球差(+11)甚至比预期进球差(+15.13)略好一点,差距不大。
那么,一支拥有据估计是全球第九昂贵阵容的球队,怎么就成了英超最差球队之一?一种可能是:他们只衡量自己认为重要的东西,却忽略了真正重要的东西。
通常来说,足球是复杂的动态运动,球员个人能力很难从阵容构建、教练战术和场上互动的相互依存中剥离出来。但有时会遇到热刺这样的球队,问题诊断起来相当简单:他们不会传球。
在Gradient Sports,有一组人观看每一场英超比赛,并对球员的每一次传球按-2到+2的 scale 评分。他们是这样描述评分过程的:
例如,一名中后卫在中场线传球。一次常规、无压力且传给空位队友的传球会得到0分,因为这达到了我们专业评分团队的预期。一次在压力下精准的、打破防线的传球会得到正分。相反,一次力度不足的传球——即便成功传到队友脚下——如果低于预期标准,也会得到负分。这体现了我们关注的是评估表现,而非仅仅看结果。
评分过程由详细框架指导,旨在最大限度减少主观性并确保一致性。原始评分收集后,会经过多层质量控制,包括资深人员对标记动作的复核、一致性检查、持续分析以及专门的质量保证流程。
基于这种传球评估方法,以下是热刺本赛季五名最佳传球手在英超的排名:
1. 罗梅罗:第19位
2. 范德芬:第87位
3. 乌多吉:第152位
4. 丹索:第167位
5. 库杜斯:第186位
传球是这项运动的基本技能。英超球队平均每场尝试450次传球。没有其他任何动作能与之相比:一场比赛中,平均每支球队尝试8次射门、18次传中、18次过人、16次铲球和8次拦截。如果不会传球,其他一切都无从谈起。传球是足球运动的核心动力,赋予其他所有动作意义。
那么,作为全球最富有的球队之一——一支号称是现代足球俱乐部典范的球队——怎么会组建出一支在本联赛中只有两名球员跻身传球榜前150名的队伍?
过去几年,足球界出现了一批新数据。这些数据不量化那些决定胜负的因素,而是量化球探和教练似乎一直看重的东西:谁身材高大?谁速度快?谁看起来很厉害?谁要是能学会踢球就不可阻挡?
像Gradient和SkillCorner这样的公司,现在提供一系列身体指标数据,显示球员的跑动频率——有球和无球时、最高速度下、高速状态下等等。我并不指责这些公司做这些事;这些数据集的存在是有价值的。足球数据从一开始就缺失的一点,是能告诉我们球员无球状态下在做什么的信息。普通球员每场比赛控球时间最多只有几分钟,而大多数足球数据只量化这一小段时间。这远不能说明一切,但确实说明了最重要的一些事。
如果使用得当,这些无球和身体数据会非常强大。如果你运营一支球队,能将这些身体指标与决定胜负和进球的因素结合起来,就能形成对球员价值更全面的新理解,从而比那些只靠传球和射门数据评估表现的对手更具优势。但这很难做到,正因为难,所以实际上并未实现。
相反,正如一位曾与多家欧冠俱乐部合作的消息人士对我说的那样,这些身体指标让俱乐部得以确认自己的偏见——这种偏见正是《点球成金》问世以来,球探与数据派之争中一直存在的。只不过现在,我们有了新的数据来证明球探是对的。
还能怎么解释热刺的情况呢?
热刺的阵容里全是能跑的爆发力型运动员。Gradient根据耐力、爆发力和速度(并根据位置和体型调整)综合得出“运动能力”评分, scale 为1-100。热刺有七名球员评分达到90或以上,其中五人——奥多贝尔、贝里瓦尔、格雷、索兰克、加拉格尔——是在2023年10月约翰·兰格担任俱乐部技术总监后签下的。前四人是兰格上任后第一个夏窗签下的四名非门将球员。
只有当你系统性地关注另一套球员属性,从而形成制度性盲点时,才会组建出一支不会传球的阵容。罗梅罗是热刺迄今为止最好的传球手,他是2021年签下的;麦迪逊是另一位出色的传球手,但本赛季一直受伤,他是2023年夏窗签下的。这更凸显了俱乐部对真正重要的东西的忽视。
《点球成金》里有个令人印象深刻的故事:比利·比恩和球探们争论,后者总在纠结球员的臀部有多大、长什么样、女朋友漂不漂亮。比恩反复追问:“但他能击球吗?”最后他勃然大怒,对房间里所有人喊道:“我再说一遍:我们不是在卖牛仔裤。”
有人提出,让懂数据的人在俱乐部里真正拥有话语权是有价值的,因为他们会通过提醒你“抓住核心”来阻止你做很多蠢事。“但他能击球吗?”然而在热刺,似乎一套新数据让俱乐部误以为自己真的在“卖牛仔裤”。他们真正需要的——也是能让他们避免降级的——是有人不断问一个简单的问题:
但他会传球吗?
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.