开篇指出两件事:
1,这不是替武磊说话,武磊的表现的确不够好;但是,“不够好”不等于像whoscored所反映的那么差。“不够好”和“很优秀”是两回事,请不要等同理解。
2, 就我所知,whoscored的评分,确实是目前唯一利用机算做出的数据评分系统,然而,这并不是因为其他数据库没能力这么做,恰恰相反,这是一个极为浩大的工程,各家数据库所明白的一点是:目前没人有能力做出一个完善的数据评分系统。而面对这种情况,最好的选择是“我可以不用”。
还是那句话,用一个数据的前提条件,是知道这个数据是怎么回事,优缺点都在哪里。
本轮西甲,西班牙人2-1战胜阿拉维斯,武磊再次——是的,再次——成为了whoscored评分中的全队最低分。
对比初来乍到时的风光无限,现如今武磊的风评逐步走低,而民间舆论最核心的依据之一,就是这个whoscored的评分。
事实上,随着现在足球数据逐步更受重视,完全免费而又赛事覆盖极广的whoscored,已经成为很多足球app与自媒体的主要数据工具。
然而另一方面,对武磊的评分却又引起了巨大争议,甚至这套之前评价过无数球员的系统,在中国大陆引发的争议从来没有这么大过。
反对者认为:武磊踢球靠的是脑子,这是whoscored永远无法评价的,甚至数据这套东西,就是分析比赛的干扰项。
针对这个现象,我们要问两个问题:
一 whoscored的评分到底靠不靠谱?
要回答这个问题,我们先要明白:whoscored的评分机制究竟是什么。
当然,whoscored的网站并没有公布具体算法,但网站给出了一个大致的解释:该系统依据的是超过200项原始数据,用一个比较复杂的算法进行计算,在6分的起评分基础上,或加或减,得出一个最终的分数。
熟悉whoscored的同学肯定知道:全部数据,都是围绕着“球”在运转,且进攻数据远多于防守;因此,这套评分系统存在一个重大隐患:天然对球权多的球队和球员,存在严重倾斜。
比如whoscored网站自身给出过一个例子:假设某球员在前场过人成功,那么就是加分项。
然而,足球是一个22个人踢1个球的游戏,一人持球时,其他人都是比赛内容的一部分,都在执行着教练的布置。
你只盯着球看,实际上是同教练的战术布置完全脱节的。
甚至我们可以先不论防守,只看个人持球戏份更重的进攻,无球跑动的意义一点不比持球技术更差,有时候甚至意义更大。
这里我先放一个动图,大家看看转播方意在说明什么:
很显然,转播方给出了传球路径,武磊的跑位路线,其用意并不是强调武磊的射门,而是在说他的这次无球告诉前插跑位。
然而这个动图如果用目前的数据记录来表示是什么呢?
达德尔向前送出传球(传球类型:progressive pass; smart pass);武磊射门,而由于这脚传球直接导致武磊射门,所以记作达德尔的一次“key pass”(不同的数据网站,key pass的定义是不同的,这里描述的是whoscored的key pass含义)。
数据上看,这次进攻谁收获的好评最多?显然是达德尔。
这其中Progressive Pass指的是向前超过一定距离的传球(对后场、中场和前场的传球标准不同);而smart pass则是“穿过防守人的传球”,我们通常理解的“直塞球”,就是smart pass的一种。这两点都是目前衡量传球威胁性的重要指标。
武磊呢?他收获的只是1次射门,0次射正,0次射正是什么概念?这意味着你的射门虽然质量不低,虽然很有威胁,但在数据统计上和一脚闷到角旗区没有任何区别……
然而,如果没有武磊的这次跑位,达德尔的传球能出的来吗?
事实上,如果按照whoscored的数据统计系统,达德尔的收获也远远没有上面描述的那么多。因为whoscored没有progressive pass和smart pass两项统计……达德尔的最大收获,是一脚key pass。
whoscored的Key Pass是什么意思?导致射门的最后一传,换言之,武磊不射,达德尔这脚key pass也会变成普通传球。
看到这里诸位应该就发现问题了:这分明是一次队友协同完成,彼此之间功劳不相上下的进攻,何以最后达德尔和武磊收获的正面数据积累差距如此之大?
根源在于,数据统计一直在盯着球看,持球者对球的每一次处理都会被记录在案,而引领皮球移动方向的无球跑动,则会被忽略。
我们再来看西班牙人对阵巴伦西亚时的镜头,这场比赛武磊在whoscored的评分是倒数第一,也就是这场比赛,第一次导致了网络上whoscored评分与“武脑吹”之争:
门前抢点的那个就是武磊。这是不是好机会呢?是的。武磊收获了什么?如果按照whoscored的标准,答案是,区区一次触球而已。
顺便再问一个问题:这脚传中如何?其实非常不错;但数据记录的是什么呢?罗塞雷斯传中1次,准确传中0次,因为武磊控球失败了。
你们说这样的数据记录客观真实吗?显然不。
武磊绕前点的跑动非常好,没有记录;罗塞雷斯的传中很有威胁,但因为武磊没碰到球,被归入了“传向看台”的那一档。
也就是说,whoscored这套数据评分系统,完全就是一个基于不全面的有球数据统计,极度倾向于持球更多一方的评分体系。且不说每项技术统计之间的系数权重,就其现有的统计范畴,甚至连其它数据网站已有的统计细节都没做到,还谈什么评分?
注意,这可不是单纯为武磊说话,像他这一类持球较少的球员,在这个系统中相当吃亏——C罗不要说和梅西比,就连内马尔都呈现出对他的碾压态势。
为何?像下面这种情况,C罗一场比赛要跑多少次?但他捞到了什么数据吗?并没有。
如果C罗抢前点,曼朱基奇就可能会陷入1V3的局面中
而且,受影响的可不止是球员,whoscored这种过度倾向于持球者的打分系统,在评价球队表现的时候,出现的问题甚至更为夸张——那些控球率低、靠防守立足的球队,在这套系统里简直就是“受歧视”的存在。
以本赛季为例,西甲第4赫塔菲打到现在只丢27球,失球数之少高居联赛前三,相反,其控球率和传球成功率却是整个西甲最差的,射门数相应最少,进球数也只是联赛末段,说白了能竞争欧冠资格全靠防守。
但你能说防守不如进攻价值大么?结果whoscored的评分硬生生给人弄到西甲第12……
再比如意甲,尤文到目前已经领先第二名17分,但7.01的评分却根本和那不勒斯没有档次差距,为何?那不勒斯的踢法更强调控球和进攻,积累的正面基础数据更多。
其实这种现象,最夸张的是瓜式巴萨如日中天的几年:巴塞罗那凭借恐怖的控球率在whoscored的评分系统中,简直是霸榜。
2011-12赛季,穆里尼奥的皇马靠着一手防守反击百分夺冠,结果评分第一却是亚军巴萨。要知道皇马的射门数和进球数都要更多,失球也仅仅比巴萨多出3个而已。之所以造成这种情况,完全是巴萨的高传球次数导致的。
也就是说,至少这次,决定评分的是风格,而非表现。
这些传递会收获无数的“成功传球”数据积累
这种反击,如果没有形成射门,那么收获的就是两脚传球和一脚失败的传中而已
熟悉我之前文章的朋友们可能也知道,我也会用whoscored的数据统计,然后自己做一些简单的二次计算,但唯独对媒体应用最广的“评分”,我一次都没用过……
这其实是数据应用的一个基本原则:数据当然有用,但为了避免滥用,你一定要先搞明白,这个数据是干嘛的,至少要明白它的基本逻辑是什么。
二 数据到底能不能客观真实的评价武磊?
言简意赅的给出答案吧:
不能,且永远不能;但是,数据统计的愈发详细,和数据分析方法论的进步,将会让数据对武磊,对每一个球员和球队的反映,越来越趋近于客观真实。
如果你觉得这个答案有些太笼统,太“原则化”,那么我换一个说法:
即便在足球数据统计不健全、系统的数据分析方法论尚不存在的今天,用比whoscored更趋近客观真实的方法,来通过数据评价武磊,仍旧是可行的;并且,想要进一步推动这个数据统计,其实并不难。
这里贴两张比赛当中非常常见的动图,大家可以体会一下,很多球队都普遍奉行的战术,到底是什么样的。
这里要说明的一点是:下面两张图,按照whoscored的数据记录,对武磊而言是十分不利的,因为这是“不成功的触球”,是减分项。
西班牙人斜吊入禁区,武磊停球被破坏
同样的情况,武磊禁区内接斜传,停球被破坏
可能有不少朋友会觉得这个打法特别没意思,就是简单的45°传中,属于“没有办法的办法”。
但这里请诸位把集锦里那些精彩配合过滤掉,想想看这样的斜线吊球,和那些妙到巅毫的手术刀传球,到底哪一个才是比赛中最经常出现的内容?毫无疑问是前者。
这种斜吊是不是毫无意义呢?显然不是,我们假定武磊控制住了皮球,是不是身后插上的队友就有接应打门的机会?是不是皮球就运行到了一个让防守方非常难处理的区域?
当然,我不是要给武磊停球时对抗吃亏这个缺点洗白,我只是想说:这样的战术其实是构成一支球队进攻套路的最基本元素之一。你可以说它最终没打成,是武磊对抗差导致的。
但这里我请问一点:如果武磊没有向禁区内的跑位,是不是队友连球都传不成?那么,为什么我们一定要根据最终结果来给武磊减分,而忽视他之前的跑位呢?难道跑入禁区不是比赛内容的一部分?
你一定以为我还是在强调,whoscored的数据评分是有漏洞的。
其实,我想说的是:有一个很简单的统计,是会把武磊的这次表现列为加分项的——至少是必须要统计到的“进攻环节”——禁区内触球。
这其实是这两次进攻中战术目的的精髓所在:你制造了这些禁区内触球,才有可能谈得上后续的对对方球门的威胁。
武磊的禁区内触球什么水平?每90分钟3.8次,西班牙人队内毫无争议的第一!并且在本轮之前,他是西班牙人唯一一个禁区内触球进入西甲前30的球员。
当然,事实上这个数据仍旧不甚完善,因为武磊这样的踢法,有时候会造成下面这种情况:
武磊没碰到球,但干扰了门将
你说上面这球,武磊有没有功劳?太有了,他插前点的选择其实是最有威胁的,无论是从效果上,还是从战术理论上看,武磊在这次进攻中都扮演了不可或缺的作用。
但他收获了什么技术统计吗?并没有。
但是不是数据层面永远无法解决这个问题呢?也不一定——
我们只需要引入一个“跑入禁区”,或者“禁区内球门方向移动”的统计就行了。当然,这个数据可能存在漏洞,但样本足够大、差距足够大的话,仍旧能够说明很多问题。
事实上做到这点并不难,因为目前是有“向前移动”的数据统计的,只不过统计的是持球的移动,wyscout将之称为“progressive run”。而反映无球状态的数据,才是opta这些基础数据供应商下一步的努力目标。
而且这里必须要指出一点:数据的作用不仅仅是反映出“谁好谁不好”,它首先表现的是一个球员的风格。
比如倘若有“禁区内向球门方向移动”这个统计,我们就可以量化一些我们每天都在吹跑位的球员,其跑位风格究竟是什么样的。这里贴一个图:
注意C罗在进球前的跑位
C罗在进球之前做了什么?其实就是一件事——直插禁区。这件事看似简单,但实际上能做到的人并不多,否则……皇马也不用琢磨着卖贝尔了……
为什么要放这个图?因为如果引入“禁区内向球门方向移动”这个统计,完全可以把C罗的这次进球描述的更全面;为什么要描述C罗的跑位?看看下面这张图就知道了:
武磊也是一样的跑位目标,区别只是在于没碰球
这是本轮西班牙人的第二个进球,武磊没有捞到任何数据,但他做的其实和C罗之前做的完全一样——就是直插禁区,奔着球门去。
我当然不是说武磊和C罗一个级别,但这里要强调的是:两个人在某种意义上,在风格上具备一定的重合度。那么,加入我们引入一个“禁区内向球门方向移动”的数据统计,是不是能更好的量化这一类型风格的球员呢?
数据没能客观反映武磊的价值,不是数据本身的问题,而是数据统计需要一个进步过程。
事实上在这方面,数据甚至具有一定的先验意义。
早在武磊确定加盟西甲之时,我就多次在新闻回复中提到:西班牙人是一支踢法极度追求冒险的球队,他们的Progressive pass和smart pass占传球总数的比重极高,有点“西甲利物浦”的味道,然而禁区内触球频率却很少。
而武磊在中超的数据则表明,他恰恰最善此道。不考虑水平差距的话,二者的结合对彼此而言都是最佳选择——所以,数据进阶性越强,就越能帮助我们。
结语: 我们当然不能迷信数据,但“武脑吹”,真的合适吗?
再次直接给出答案吧:无论whoscored的评分有多么不靠谱,现阶段的“武脑吹”,即便在战术读场层面,也有些过分了。
最主要的表现有两点:一是对足球场上每天都在发生的事大书特书,然而这些内容不是武磊再做,是所有人只要上场都会做。比如下面这张图,被说成是“武磊深知收回拳头再打人”的道理,没有一味求快,而是选择回传:
武磊回传
武磊做的对不对?当然对。
但这是一个相当常见的选择,仅以西班牙人为例,这赛季西甲他们场均回传56.81次,从中找出一些前锋不急于进攻的镜头一点不难,比如这次伊格莱西亚斯的回传:
伊格莱西亚斯回传
第二个问题则是赋予一些明明目的非常明确、单纯的跑位以某种特殊色彩,使之看上去像是日本动漫里的“技能”。比如下面这张图:
传说中武磊的“蛇形跑位”……
这是让“武脑吹”达到最巅峰的一球,跑位路线被称之为“蛇形跑位”……
然而,这个跑动的意义其实就是简单的两点:1,从边路到中路,在更靠近对手球门的位置接球;
2,为了避免越位,先往回跑一点,压住倒数第二名防守球员。
换言之,如果武磊第一时间没有越位,或者他人就在中路,那他根本就不需要跑出来这么一个“蛇形”……
武磊的跑位是很好,但非要冠之以这么个称谓,是不是有点强行拔高的意思?
归根结底,武磊所做的并不高大上,他只是在按照足球场上非常简单而又质朴的道理,尽力体现自身的战术价值而已。
而早晚有一天,数据能够体现出这些价值,那不仅是武磊的福音,也是所有这一类球员——如C罗、因扎吉、小豌豆等等这些人的福音。
(文:唯心)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.