(一百四十二)高阶数据的发展
归途的航班上,远飞半遮半掩地向诸人讲述了杰森。巴斯的邀请。大家听了群情激昂,纷纷咒骂起巴斯来。
“这个杰森居然要勾结小老板,搅乱联盟的公平环境,真是罪无可赦!”波什愤愤不平。
“可是,巴斯家族人才济济,他真的这么有把握能继承湖人队吗?”比卢普斯想得比较远,他考虑问题的角度就独特了一些。
“别人自己家的事情,湖人谁来继承,我们就不要操心了。”远飞笑道:“不管如何,我们现在才是卫冕冠军,湖人只是季后赛圈外球队。应该担心的是他们而不是我们。”
“杰森这话说得真是自大,可我喜欢。”姚明也笑了起来。
“这家伙还是科比。布莱恩特的铁粉,他觉得布莱恩特比我強?有趣。”麦迪也笑了,巴斯的话挑起了他的斗志。
“巴斯觉得布莱恩特会成为乔丹那样的人物,围绕他去建队还能打造出王朝。当然了,我不这样想,我们火箭可不答应啊。”远飞在这种时候当然要给予麦迪以支持。
“杰森,你觉得怎么比较布莱恩特、特雷西或者艾弗森这样的超级巨星?”波什突然问道。
“唔,这个问题说起来可就广泛了。如果说谈历史地位肯定是先考量荣誉了,特雷西这种一年就包揽了mvp,总冠军和fmvp的大満贯巨星肯定是会大大加分。毕竟乔丹以后能做到这件事的只有他和奥尼尔邓肯了,而那两位都是能冲击历史前十位置的。如果特雷西今天突然宣布役退,我想他差不多也能排到历史前四十吧。”远飞想了想回答道。
“不不,我想问的是,数据能体现球员在球场上的价值吗?总不能说谁得分多谁就厉害吧?”波什补充道。
“噢,那你得先知道数据做什么的。理想的数据是能体现一切球场上发生的行为。可受限于统计能力和分析能力,当前的数据显然不是万能的,有很多无法进行具体统计的数据。但好在对于篮球的数据分析仍在不断发展进步,总会有一些更好的统计标准不断涌现出来。”远飞道:“之前写过很多球评的那个约翰。霍林格刚刚发明了一项进阶数据the。(简称为per,通常翻译为效率值),这项统计就能比较好的表现出一名球员的综合实力。”
“什么是进阶数据?什么又是per呢?”波什一脸懵逼了。
“进阶数据()就是在基础数据的基础上整合出的一些数据。像上次我给你们讲过的篮板率就是在篮板球数量基础上演化出的进阶数据,它比篮板球数量能更好地体现球员抢篮板的能力。”远飞讲起篮球理论又滔滔不绝了“而效率值是用来反映球员和这个年代的平均实力比是什么样的。这项统计的计算方法非常复杂我就不细说了,反正包括了得分、助攻、进攻篮板、防守篮板、抢断等正面数据,也包括了打铁、失误等负面数据,最后把这些统一成为一个值。而联盟的平均值是15,也就是说⾼于15的就是不错的球员,⾼于20的就算球星了,⾼于25差不多就是超级球星了。”
“这个东西不错,简单易懂啊。那咱们队的人谁排在前面呢?应该是特雷西吧?”波什问道:“布莱恩特、艾弗森又有多少?他们仨谁⾼一些呢?”
“机飞上不能上网啊…这样等回去我查询一下统计再告诉你。”远飞尴尬地说:“另一项不错的统计叫做胜利贡献值(win。shares,简称为ws),这项数据同样是将各种基础数据运算后,最终将每个人对球队赢球的贡献大致模拟成一个数,比如说我们现在是49胜,咱们队球员的ws相加就在49上下。假如说姚的ws是10,也就是说如果姚一场不打,我们大概就是39胜的水平。”
“那这可⿇烦了,39胜连季后赛都很难进去了。”波什皱起了眉头。
“当然不能完全这么算。因为姚一直在场,并且有球权,所以打出了很好的数据。假如姚不能打,大普顶上首发。因为大普的进攻技术没有姚那么好,即使你的出场时间不变,但你会获得更多的球权,也会导致你的per和ws变得更好。”远飞分析道:“效率值和胜利贡献值当然不是完美的,它们是在特定战术环境下做出的统计。当然它们比起以前的基础数据统计已经是迈进了一大步了。”
“原来是这样,这些进阶数据也不是特别好用。”波什似乎有些失望“那它们有什么明显的缺点呢?”
“先说说效率值吧,最大的⽑病是它和球权,尤其是出手权关联太大了。在计算公式中它对于打铁的惩罚比较轻而对于出手投中球的加成很⾼,这导致一些投篮能力一般但出手很多的球员在这项统计中占有优势,而投篮很准但出手比较少的球员则占据劣势。也就是说,这玩意还是比较适合那些所谓的数据刷子,能力一般拿球就投的那种球员。”远飞道:“另一个主要的缺点是效率值不能体现防守能力,有一些防守很棒但投篮很少的角⾊球员,per不仅达不到平均值15,甚至会跌到10以下。但其实他们都是联盟中非常优秀的人才。”
“唔…这样啊。”
“小的⽑病更多了,比如说助攻的加成比例是2/3,我是不知道为什么助攻就定为2/3。一次糟糕的传球由于接球人技术好勉強投进了,和一次妙传导致接球人轻松扣篮,两者在加成上是一样的,这就是当前数据分析的瓶颈了,没办法具体量化一个进球中多个人的贡献。”远飞继续讲道:“再比如说盖帽后的贡献比例要乘以后场篮板率,这个想法是好的,但不够客观。盖帽后也不是每个球都形成篮板球了,比如说你一次盖帽对手出界,虽然球权还是对方的,但进攻时间所剩无几,其实就是相当于防下来了。所以效率值对盖帽统计的认可度有点低。”
“不行了,我已经听糊涂了。”波什道:“ws能不能简单一点?”
“抱歉,胜利贡献值的算法比效率值还复杂,它起源是从棒球界的数据专家比尔。詹姆斯的算法中升级来的。ws的主要缺点是有几个计算环节是通过球队的整体数据去算的,这样不能很好地考虑到主力和替补的区分。毕竟带着好的队友和较差的队友是不同的。相对而言,在強队打首发且非常健康的球星计算ws是比较有利的。”
“好吧,我彻底放弃跟着你学数据分析了…这玩意越研究越难啊。”波什苦着脸道。
“对于你来说,学会用就行了。没必要深入研究这个数据是怎么来的,算法是什么样的。能查到就行啊。”远飞想了想道:“其实我主张球员要学一点数据,这样便于针对自⾝条件进行提⾼。人的精力是有限的,把有限的精力投入到更有效的训练项目上。”
波什眼前一亮“好的!”(未完待续。)