||
数据采集小作业-(8)采集NBA常规赛历史数据 预测2019季后赛总冠军所在联盟
作者:黄晨玮
指导教师:王文武
单位:曲阜师范大学 统计学院
NBA是由北美三十支队伍组成的男子职业篮球联盟,30支球队分为东部联盟和西部联盟,每个联盟又被划分为3个赛区,每个赛区由5支球队组成。季后赛已经开打,马上,NBA总决赛将如火如荼展开。因为2019年季后赛的参赛资格是根据2018-19中82场常规赛的成绩,而角逐出来的十六支队伍;那么最后由哪个联盟的哪支队伍取得了NBA总决赛的冠军,是有一定的“先验水平”。所以我们爬取了NBA官网公布的2018-19常规赛成绩,综合考察每支队伍的成绩,再根据NBA季后赛的规则预判最后总决赛的总冠军属于哪一个联盟。
我们在r语言中使用readHTMLTable函数来爬取表格数据。经过清洗之后的数据我们不仅将球队所在赛区单独成列并作为V13变量,还将六个表格进行了无缝连接,使得数据可读性更强。我们对每个赛区中五个队伍的胜率进行累计求和,为了更好地区分累计胜率的差别,我们将各赛区的累计胜率统一减去数值2,并画出散点图。我们得到第五个赛区即太平洋赛区的累计胜率最高,其次是大西洋赛区;西南赛区累计胜率最低,而中部赛区、西北赛区和西南赛区水平相当且胜率低迷。
最后我们又进一步统计了东、西两个联盟的累计胜率。东部联盟的累计胜率为1.171,西部联盟的累计胜率为1.828.所以综合来看,西部联盟整体水平要比东部联盟高,且夺得季后赛最后总冠军几率更大!
具体研究见附件。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-27 09:53
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社