|||
数据采集大作业-(3)对NBA赛事的数据挖掘及分析
作者:贺 真、黄晨玮
指导教师:王文武
单位:曲阜师范大学 统计学院
本文先对腾讯网站NBA评论新闻的题目进行文本抓取并对其进行简单的文本分析。首先,从词云图中可以看到截至2019年5月26日,大众对于2018-2019NBA季后赛最感兴趣的是勇士和火箭两支队的赛事;其次,针对性的对本赛季勇士和火箭的最后一场的比赛数据进行了爬取,通过因子得分计算两支队伍球员的综合得分,并得到评估一个球员的综合素质主要从球员活跃度、球员得分效率、进攻能力、防守能力和反映能力这五个方面入手;通过最长距离法、类平均法以及k均值动态聚类法我们对球员进行了聚类分析,并采用雷达图验证了其中被划分的一个组中的球员确实能力相当;最后,我们对球员司职与薪资的关系进行了探索,发现在西部赛区后卫的工资普遍高于前锋和中锋,这说明司职是影响工资高低的一个因素。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 06:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社