NBA运动员球员数据分析

作者:24直播网2024-05-22 08:02:30

火凤直播高清直播美女解说
  当前,篮球运动是最受欢迎的运动之一。在此万受瞩目的运动下,我打算针对篮球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容: 哪些球员从2014年到2019年近6年连续在榜?对比各球员在2019年的各项数据如何?詹姆斯-哈登随年份数据如何变化?2019年球员数据分布如何?篮球运动员的失误与上场时长有什么联系?球员的各项数据之间的相关性如何?哪些数据会对球员的得分有什么影响?   数据分析是指用适当的方法与工具,对收集来的大量数据进行分析,提取其中有意义的信息,从而形成有价值的结论的过程。   在进行数据分析之前,需要清楚数据分析的基本流程。 明确需求与目的 分析篮球运动员,得出结论 数据收集 爬取新浪体育网站数据 数据预处理 特征筛选 降维 数据清洗 缺失值异常值重复值 数据分析 数据建模数据可视化 编写报告总结 导入相关库   需要爬取的数据 爬虫思路分析: 1.需求获取新浪体育网站的球员信息2.寻找网址(球员的不同赛季的信息在展示html页面找不到) 可判断该信息是一个Ajax请求通过浏览器抓包,和多次尝试在Postman软件上发送request请求寻得球员分页信息的request发送相应url的规律,并循环遍历 3.获取request返回的内容4.使用正则表达式对request返回信息进行筛选5.将筛选的数据以csv格式储存在本地文件中   3 rows × 29 columns 特征筛选 数据集中的列,并非都是我们分析所需要的可以有选择性的进行加载,只加载我们需要的信息列   3 rows × 23 columns 数据清洗 缺失值处理 通过info查看数据信息。可以通过isnull与sum结合,查看缺失值情况。   ==2014年=   rank 0   player_name 0   team_name 0   score 0   minutes 0   field_goals_made 0   field_goals_att 0   field_goals_pct 0   three_points_made 0   three_points_att 0   three_points_pct 0   free_throws_made 0   free_throws_att 0   free_throws_pct 0   offensive_rebounds 0   defensive_rebounds 0   rebounds 0   assists 0   turnovers 0   assists_turnover_ratio 0   steals 0   blocks 0   personal_fouls 0   dtype: int64   2015年   rank 0   player_name 0   team_name 0   score 0   minutes 0   field_goals_made 0   field_goals_att 0   field_goals_pct 0   three_points_made 0   three_points_att 0   three_points_pct 0   free_throws_made 0   free_throws_att 0   free_throws_pct 0   offensive_rebounds 0   defensive_rebounds 0   rebounds 0   assists 0   turnovers 0   assists_turnover_ratio 0   steals 0   blocks 0   personal_fouls 0   dtype: int64   2016年   rank 0   player_name 0   team_name 0   score 0   minutes 0   field_goals_made 0   field_goals_att 0   field_goals_pct 0   three_points_made 0   three_points_att 0   three_points_pct 0   free_throws_made 0   free_throws_att 0   free_throws_pct 0   offensive_rebounds 0   defensive_rebounds 0   rebounds 0   assists 0   turnovers 0   assists_turnover_ratio 0   steals 0   blocks 0   personal_fouls 0   dtype: int64   2017年   rank 0   player_name 0   team_name 0   score 0   minutes 0   field_goals_made 0   field_goals_att 0   field_goals_pct 0   three_points_made 0   three_points_att 0   three_points_pct 0   free_throws_made 0   free_throws_att 0   free_throws_pct 0   offensive_rebounds 0   defensive_rebounds 0   rebounds 0   assists 0   turnovers 0   assists_turnover_ratio 0   steals 0   blocks 0   personal_fouls 0   dtype: int64   2018年   rank 0   player_name 0   team_name 0   score 0   minutes 0   field_goals_made 0   field_goals_att 0   field_goals_pct 0   three_points_made 0   three_points_att 0   three_points_pct 0   free_throws_made 0   free_throws_att 0   free_throws_pct 0   offensive_rebounds 0   defensive_rebounds 0   rebounds 0   assists 0   turnovers 0   assists_turnover_ratio 0   steals 0   blocks 0   personal_fouls 0   dtype: int64   异常值处理 通过describe查看数值信息。可配合箱线图辅助。异常值可以删除,视为缺失值,或者不处理。   8 rows × 21 columns   {‘SCR’: ‘score’, ‘MIE’: ‘minutes’, ‘FID’: ‘field_goals_made’, ‘FIT’: ‘field_goals_att’, ‘FIC’: ‘field_goals_pct’, ‘THD’: ‘three_points_made’, ‘THT’: ‘three_points_att’, ‘THC’: ‘three_points_pct’, ‘FRD’: ‘free_throws_made’, ‘FRT’: ‘free_throws_att’, ‘FRC’: ‘free_throws_pct’, ‘OFD’: ‘offensive_rebounds’, ‘DED’: ‘defensive_rebounds’, ‘RED’: ‘rebounds’, ‘AST’: ‘assists’, ‘TUR’: ‘turnovers’, ‘ASI’: ‘assists_turnover_ratio’, ‘STL’: ‘steals’, ‘BLK’: ‘blocks’, ‘PEL’: ‘personal_fouls’} 重复值处理 使用duplicate检查重复值。可配合keep参数进行调整。使用drop_duplicate删除重复值。   列名英文名词解释   哪些球员近6年连续在榜   19年球员各项数据对比 19年球员数据分布箱型图 詹姆斯-哈登随年份数据变化折线图 篮球运动员的失误与上场时长有什么联系?   0.585887 各数据的相关性图 画决策树分析影响得分的因素   (152, 24)   {2014, 2015, 2016, 2017, 2018, 2019}   Index([‘rank’, ‘player_name’, ‘team_name’, ‘score’, ‘minutes’,   ‘field_goals_made’, ‘field_goals_att’, ‘field_goals_pct’,   ‘three_points_made’, ‘three_points_att’, ‘three_points_pct’,   ‘free_throws_made’, ‘free_throws_att’, ‘free_throws_pct’,   ‘offensive_rebounds’, ‘defensive_rebounds’, ‘rebounds’, ‘assists’,   ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’, ‘blocks’,   ‘personal_fouls’, ‘year’],   dtype=‘object’)   Index([‘score’, ‘minutes’, ‘field_goals_made’, ‘field_goals_att’,   ‘field_goals_pct’, ‘three_points_made’, ‘three_points_att’,   ‘three_points_pct’, ‘free_throws_made’, ‘free_throws_att’,   ‘free_throws_pct’, ‘offensive_rebounds’, ‘defensive_rebounds’,   ‘rebounds’, ‘assists’, ‘turnovers’, ‘assists_turnover_ratio’, ‘steals’,   ‘blocks’, ‘personal_fouls’, ‘year’],   dtype=‘object’)   score float64   minutes float64   field_goals_made float64   field_goals_att float64   field_goals_pct float64   three_points_made float64   three_points_att float64   three_points_pct float64   free_throws_made float64   free_throws_att float64   free_throws_pct float64   offensive_rebounds float64   defensive_rebounds float64   rebounds float64   assists float64   turnovers float64   assists_turnover_ratio float64   steals float64   blocks float64   personal_fouls float64   year float64   dtype: object   5 rows × 21 columns 拉塞尔-威斯布鲁克、詹姆斯-哈登、达米安-利拉德这三人连续6年从2014年到2020年都在榜上,可以说明这三人在当下球员竞技状态非常稳定 对比2019年各球员各项数据,可知球员与球员之间相同数据项的差异 针对詹姆斯-哈登,分析其六年的各项数据的变化,2016年其各项正数据普偏高,而负数据普偏低,所有该年是詹姆斯-哈登的巅峰期。从宏观上看,从2014年打篮球能力从2014年到2016年逐步提高,到2016年达到巅峰,之后下降,最后趋向与平稳 可根据箱型图可视化所有球员各项数据分布 篮球运动员的失误与上场时长成正相关 分析球员的各项数据之间的相关性,可知得分与投球的数据关系非常大,其次是投球命中率 根据决策树逐步分析各项因素决定得分情况,由此可以对球员各项训练计划表进行优化

NBA运动员球员数据分析

NBA运动员球员数据分析

相关资讯

直播

更多

录像

更多

视频

更多