首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从世界杯数据中识别攀岩风格

从世界杯数据中识别攀岩风格
EN

Data Science用户
提问于 2022-12-29 21:50:05
回答 1查看 36关注 0票数 2

在竞技攀岩中,有许多不同的风格,如攀岩壁的陡峭程度。有些运动员比其他运动员更擅长某些风格。我想看看是否可以从竞争数据中发现这些风格,比如攀爬世界杯(示例)的公开数据。

我的问题是如何从可用的数据中最佳地推断样式。这些数据的性质如下:

  • 每一轮比赛包括四到五次攀爬,每个运动员都有几分钟的时间来尝试每一次攀爬,并有无限的尝试。
  • 对于每一次攀爬和每一名运动员,评分系统都会记录(大致),运动员是在爬到顶端的一半,还是一路爬到顶峰,以及他们花了多少次尝试才达到这两点。
  • 许多运动员参加多轮比赛,但大多数运动员不参加一个赛季的所有比赛。大概每个赛季总共有70到120次攀登,大约有200名运动员尝试过,但并不是每个运动员都尝试每一次攀爬。

因为有些运动员在某些风格上更好,我们希望看到特定的运动员群体在特定的攀爬中表现得更好,而这种聚类就是我期望从数据中出现的风格。问题是如何巧妙地解决这个问题。

我最基本的想法是给每个运动员在一次攀爬中的成绩分配一个标量值,然后进行主成分分析。我在此看到的两个问题是:

  1. 处理丢失的数据,运动员没有尝试任何特定的攀登。似乎有处理这一问题的方法,例如,正如这个stats.se帖子所描述的那样。
  2. 在给定的攀登过程中,给运动员的成绩分配标量值有很大的任意性。

是否有更好的方法来解决这个问题?是否有原则方法将离散性能度量(如“到达顶部”或“未到达顶部”)转换为PCA的数值?

EN

回答 1

Data Science用户

发布于 2023-01-04 09:21:35

我认为这里更大的挑战是创建数据集。一旦你能显示真实的数据和你拥有的列,你的问题就可以回答了。

我建议将ELO作为一种可能的方法,将登山者的表现转化为标量数。“国际象棋以外的使用”部分显示,它已经应用于团队运动,拼图,电子游戏等。

TrueSkill是另一个浮现在人们脑海中的例子,因为它支持两个以上的玩家;尽管微软通过授予它的专利而扼杀了它的采用。其他的想法是在https://en.wikipedia.org/wiki/Sports_评级_系统

我不认为丢失的数据有多大的问题;如果你必须为每一个登山者有一个条目,你可以使用他们的Elo评级来预测一个合理的值。一旦您有了基线聚类模型,以及每个集群如何影响特定的攀登者,您就可以使用该模型来细化该值,然后重复。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/117399

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档