在竞技攀岩中,有许多不同的风格,如攀岩壁的陡峭程度。有些运动员比其他运动员更擅长某些风格。我想看看是否可以从竞争数据中发现这些风格,比如攀爬世界杯(示例)的公开数据。
我的问题是如何从可用的数据中最佳地推断样式。这些数据的性质如下:
因为有些运动员在某些风格上更好,我们希望看到特定的运动员群体在特定的攀爬中表现得更好,而这种聚类就是我期望从数据中出现的风格。问题是如何巧妙地解决这个问题。
我最基本的想法是给每个运动员在一次攀爬中的成绩分配一个标量值,然后进行主成分分析。我在此看到的两个问题是:
发布于 2023-01-04 09:21:35
我认为这里更大的挑战是创建数据集。一旦你能显示真实的数据和你拥有的列,你的问题就可以回答了。
我建议将ELO作为一种可能的方法,将登山者的表现转化为标量数。“国际象棋以外的使用”部分显示,它已经应用于团队运动,拼图,电子游戏等。
TrueSkill是另一个浮现在人们脑海中的例子,因为它支持两个以上的玩家;尽管微软通过授予它的专利而扼杀了它的采用。其他的想法是在https://en.wikipedia.org/wiki/Sports_评级_系统。
我不认为丢失的数据有多大的问题;如果你必须为每一个登山者有一个条目,你可以使用他们的Elo评级来预测一个合理的值。一旦您有了基线聚类模型,以及每个集群如何影响特定的攀登者,您就可以使用该模型来细化该值,然后重复。
https://datascience.stackexchange.com/questions/117399
复制相似问题