推特使用什么算法来确定你可以在search.twitter.com上看到的10个主题?我想实现这个算法,我也想展示50个最受欢迎的主题(而不是10个)。你能描述一下最有效的算法吗?
谢谢!
(Twitters API可在-http://apiwiki.twitter.com/REST%20API%20Documentation上找到)
此外,我希望能够通过搜索公共时间线- http://twitter.com/statuses/public_timeline.rss来实现算法
发布于 2011-01-20 01:04:37
Twitter的趋势算法不仅仅是关键字的数量。这是一部分原因,但还有一个衰败因素,所以"justin beiber“不会永远成为热门话题。
quora上的这篇文章支持了这一点。http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm
衰减通常是通过在算法中使用帖子的相对年龄来完成的,赋予较新的主题/帖子/等更多的权重。
另请参阅http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm
发布于 2009-11-03 17:36:55
所以Twitter可能做的是计算特定术语的提及次数减去停用词(停用词,比如: do,me,you,I,not,on等),所以"the cat is out of the bag“和"my dog吃了我的cat”将意味着它提取的术语是cat,dog和bag (剩下的都是停用词),然后将'cat‘计算为两个引用,所以在这种情况下,'cat’将成为一个热门话题。
https://stackoverflow.com/questions/143781
复制相似问题