笔者邀请您,先思考:
1 您阅读过哪些经典的数据科学论文?请留言
这是回到学校的时间,这里有一些论文让你在这个学年忙碌。 所有论文都是免费的。 这份清单远非详尽无遗,但这些是数据科学和大数据方面的一些重要论文。
谷歌搜索
PageRank- 这篇论文解释了Google搜索背后的算法。
Hadoop
MapReduce- 本论文介绍了处理大数据及的编程模型。 特别是,它是hadoop中使用的编程模型。
Google File System- hadoop的一部分是HDFS。 HDFS是论文中解释的分布式文件系统的开源版本。
NoSQL
这些是推动/开始NoSQL的两篇论文。 每篇论文都描述了一种旨在大规模扩展的不同类型的存储系统。
Amazon Dynamo
Google Bigtable
机器学习
数据挖掘中的10种算法| pdf download - 本文涵盖了一些重要的机器学习算法(确切地说是10个)。
关于机器学习的一些有用的事情 - 本论文充满了提示,技巧和见解,使机器学习更加成功。
Bonus Paper
随机森林- 最流行的机器学习技术之一。 它在Kaggle比赛中被大量使用,即使是获胜者也是如此。
你觉得还有其他任何文件应该列在名单上吗?
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。
我们努力坚持做原创,聚合和分享优质的省时的数据知识!
我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!
领取专属 10元无门槛券
私享最新 技术干货