从事AI算法研究,不能只是了解模型结构,更应该了解模型背后相关的全套基础知识,分享一本深入讲解数据科学基础知识的书,本书主要讲解数据科学,如数据分析、机器学习、深度学习、数据挖掘等相关方面最重要的基础理论。涉及高维空间、最佳拟合子空间和奇异值分解( SVD )、随机游走和马尔可夫链、机器学习、海量数据问题相关的算法:Streaming,Sketching,Sampling、聚类、Random Graph、主题模型、非负矩阵分解、隐马尔可夫模型和图形模型等12个主题。
文末附下载地址。
前言
计算机科学作为一门独立的学科始于20世纪60年代。重点是编程语言、编译器、操作系统以及支持这些领域的数学理论。理论计算机科学课程包括有限自动机、正则表达式、上下文无关语言和可计算性。在20世纪70年代,算法的研究作为理论的一个重要组成部分被加入进来。重点是计算机的可用性。今天,一个根本性的变化正在发生,重点逐步迁移到大量的应用上。这种变化有许多原因。计算和通信的融合发挥了重要作用。
自然科学、商业和其他领域观察、收集和存储数据的能力增强,要求我们改变对数据的理解,以及在现代环境下如何处理数据。网络和社交网络作为日常生活的核心方面的出现给理论带来了机遇和挑战。虽然计算机科学的传统领域仍然非常重要,但未来的研究人员将越来越多地参与使用计算机从应用程序中产生的大量数据中理解和提取有用的信息,而不仅仅是如何让计算机在特定的明确问题上有用。
正是考虑到这一点,本书整理了预期未来40年有用的理论,正如对自动机理论、算法和相关主题的理解在过去40年中给学生带来了优势一样。其中一个主要变化是对概率、统计和数值方法的重视程度有所提高。
目录
下载地址
微信公众号“深度学习与NLP”
回复“datafd”获取下载地址
领取专属 10元无门槛券
私享最新 技术干货