ps: 最近刚好有空,尝试一下将国外不错的文章,通过网页转成markdown,然后再通过英转中的方式,大家可以看一下图个乐。本文原文作者:Suraj Jha , 这里只做转译!目前看内容和样式都还挺成功。
以下为正文:
我有一个名为 “数据科学书籍” 的文件夹,里面存有超过 60 本免费的 PDF 书籍。我热衷于收集它们,但不幸的是,每次打开这个文件夹,我都会意识到自己连一本都没读完。
于是,我决定改变方法。我开始一次只挑选一本书,并且承诺每天花两个小时来阅读和练习。
真正帮助到我的其实很简单 —— 目的。
所以,找到你的目的吧,这是你的责任,否则你最终会像大多数人一样迷失方向。
这个故事并非仅仅是一份免费数据科学书籍的列表。它讲述了我过去一个月的亲身经历,我从中学到了什么,以及我如何运用这些知识。
如果你厌倦了数字信息的杂乱无章,准备开始学习和实践,那么这个故事就是为你而写的。
—— 作者:Bin Yu 与 Rebecca L. Barter
真实的可验证数据科学 —— 作者:Bin Yu 与 Rebecca L. Barter
它教会了我什么: 这本书专注于数据科学生命周期(DSLC),主要教授 PCS 框架。
PCS 代表可预测性、可计算性和稳定性。
为何它很重要: 它填补了数据科学理论与现实问题之间的空白。
涵盖的主题:
我是如何运用它的: "我将其用于学期末的机器学习项目中”,其中可解释性至关重要。
适合人群: 它适合初学者,尤其是那些希望了解数据科学并注重可重复性的人。
—— 作者:Sanjiv Ranjan Das
数据科学:理论、模型、算法与分析 —— 作者:Sanjiv Ranjan Das
它教会了我什么: 对现代数据科学所使用的数学、核心理论和新工具进行了全面概述。
为何它很重要: 这是一本教科书式的资源,深入讲解,不会遗漏复杂的内容。
涵盖的主题:
我是如何运用它的: 在攻读 MSC AI/ML 课程期间,我将其作为参考书使用。
适合人群: 它适合中级学习者,他们已经掌握了基础知识,希望构建坚实的概念。
—— 作者:Allen B. Downey
Python 思维,第 3 版 —— 作者:Allen B. Downey
它教会了我什么: 它激励我写出清晰且逻辑性强的代码。
为何它很重要: 它培养了解决问题的习惯,它不仅仅是编码语法。
涵盖的主题:
我是如何运用它的: 在第一学期的 Python 编程课程中,它帮助我学习了基本概念。
适合人群: 推荐给自学编程者和绝对初学者,他们希望构建坚实的基础。
—— 作者:Jake VanderPlas
Python 数据科学手册 —— 作者:Jake VanderPlas
它教会了我什么: 如何使用 Python 进行数据操作和机器学习。
为何它很重要: 直接、实用且包含大量示例。
涵盖的主题:
我是如何运用它的: 这本书是我个人最喜欢的。在涉及 pandas 或 scikit-learn 的项目中,它给予了我很大的帮助。
它是我的 #1 技术参考书。
适合人群: 它适合任何正在从事或希望从事现实世界数据科学工作的人,也有助于构建 Kaggle 项目。
—— 作者:Allen B. Downey
Think Stats,第 3 版 —— 作者:Allen B. Downey
它教会了我什么: 大多数统计学书籍读起来像枯燥的小说,全是理论 —— 但并非这一本。它让统计学变得实用且可执行。
为何它很重要: 它展示了概率和推断如何在现实世界中与真正的 Python 代码一起工作。
涵盖的主题:
我是如何运用它的: 在考试期间,它帮助我准备了统计学和概率论的内容。
适合人群: 所有希望通过编码深入理解统计学和概率论的数据科学家。
你可以像这样来学习它们 ——
👉 初学者路径:
👉 中级路径:
👉 高级路径 / 研究导向:
仅靠阅读是不够的 —— 所以要同时构建真实的项目。
你可以根据自己的背景和现有知识来定制自己的学习路径。