如果你曾经在淘宝上收到“猜你喜欢”的商品推荐,或者在微信里看到智能识别图片内容的功能,你可能已经在不知不觉中与机器学习打过交道。机器学习(Machine Learning,简称 ML)作为人工智能的重要分支,正悄然改变着我们的生活方式和社会结构。 但对于初学者来说,“机器学习”往往是一个既熟悉又陌生的词。它究竟是什么?和人工智能、深度学习有什么关系?它是如何运作的?本文将为你揭开机器学习的神秘面纱。
机器学习就是让计算机能够“从数据中学习”,并利用所学知识做出预测或决策,而不需要人类写死所有的规则。
👉 举个例子:
机器学习之父 Tom Mitchell 在 1997 年给出过经典定义:
如果一个程序在任务 T 上,随着经验 E 的积累,其在性能度量 P 上的表现不断提升,那么我们称这个程序具有从经验中学习的能力。
简单拆解:
很多初学者会把这三个概念混淆。它们的关系可以用一个“套娃图”表示:
👉 关系可以概括为: 人工智能 ⊇ 机器学习 ⊇ 深度学习

传统的编程方式是 “人写规则 → 计算机执行”。 但在许多复杂任务中,规则根本写不出来:
机器学习的优势在于:

一个完整的机器学习项目,通常包括以下五个步骤:
👉 这五个步骤构成了一个“机器学习流水线”,也是我们学习过程中反复要练习的核心框架。

机器学习已经广泛应用于各行各业:

我们用 Python 的 scikit-learn 写一个“预测房价”的小例子,展示机器学习的基本流程:
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 1. 加载数据集
data = load_boston()
X, y = data.data, data.target
# 2. 划分数据集(训练集:测试集 = 8:2)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 3. 选择并训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 4. 预测
y_pred = model.predict(X_test)
print("预测结果示例:", y_pred[:5])👉 在这个例子里:
这就是机器学习最基本的应用。
机器学习的核心思想是:让机器从数据中学习规律,而不是人工写规则。 它是人工智能的重要分支,与深度学习有着层次关系。通过“数据收集 → 特征工程 → 模型训练 → 模型评估 → 模型应用”的流程,机器学习已经在推荐系统、金融、医疗、交通等领域产生了深远影响。 作为入门的第一步,理解“什么是机器学习”能帮助你建立清晰的概念框架。在接下来的系列文章中,我们会继续深入,逐步介绍机器学习的分类方法、数据与特征处理、模型训练和评估。