
大家好,欢迎来到《AI数学系列课程》的第一讲:代数在AI中的应用。
很多人一提到人工智能(AI),脑海中立刻浮现出复杂的高等数学概念,比如微积分、线性代数、概率论等等。但我想告诉你一个事实:这些高深的数学理论,最终都是建立在最基本、最坚实的代数运算之上。
今天的核心使命,就是带领大家打破对AI数学的恐惧,用你们现在正在学习的初中代数基础(是的,就是加减乘除、分数、还有一点点向量的概念),来透彻地解读最前沿的AI核心原理。我们相信,只有降低学习门槛,才能真正实现AI知识的普及和民主化。
本课程由上海交通大学、安泰经管学院、交大安泰校友会联合发起,由一群既有深厚学术背景,又有丰富AI实践经验的校友共同打造。我本人,曾是全国高中数学联赛一等奖的获得者,一路深耕数学和算法研究。但如今,我的身份更多是一名500强外企的数字化及AI项目经理,负责将这些理论知识转化为现实的智能应用。我的经历正是为了证明:数学竞赛的抽象思维,最终是要服务于现实世界的应用。
今天,我们将聚焦AI的“代数冰山”底部,后续我们还会逐步深入几何、概率等主题,揭示AI的完整数学面貌。
人工智能在本质上是建立在“量化”基础上的。它必须把我们眼中的世界——语言、图像、喜好——全部转化为可以计算的数字。代数,正是处理这些数字的唯一通用语言。
让我们看看代数如何驱动以下三个主流应用:
这三个不同领域的“智能”判断,其核心步骤都是一连串精密的代数运算。
核心机制: 注意力机制(Attention)。
动态权重设计: 语言的奥秘在于上下文和关系。模型在处理一个句子时,必须知道句子中的词语之间是动态关联的。例如:“苹果发布了一款新的手机。”
代数本质——加权求和的魔力:
模型如何实现这种动态“聚焦”?它为每一个词的信息(I)分配一个权重(W)。这个权重是一个数字,权重越高,代表模型越重视这个词。然后,模型将每个词的信息与它的权重相乘,最后把所有的结果相加。
输出信息 = 权重_{词1} \times 信息_{词1} + 权重_{词2} \times 信息_{词2} + \cdots
核心机制: 余弦相似度(Cosine Similarity)。
代数第一步——向量化:
在AI眼中,世界没有“喜欢”或“不喜欢”,只有数字。
代数第二步——点积(衡量一致性):
我们用点积来衡量两个向量在每个维度上的一致性。点积就是将两个向量对应位置的数字相乘,再把所有乘积加起来。
\text{用户向量} \cdot \text{商品向量} = (5\times4) + (3\times2) + (1\times0) = 20 + 6 + 0 = 26
点积越大,表明用户和商品在这些特征上重叠越多。
代数第三步——模长归一化(解决“偏见”):
仅仅有点积还不够。想象有一个用户,他给所有的电影都打了10分(购买了所有商品)。他的向量数值会非常大,导致他和所有商品的点积都很高,但这不是真正的“精准”推荐。
我们需要排除数量(模长)的影响,只关注方向(偏好类型)是否相似。
\text{相似度} = \frac{\text{用户向量} \cdot \text{商品向量}}{|\text{用户向量}| \times |\text{商品向量}|}
核心机制: 卷积神经网络(CNN)中的卷积操作。
代数第一步——定义滤波器(Filter):
图片是由密密麻麻的像素点组成的巨大矩阵。卷积操作引入一个小的数字矩阵,我们称之为滤波器(Filter)或卷积核,例如一个 3 \times 3 的数字矩阵。
代数第二步——滑动窗口与乘加运算:
这个滤波器会像一个“放大镜”或“滑动窗口”一样,在图片矩阵上从左到右、从上到下滑动。
代数第三步——多层特征提取:
这套代数运算是分层进行的,构建了一个层次结构:
今天,我们深入探讨了代数在AI中的三大功能:
关键启示: 你们的初中代数知识,是所有AI创新、所有智能算法的通用语言。它教会我们如何将一个复杂、模糊的概念,转换为精确、可计算的数字模型。
代数对你的数学观意味着什么?
学习代数,不仅仅是为了计算X和Y的值,更是为了培养一种量化思维——一种能够将现实世界中的“质量”转化为数学上的“数量”的能力。正是这种思维,让人类能够驯服AI,让复杂的机器学习模型高效运转。
下期预告:几何与计算机视觉的交汇
如果说代数是AI的计算工具,那么几何就是AI的“眼睛”。在下一讲中,我们将探索几何在计算机视觉中的应用:
感谢所有对本课程提供支持的学者和机构,特别是斯坦福吴恩达教授、复旦大学赵卫东老师等人的创新理念。
希望今天的课程能激发你对数学的热爱——它不再是枯燥的习题,而是连接你和未来智能世界的桥梁。我们下期再见!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。