00:00
大家好,今天我来给大家介绍一下这个课程的背景。呃,大家都知道呃,这个课程呢,是由我的学妹王新月老师发起的。呃,她的一个发心是怎样的呢?呃,就是希望我们能够提高呃我们家里面孩子的数学啊,以及呃提高他们对AI的认识啊。因为现在这个时代,AI已经成为一种趋势啊,大家不再单单卷语数外这三门课了啊,即使是小学和初中的同学也要开始学习一些AI相关的内容,呃,然后为以后的职业发展和以后的升学做准备啊。学好AI有什么好处呢?学好AI的话,可以使自己对数学有更深刻的认识啊。同时的话,以后也可以参加一些类似的科技竞赛,把自己的想法付诸实践呃,最终的话,也可以达到一个升学和呃,或者说是提高自己的一个能力的一个呃目标。咱们直接开讲今天这堂课。
01:00
灵感来源于于勇老师创办的知春创新中心,目标是打造真正适合青少年的AI科普。特别感谢我的学妹王新月,她的支持让这一切成为可能。我是陈凯里,一个曾经的数学竞赛一等奖选手,现在是500强外企的数字化和AI项目经理。简单来说,我既是数学爱好者,也是把数学变成实际应用的人,所以今天的目标很明确,用你们初中数学的基础主要是代数。来聊聊最前沿的AI原理。大家知道,AI背后其实是一座巨大的数学冰山。我们今天先从水下最基础的部分开始,代数就像盖房子,地基打不好,楼就盖不高。后续我们还会深入几何概率这些领域,一步步揭开AI神秘面纱的更多层面。准备好了吗?让我们一起潜入这片知识的海洋,在深入原理之前,咱们先来点刺激。
02:00
的看看这三个AI应用,是不是感觉离我们很近?第一个chatgpt,他怎么听懂你说话还能一本正经的胡说八道?第二个,淘宝抖音,你刷着刷着他就给你推荐了你可能刚想买的东西,精准到让人毛骨悚然。第三个手机拍照翻译,对着一堆外文一点就出结果,简直像开了天眼。这三个看似八竿子打不着的应用,他们背后都有一个共同的秘密武器,没错,就是我们今天要聊的代数,是不是有点好奇了?好,第一个硬核知识来了,注意力机制,这名字听起来挺高大上,但其实原理很简单,想想你平时看书,是不是不会每个字都自己细细看一遍?你的大脑会自动抓住关键词,比如谁做了什么,为什么,对吧。这就是注意力机制模型也一样,它需要判断一句话里哪个词更重要。怎么量化呢?很简单,给它分配一个权重,重要的词权重就高,不重要的权重就低。然后呢,把每个词的信息乘以它的权重,你再加起来,这就是加权求和输出等于权重1乘以词1加权重2乘以词2加省略号。这不就是我们初中就学过的乘法分配律吗?
03:25
只不过这里更复杂一点,是向量之间的加权计算。所以别看差值GPT那么能说会道,它处理语言的核心就是基于代数的加权求和,把词语之间的关系给量化了。接下来这个电商推荐算法,简直是大数据时代的算命先生,他怎么知道你喜欢什么?核心武器叫余弦相似度,咱们打个比方,你想比较两本书像不像,你会看它们的厚度吗?不会吧,你会看他们的目录,看内容重叠多少余弦相似度就是干这个的,首先把用户和商品都变成一堆数字,也就是向量。比如你喜欢看电影和看书,你的向量可能是11,一部电影的向量也可能是11。怎么衡量这两个向量有多像?用点击,点击就是对应位置的数相乘,再加起来,它能告诉你两个向量在同一个方向上的重叠。
04:25
程度,然后呢,我们算这两个向量之间的夹角。夹角越小,说明他们越像,相似度越高。而余弦值就是用来计算这个夹角的。所以,相似度等于用户向量,点乘商品向量除以用户向量的模长乘以商品向量的模长。这里面涉及到点击向量的模长,勾股定理,还有最后的分数运算。是不是感觉初中数学又派上用场了?第三个OCR文字识别就是手机拍照翻译那个功能,它怎么做到的?靠的是卷积神经网络里的卷积操作。想象一下,你用一个放大镜在一张图片上一点点的滑动,每次只看一小块区域,对吧?卷积操作就有点像这个意思。图片上的每一个像素点都有一个数值组成一个大矩阵。卷积操作用一个小的数字矩阵,我们叫它滤波器去这个大矩阵上滑动。每滑到一个位置就对重叠的像素值进行加权计算,也就是代数里的乘法和加法,这就像用不同的放大镜去扫描图片的不同部分。
05:37
本提取特征第一层可能提取出边缘,第二层可能提取出笔画,一层一层叠加,最终就能识别出完整的汉字或字母。这本质上就是矩阵运算和滑动窗口的数值处理。所以下次你用手机拍照翻译,可以想想这背后是无数个小矩阵在图片上跳舞,进行着复杂的加减乘除呢。今天我们一起探索了代数在AI中的三个精彩应用,大语言模型,用加权求和理解语言,电商推荐用向量计算衡量相似,OCR识别用矩阵运算提取图像特征。核心信息是什么?就是你在初中学到的那些代数概念,加减乘除、分数向量矩阵,他们不仅仅是课本上的公式,他们已经是构建现代人工智能系统最底层的支柱。代数的力量就在于它能把各种各样的抽象概念,比如语言、图像、用户喜好都转化为数字。
06:37
然后通过计算来理解和解决实际问题,是不是觉得数学一下子变得很有用了?而且同一个数学原理往往能解决很多不同领域的问题。比如我们今天讲的余弦相似度,除了推荐商品,还能用来推荐音乐,找到跟你口味相似的歌单。卷积操作也不只是识别文字,它在医疗影像分析、自动驾驶、检测障碍物等方面也发挥着巨大作用。可以说,数学是万能的工具箱。好了,今天的代数之旅就到这里。下一次我们将进入几何的世界。我们会看看三角形、相似坐标系这些几何知识是如何帮助我们理解图像识别,比如怎么定位人脸的关键点。
07:24
再次感谢大家的参与,也感谢吴恩达教授、赵卫东老师等前辈的知识启发。记住,学习数学就是在学习理解世界、改变世界的工具。希望今天的分享能让你对AI背后的数学之美有所体会,我们下期再见。
我来说两句