00:00
呃,大家好,然后很荣幸今天能够能够在这边给他给大家进行一次分享,然后刚才其实呃华哥分享的已经非常的全面,然后也也很好,然后我这边的话主要就会从一些呃算法角度,以及以及我个人的一些呃比较比较浅的一些经验吧,因为说其实我刚进入职场也不算太久,对,然后呃,这个创作其实也不是为了创作,创作可能就是自己的一些呃兴趣爱好,或者说我自己的一些习惯之中的创作,对,然后OK,然后我们开始啊,然后。呃,对,然后首先来自我介绍一下,对,然后我就我叫陈明豪嘛,然后博士毕业于浙江大学,然后现在是腾讯天美的一名高级研究员,然后也很荣幸今年的话也是拿到了呃,腾讯的一个知识奖,然后也在知乎偶尔会写写文章,也是个万粉的一个博主吧,然后自己的话就是比较喜欢去用一种比较通俗易懂的方式去给大家讲一些算法的一个原理。
01:06
OK,然后我今天的分享主要会从这三个方面进行展开吧,然后一个是为什么说算法的岗位会更需要做一些技术的一个创作,然后第二个方面是从呃如何通过创作来构建一个自己的一个知识体系,然后以及说AI创作它的一个算法原原理和实践,然后在在开始分享之前也想了解一下,比如说我们现场的这些观众里面有没有哪些是呃做算法的,或者是算法岗位的多还是少?有的话举个手看一下。好像没有,还是大家不好意思举手,OK,然后行,然后等会,如果有介绍到一些呃,算法相关的,然后我也会,呃,从更简单一点的方式,让大家尽可能去了解到算法要做了什么东西嘛。OK,然后首先的话就是说算法是什么,然后这边的话给大家简单举了呃四个例子,然后这四个例子其实相对来说是呃,大家都比较可能耳熟能详的,然后比如说第一个是搜索引擎,然后搜索引擎里面有什么算法,就是说比如说你在一些搜索引擎里面进行打字,你可能打两个字,比如说今天是,他后面可能给联想说今天是叉叉,比如今天星期几或今天天气怎么样,后面会自动帮你联想出一些文字嘛,那这些文字怎么来呢?他可能就是背后有一些算法来进行实现的,那可以是怎么实现这一局简单两个简单的一个例子吧,第一个例子,比如说他可以去做一些关键字的一个匹配,比如说今天是。
02:31
或跟这样的一个词组去匹配的,这种形式可能有很多,比如说今天是星期几,他可能是个常见的一个词组,那他可能就作为说今天是星期几的这样的一个,呃,联想给你推出来了,那再以及说他可能去去基于这种下一个字是什么东西来做一个预测,比如说呃,金后面跟天连在一起的这种情况出现很多,那相当相当于说他的概率很大嘛,那所以说当你看到一个金的时候,你很自然而然就有点想到说金的后面可能就是天,所以说这就是搜索引擎里面他这种,比如说像下一个字或下一个词什么,它会做种联想,其实就内在有些算法在里面。
03:09
那再比如说推荐系统,这个大家呃,不管说刷小视频啊,看电视剧什么都会有,那这个他怎么做啊,这再从两个角度来说,第一个例子,就第一个角度就是说,呃,你在看一个电视剧的时候,比如说你看哪个古装类的一个电视剧,那可能你看完这电视剧以后,呃,我们比如说后台会有一些你的数据嘛,那大家在建模的时候就会发现说啊,其实你这样一个用户,你是更喜欢古装电视剧的,那自然而然给你下一步也推一个古装电视剧,电视剧你可能就会喜欢去点开嘛,这就是从你喜欢看的一个呃电视剧去推跟他相似的电视剧这样一个角度去做推荐,那再比如说他还可以从用户的角度去做推荐,那举个例子,比如说呃,跟你关系比较好的人,或者说你的亲属啊,好友,跟你的兴趣爱好可能就在在一定程度上会有相似之处嘛。
04:00
那自然而然可能就做一个方式,就比如说呃,你的一个好朋友可能近期去看的一部呃,古装剧,那他他就会联想到说啊,是不是说因为你的好朋友喜欢看,可能你也会喜欢看,那自然而然也可以去给你推一个古装剧上去看一看,然后这就是比如说推荐系统里面可能涉及到的一些算法,当然其实这种各个领域其他涉及的可以做算法的类型也有非常多,然后这也只是举一些简单例子,让大家方便理解一下,然后再比如说地图导航,大家也肯定是经常用的,那地图导航里面。常见的比喻有什么?就说呃,你写了一个目的地,你想去哪里,那其实你点的时候,他其实给预估,说预估一个时间,说你大概在几点能够到达吗?那这几点能够到达可能就是他通过一个算法去给你预测出来的,那这个算法或者说这个模型他怎么去建的呢?那最常见比如说呃,你从一个地点到另一个地点肯定有距离嘛,距离肯定是要考虑的因素,那再比如说你的一个出发时间也是要考虑因素,因为说比如说早高峰或晚高峰,他的一个消耗时间又比较大,然后平常比较不拥堵的时候,他消耗时间比较少,然后再比如说工作日和周末,他的一个耗时肯定也是不一样的,那他的这样一个算法做的时候,就就类似于说我要把可能会影响到你从A点到B点的。
05:17
到达时间的这样一些因素给他考虑起来,当做它的一个特征,或者说理解它是一个输入,那我们通过这样一些特征去预测说你最终到达这样的一个B点,或到达你的目的地需要多久,这就是一个里面的一个算法,然后再比如说从A点到B点,它可能也有好几条路径,然后这种路径怎么去求,他可能可以也有一些算法来进行一个求解,对,然后最后一个,比如说是一个呃,AAI医疗这样一个领域,那AI医疗的话,其实在这两年也相对来说是比较火的,那常见的一些做法,就比如说有可能比如说根据你的一些呃,去测一些血液的一些指标,根据这些指标,其实每个指标就类似一些数值嘛,比如说你呃,某某数值是多少,某某数值多少,根据各种数值来猜测或者来预测,说你可不可能具有哪些潜在的一个疾病,这种是一种做法,那再比如说你再去做一些,不管说拍CT啊,做B超等等,是一个一些,呃,图像类的一些,呃这种输入吧,然后也是类似于说通过这样图像类的一些东西来预测说你可能会不会有些潜在。
06:17
赛的疾病,这也是都有可能的,然后这一页的话,其实给大家主要介绍其实偏向于呃,可以认为是今年以前的大家认知比较多的算法,那其实今年呃大家或多或少都知道,就说大模型的话,呃已经进入了大家的生活中,或者说呃。到处都可以听到吧,对,所以在今年这样的一个呃,我称达,或者说我们相关领域都会称达这一个大模型的一个时代,大家在聊的一个算法,可能更多的是这两个方面,一个是纹身图,一个是呃语言模型,那他其实统称来说都是一个生成模型嘛,那左边的话这种都这种纹身图,它做类似于就是说呃,你给他一个文本,或者说这里给他文本叫做提示词,然后他根据你给他的一个提示词去生成对应的一个图像,这种就是纹身图,对,然后右边的话就是缺GBT嘛,然后他做的就是一个呃纹身纹,或者说就是个语言模型的一个呃算法,那他的一个做法其实就是根据你给他的这样一个提示词,去进行一个可以理解就像进行一个对话,或进行一个续写,然后这个后面也会再详细介绍一些原理,然后前面这里的话,其实主要就是呃,说一下,比如说现在常见的一些算法大概有什么,然后了解到了说比如说现在已经进入到可以理解说现在进入到一个在算法领域进入到这样一个大模型的时代。
07:35
然后有怎样的一个趋势,或或者说为什么说更需要去做一些技术创作呢?然后我这边的话,呃,简单去,比如说在阿上面去搜索一下这个论文,因为说其实算法领域的话,经常去跟热点的话,你就去看这种我们呃大家会把一些自己研究的东西先发出来,就说没有正式发表,不是在不是在期刊或会议上发表,但是会提前发出来,就占一个坑位,然后去简单搜一下今年的跟关键词里面,比如说有大大语言模型相关的,一搜就有7000多篇后,所以说这个信息量或说。
08:06
呃,这个领域的发展其实是瞬息万变的,然后你如果说不能够去,不管说去跟一些热点也好,或者说做一些技术沉淀好,你可能呃,一两个月后,人家讲什么你都不知道了,对,然后。然后在前面,那就在前面这样一个背景下面,然后就其实说呃作为一个算法岗的一个同学,呃我认为的话就是说从自身角度就说我们去做一些技术创作,其实是有必要的,对,当然我的技术创作就像前面我说过,就说其实我呃经验也不是很丰富,而且我也没有不是想着说呃能够去变现,或者说为了赚钱而去,我只是呃觉得从我自身的角度,可能需要去做这样一件创作是很纯粹的,那具体来说怎么个纯粹方法,就是说怎么个纯粹,就是说呃主要我我的理解有几点吧,第一点就是说呃做一些算法岗位,做一些技术创作,首先的话,它是能够去巩固你的一个概念或基础知识的,因为说你只有通过自己去写一些东西,你才能够深入的去理解说这个东西到底是什么。
09:07
然后如果你只是看过,那那那就是看过嘛,对吧,然后第二个的话就是说,呃,你通过不断去,就像刚刚说的,就是知识的更新换代非常的快,那如果你不去做一些储备,或者把它记录下来,你可能就是慢慢就是你看过的东西也忘记了,或者说你没给他写下来,你不能够形成这样一个自己的知识库,比如说你看两个月前看过的东西,你没有给他记下来,然后两个月后你突然想说,诶,这个东西在哪里,然后找都找不到,那如果你有通过这样一个写作的习惯,你把它记录下来,可能说呃,这样一些东西你想去找,就是能够比较方便给他找出来,这也就是你个人的一个资料库嘛。然后第三点的话,其实就是一个呃技能一个磨练嘛,就是说因为你在写作时,其实呃不仅仅只是给他写下来,你要你通常要去考虑说你如何把它写的更有逻辑性,或者说更让读者能够理解你写的到底是什么东西,那更更有可能就说写的,因为同样是技术的文章,有人写的就很生涩或让你看不懂,那有的人写就说他能够通过一些比如说例子也好,或者说一些故事也好的,那你很容易去接受,那如果你能成为后者,那你写的东西可能大家也会更喜欢,这当然也是在磨练你自己的,不管说是一个呃逻辑思维,或者说你的一个表达能力。
10:23
然后说完前面的这些后,然后接下来就来聊一聊,就说我从我个人的一些经验来讲的话,我是如何通过这样的一些呃创作来构造自己这样一个算法的一个知识体系的。对,然后首先聊一聊,说我从我个人角度,我经常写怎样的一些文章,或者作怎样的一些呃相关的一些调研吧,对,然后第一点的话就是呃,我个人是比较喜欢去追一些最新的一个进展的,然后也像前面也聊到,就说因为现在这个大模型时代,就是说这种算法的一个演进实在是太快,你不去追的话,你呃随时就out了,对,所以说呃基本上就是举个例子,比如说前两周像呃open AI它的。
11:06
大理三就是一个纹身图模纹身图的这样一个模型,他的一个技术报告出来,那其实可能出来当天就会有大量对这感兴趣的人都会去追这样一个文章,然后去把这个文章,先把论文看了,然后再去写一些相关的,不管说是技术解说也好,或者说是呃新闻那个报道也好,都会去做这样的这样的一些事情,对,然后这就是追最新的一些进展,然后第二点是一个学不同的方向,然后这个怎么理解,就是说,呃,其实虽然说算法他叫也叫一个岗位,叫一个方向,但其实算法里面它还分了非常非常多的一个,呃,不同的领域也好,或者说子方向也好,举个例子就说,呃,你可能。呃,文本它是一大类的一个方向,你跟文本做相关,可能大家就叫自然源处理嘛,那你可能做图像,可能叫CV,那你可能做一些强化学习的,或者说做其他的等等,就是他的面其实是非常非常广的,那作为一个职场的一个打工人吧,就说其实你在从我角度啊,就是你在。
12:09
做好自己工作的同时,然后把自己的方向打的更深的同时,你也有必要去拓宽自己的一个广度,对,所以说一般来说的话,我也会去写一些,就是说跟自己同样是算法方向,但可能跟自己主要工作不一定是完全重叠的这样一些,呃,其他方向对来扩拓宽自己的一个视野吧,然后这个在其实互相不同的方向虽然是不同的,但是他相互之间其实也是有很多可互相借鉴的,所以这个也对于你的一些工作是有很好的一个启发的。对,然后第三个的话就是说,呃,我也会去写一些,就是通俗那种教程,然后出教程,目的其实有时候是呃。为了读者而写的,这是为什么,就是说呃,其实如果大家有过一些创作经验的,然后不知道有没有这样一些感受啊,就是说呃,你在某个平台,比如说发你的一些博客也好,或者文章也好,当你看到有人给你点赞,或者说你的阅读量很高的时候,其实对你是一种很好的一个反馈,或你会觉得很开心,当然起码我是会这样的,所以说呃,写一些那种通俗一点的课程啊,或者说这样一些东西,其实对于从我,从我的发现啊,就说对于大众来说的喜好,其实是呃更大的,他们也更爱看这样一些东西,然后所以有时候也会写这样一些通俗的一个教程,然后来。
13:31
符合大众的一些偏好吧,对,然后另外一个就是说前面这些写的可能更多的是写那种小的点,比如说新出一篇文章写一写,或者说现在有个什么技术去写一写,但是我觉得要对自己有一个更好的沉淀,就需要说你每一个阶段。去做一个这种有逻辑性的总结,那这个怎么理解,就是说,呃,举个例子,比如说你再去想去了解说大模型,以大模型以前这个自然语言处理这个领域它是怎么发展的,那你可能需要去看个二三十篇的一个论文,那你前面的时候可能会去写这些单篇论文的,就不同的这样一些,呃,论文的一些解读也好,或者说他的一个总结也好,但是你始终没有给他们串起来的话,你的一个知识其实还是零散的,所以说你一定要去做的一个事情,就是说当你的单点。
14:21
做的还行的时候,你要去有周期性的也好,或者说阶段性的也好,把这些点给它串起来,给它组成一个有逻辑性的这样一个总结,那你能形成的就类似于说你可以像那个图里面,比如说你去写的一篇小博客,可能就类似于图里面的一个点,当你把各个点给他串起来后,你的一个知识网络就慢慢清晰了,对。然后说完我常写什么东西,然后就会涉及到就是说呃,我之前写的东西是从哪里去得到启发,或哪里去跟这些东西,然后这里的话就会有一些我个人比较常去关注的一些平台也好,或者说是呃收集素材的一些网站,对,然后第一个的话就是一个论文网站嘛,大家呃,如果有去看,经常看论文的应该也都了解,然后第二个的话,呃,作为一个程序员,其实大家也都知道会去。
15:12
呃,有时候就看一看get HUB它的一个趋势就是说他一个热度,然后第三个的话是呃,我不确定在其他领域大家会不会关注啊,但是其实在算法领域的话,在推特上面其实有非常多的这种呃资源的,然后大家的一个通过推特去做这样的一个资源的呃方式,其实是为了推广自己的一个工作,所以说他们一般很多算法一出的时候,他们就会在推特发表自己的一个工作,然后比如说附上一段简介,然后自己的文章的链接啊,然后或者说一些DEMO的一个呃链接,然后大家互相之间就转开了,所以说关注推特其实也能够关注到很多最新的一些呃前沿,然后另外还有个是ha news,这个其实是呃在国外用的比较多,那在国内实用的比较少,但是上面也可以关注到挺多信息的,然后ready也差不多,然后另外就是呃,国内的像那个公众号知乎啊,CSDN这些也都是比较会去常看的,然后当然这些的呃。
16:12
啊,看这些目并不是只是为了从上面去,我的我的从我的角度啊,我我看这些目的其实只是从上面去找,呃。素材的一个来源,就是说,比如说公众号或者说知乎,他可能已经把这样一些素材,或者说这样一个点已经加工了,已经写好了,那你其实你是想去找说这个热点到底是什么东西,然后你再去自己去把这个东西给它写一遍,对,然后举个例子,比如说。呃,假设现在你在知知乎网或公众号,你看到了一篇呃最新的叉叉叉文章的一个解读,那你其实呃你不仅仅是直接去看他说他去怎么解读的,你可能要去呃想说这篇文章,他比如说他从哪里来的,然后你自己去把这篇文章读一遍,然后你自己的感受,其实跟别人解读好未给你的肯定是不一样的,然后如果你能再自己把它呃写一遍出来,那其实肯定也是跟不一样的,然后当然列了这么多这种收集素材的一个呃方的一个渠道吧,那其实你要去把这些。
17:21
每天去关注啊,或者说一直经常去看,其实是不现实的,所以说呃,作为一个程序员,我们还要去科学的去处理这样的各种不同渠道,所以说这边的话,呃,我其实也会去写一些爬虫的脚本去,呃定期的去到各个不同的平台上去摘它的一些热点,然后摘完后再作为相当来说用爬虫给你筛一部分嘛,那比如说你每天筛个一个平台上筛个五到十片的一个东西,然后可能再去驱虫啊,然后最终找一些可能你认为真正。热点东西,然后你可以去关注一下或看一下,对,然后这个当然后面还会聊到说,呃及时战略上后,你可能还会面临到大大量的这种需要去呃阅读后你才知道他的信息到底是好是坏,值不值得去进一步阅读的东西,那可以再借助一些手段再去进行分析,后面我再介绍一下。
18:12
呃,对,然后第三步的话就是呃,前面比如说已经筛已经有那么多渠道了,然后能筛那么多有那么多信息源的,那如何去呢?然后一个是刚才说到就是什么都看是不现实的嘛,然后呃,所以说有两个,两个经常是从我角度我去我会去判断的地方,就是说因为呃算法这个东西,大家其实还是。量很大,但是质不一定好保证,所以说我们经常会去看,就是说呃,你这样一项工作或这样的文章是来自是不是来自于一些比较大的厂,或者说做这个领域做的比较深的一课题组,那这这样子去看的话,就可以帮你过滤掉一定一定程度那种质量会比较差的一些研究工作,然后另外就是说呃,你可以通过标题啊,摘要去快速的了解,说你筛出来这样一些文章,它到底是属于哪个领域的,是不是你感兴趣的,是不是呃你想去追的,然后。
19:10
这样子其实是一种偏向于被动的去筛这样一些东西嘛,然后另外就是说,你如果是呃主动想去获取哪些方面的一些知识啊,或者说是哪些关键字相关的论文,那你就主动去获取就OK的,然后另外的话,也就是呃,还是我想说就是说呃,作为一个打工人,我们还是可以通过一些技术的手段来做一些信息和过滤的,然后后面也会再进一步介绍。OK,然后。然后在前面的介绍这些,如果去获取素材啊,或者说做一些筛选后,那其实我们要去做创作的话,其实主要还是要形养成一个写作的一个习惯吧,对,然后从我自己的角度来看的话,其实呃,梳理梳理素材也算是一种创作,那为什么就是说,呃,当然这不不不一定是每个领域都这样子,但其实比如说从我刚刚说的算法这样一个领域,它的一个发展实在太快,各种工作实在太多了,那其实你可能需要花一定的时间来梳理不同的工作,他到底是讲的是什么东西,有什么创新点,他解决了怎样的一些问题,那其实在这个梳理的过程中,我认为他其实也就是从创作,不过他创作的东西可能只是比较小的一部分,但是你也可以把它当做一种创作,然后如果说呃,你每要要养成每天去有这样的一个创作习惯太难,那你其实可以也给自己定一下,比如说你呃每周抽点时间来做一下,也都是OK的,然后最好的一个方式,呃,我认为应该你。
20:38
他去做一个固定时间的一个创作,就是说你不能想着说我什么时候有空再去看点东西或写点东西,那这个你就有可能,呃,什么时候都没空呢,你可如果把这时间给他定下来,比如说我固定每周的周几的几点到几点,我可能去看点新的东西,或学点新的知识,写点博客,那你给他固定化下来,一般的话,慢慢的你可能就想成习惯了,当然这里的话写到一点,从自洽到自律,然后这个是想说明什么,就是说其实大家在不管说在创作或者做其他事情的时候,很容易遇到,就说比如说我给自己定一个目标,我现在呃,每天要去写,要去看一篇文章,写点东西,那可能我前一两天我就做不到了,然后我心里很沮丧,然后这个时候有点挫败感,后来就不想写了,对,那当然这其实是没必要,就说我们应该还是要做到,就说呃,允许自己有一定的这种惰性,或者说养不成习惯的,呃这种这种形式吧,但是你要能克服它,然后。
21:38
后在不断的去挑战他,最后养成这种自律的一个写作习惯,然后你就会习惯这样的一个事情,对,然后另外就是说。呃,其实你在写作后,你肯定不可避免去在各个平台去发你的一个文章嘛,那其实前面也有聊到,就说你发文章时,其实如果有一些读者给你有一些正反馈,对你来说其实是呃很有激励作用的,但是对于大多大多数的一个普通的人来说,可能你一开始写的并不好,或者说你写了呃框框框写了一二十篇,结果总的基本都没几个人去看,那这个其实是会带来一定的挫败感的,可能你就不想写了,所以说其实你要去明白说呃,你去创作可能你只是为了自己,不管说自己积那个知识的一个积累,或者说沉淀,而不是为了别人而写,要去克服这样的挫败感,然后坚持下去。
22:30
OK,然后另外的话就是说。呃从算法角度后,然后从算法角度的话,你通过创作的话,如何去形成你的一套一套知识体系,然后然后这边的话,我举一个呃简单的例子,然后这边说到三个词啊,这三个词其实是今年在大模型方面,就是提示提示工程方面的三种方式,然后我给他引用过来,当然跟这里跟原本的一个定义是完全不一样的,然后我的一个呃想分享或想说,其实就是说我们要形成自己的一套知识体系,可能从一个思维链到思维数,再到思维图这样一个方式去发展,那怎么说呢?比如说你现在在做呃自然语言处理相关的这样一个算法工作,那你可能去梳理自己的知识,或者说去写自己的文章,你可能会从呃自然语处理这方面比较前期的一些工作,比如说呃一五年左右的工作开始去学,去看,然后到比如说18年20年左右的工作,以及到这两年的工作,这样慢慢去看,慢慢去学,那当你把这样一些工作都学好,都串起。
23:33
然后你其实就形成了这个方向的一条呃知识链嘛,就说你知道说这个方向是怎么引进的,这些算法是怎么引进过来的,那这就是你的一条思维链,那什么思维数呢?思维数就是说呃你看完了,比如说梳理完了自然语源处理相关的这样一些知识,那你可能要转向说呃你还想去了解一下,比如说图像是怎么处理的,图像算法是怎么做的,那这个时候你可能就去看,比如说看呃CV相关的一些工作,你可能从早期的一些CNN开始看,然后到近几年的基于存form这样的一些呃图像处理算法去看,那当你去这样做后,你就发现你其实呃就多路开花了嘛,就说你各个方向开始都懂一点,然后就形成的自己的一个思维数吧,然后再进一步的话,其实呃,当你看的多了,写的多了,学的多了,你就会发现说,其实呃虽然有各种不同的领域或者说方向,但是各个方向其实都是呃有这种交叉的,或者说。
24:29
大家互相在启发来启发去的,那这就能够让你去发现说不同方向,不同领域,它的一个这种呃知识的一个交叉所在,然后你就能够对这些知识去进行一个融会贯通,然后举个例子,比如说你学会了图像自然源处理相关的东西,学会了图像处理相关的东西,那最终你可能你对多模态处理这块东西。就有所了解,或者说你对这块就掌握的更好一点,对。然后这个是我在呃算法这个角度觉得说通过创作去构建知识体系的一个,呃,个人一个理解吧,对。
25:05
然后接下来的话,第三部分的一个分享呢,主要就是一些AI加创作的一个算法原理,还有一些呃实践。OK,然后这里的话,呃,左边这张图其实前面出现过,然后举一个例子,就是说呃,语言模型嘛,就是缺了GBT,然后左边的话,其实我问了他一个问题啊,就是大家不看得到吗?我可以简单说一下,左边问他问题就是说技术人如何高效创作,然后他框框框写的十点,然后其实这十点写的很好,也比我讲的都要好,然后。也太过于专业,其实我觉得过于专业的东西不一定都适合大家,然后也不一定大家可以模仿的方式,但只能说他呃这种写东西或总结一些,呃这种更加通用的东西,它是能够做的很好的,那知道了这样有这样一个东西或有这样一个AI工具后,那我们来了解一下,就说他这样一个东西是怎么被做出来的呢?对,那所所以的话,我们就来看一下右边我说到就说呃缺gpt或GPT4,它的本质是一个语言模型。
26:06
那什么是语言模型呢?这边其实给了个定义啊,就是说给定一些字或词,然后字或词的话,在呃这个领域里面,我们叫做token,然后他要去预测下一个字或词,那比如说这里给了一个呃搜索引擎里面的例子,比如说today is,呃,这相当来说前面有个三个词嘛,那他作为一个语言模型,他去做就要预测这个呃后面他可能是什么词,对吧?那比如说他可能是后面,呃后面可能是good,或者说是go,或者说是beautiful都有可能的,然后这就是一个语言模型的一个体现,对,那如何去训练这样一个语言模型呢?或者说。为什么语言模型适合训练?大家有没有知道的?呃,对,可以这么理解啊,就是说我们可以解释一下,就说其实在AI领域或者说算法领域,你要去训练个模型,呃,一般一般的话有两种方式,一种方式就是说你必须要有标签的,举个例子,比如说你要去呃预测预测什么预测,我从这边到广州塔要多久,那你要训练这样一个模型,怎么训练,你要知道说。
27:12
我在这边。到广州台。最终用了多久嘛,就是你要个时间,比如说20分钟,20分钟就可以理解是个标签,那这个东西可能是一个事实存在的东西,也可能是一个呃,比如说找一些打勾的,打标的一些呃人来帮你打的一些标签,大家举个例子,比如说你的一些图像,比如说一张图像上面是一是一只猫,那你的一个标签是猫,这个猫哪来的,就可能有人要给大家打上这个标签,那其实你要去打这标签是会非常花费,不管说人力或者说是呃金钱的,所以说另一种训练AI的方式,就是我们能够要去寻找一种。不,不需要通过标签而能够去训练AI的方式,那为什么说语言模型它不需要标签就可以去训练AI呢?因为说我们的文字在世界中是大量存在,就是说你不管去网上随便看,随便找各种书籍,各种什么,它都是天然的一个文字,那因为我们训练的模型做的就是预测下一个文字是什么吗?所以说你天然就存在数都数不完,无穷无尽的这样的一个标签数据,导致你的一个模型的这个数据量能去训练的是。
28:20
呃,简可以理解无穷无尽,但其实还是有穷有尽的,但是相对来说是比你去找人来打标签要来的非来的容易的很多的,所以说语言模型就是更好去训练一点。那知道了这个。初步的一个原理以后,那我们来稍微数学化一点,看一下他去做是怎样一件事情,或者怎么去训练的,然后下面给了一个公式啊,然后其实不会很难,就是。我们看一下就说这个公式,其实它有个概率的一个求和嘛,那其实概率我们也不看了,我们只是就看后面那个一个条件概率吧,那它做的事情就是说,比如说呃,后面那一串代表就是前面几个字,然后UI代表就是下一个字,所以他做的事情就是说从前面几个字去预测下一个字,我要去最大化这样一个概率就OK了,对,然后这个就是他去训练的一个本质原理,就是这样子,当然他肯定要做很多骚操作,才能最后把它训练的这么好。
29:17
OK,然后我们再具体看一下,然后有了这样假设,有了这样一个语言模型后,那其实呃,对于语言型来说,它还有一些概念需要去理解,然后第一个概念就是一个上下文学习的一个概念,那这个意思就是说。因为他是一个语言模型嘛,你给你给他输入肯定是语言,那那你就需要对他做一定的一个引导,那比如说你要需要他去翻译,那你肯定要告诉他,让他去做翻译,他才知道是翻译啊,所以说这就是一种上下文引导,就是说呃,你的上下文就告诉他说你需要去,比如说把英文翻译成中文,这种就是一种上下文。然后另外一种就是一个呃,事力学习,事力学习什么意思呢?就是说呃,还是以这个翻译为例子,你可能要去让他把某句英文翻译成中文,那你直接给他,让他去做这样翻译,相当来说不给他任何事例去参考,他就直接给你硬生生翻译了。那你可以做的另外的几个事情,比如说呃,One shot的方式,就是说我给他一条事例,比如说我先告诉他说把这个英文从把下面的英文翻译成中文是什么,然后给他一条例子,比如说today is good day,今天是美好的一天,然后再给他另一条英文,是你要翻译的,比如说呃,Today is no good day,然后让他去翻译说是什么东西,这种就相当于给他点事例,当然事例可以不止一条,一条的就叫one shot,多几条就叫few shot,这就是事例学习。
30:39
OK,然后了解这两个概念后,然后我们再看一下,就是说呃雀ERGBT以前这样的一些GBT的模型,它是怎么去训练,以及说到去ER gpt,为什么他突然就变得这么的猛,他有哪怎样的一些呃原理或怎样的一些方式使他变得这么强的,那我们先看一下去GP,看一下那个GPT123,他的个预习练做是一个怎么样的事情啊?那举个例子,比如说呃这边举个例子,就是这个小朋友在小的时候在学呃,阅读也好,学看书也好的一个例子吧,那比如说他经常会在书,比如说在书上看到这样一句歌词啊,比如百灵鸟从蓝天飞过,我爱你中国,那当他看多了这样的一些表达也好,或者说看多了这样一些文本也好,然后当你来问小朋友说。
31:27
我爱你后面是什么?他可能自然而然就脱口而出中国嘛,因为说他建了很多了,那为什么他建了很多他就知道中国啊,你可以理解,其实他本质里大脑你已经养成了这样的一种语言模式,就是说我知道说我爱你,后面可能接着就是中国,那这就这就是语言模型,他做的一个事情就是这样子,所以说GBT123,他在做预训练的时候,其实做的也就是跟这个完全一样的事情,GP测下面的一个字或一个词是什么东西。OK,然后接下来说一下,为什么说到今年这个到去年年底这样一个确GBT,呃比以前的各种语言模型都要强这么多呢,他还去做这样一件事情呢,OK,那我们来看一下,就是前面的这样一些做法,其实呃主要依赖的还是一些就是无标签数据啊,或者说是你往上爬的,或者说各种各样这种呃比较可能比较脏的数据,因为说你从网上去爬的这样一些文本,其实是没有经过审核的,或者说没有经过你过滤的,那自然而然包含着很多,不管说是呃大家。
32:28
人类自己去说的一些乱七八糟的话也好,然后有一些官方的话也好,就是很多事实性都没有经过验证的,所以说他肯定很多错的东西嘛,那导致说你训出来的模型可能也不一定好,所以说去了gpt在做第一步的时候,他其实还去做另外一个东西,就是说他又找了一些事例数据来做监督学习,那这个什么意思呢?就是说。他就像你一个父母去教小孩子去学习的一个过程吧,就说呃,你不要让小孩子就去看书,他看书书上可能是错的,你看着看着就是学错知识,你要告诉他说一些,把一些正确的东西灌输给他大家去学,那比如说你要告诉他,问他说天上有多少星星,然后下面这个天上的星星曙冠,这句话你就可以理解是经过你或经过父母审核完后的一个标准答案,作为一个可以学习的东西,让他去学习,那通过这样的一些比较高质量的一个那监督数据让他去学,他其实就有能够去更好的去提升他的一个模型,或者说这样一个AI的一个能力,然后这当这当然其实只是第一步。
33:33
然后第二步他还去做了这样一个事情啊,他去训练一个奖励模型,那什么是奖励模型啊,这个其实对于如果大家不了解,呃,算法这块的话,其实是比较抽象的,那这里也举一个例子,就是说。你家长去教小朋友始终是有限的,接下来你可能就要找一个老师来教了,老师的话学识是比较渊博的,那当然老师他的知识也不是凭空而来,他可能也要向大量的老师去学习,那这里的话反映到他去做这样一个模型时,可能存在的一个做法,就类似于说他去找了很多这样的一个达标的一个人员,或者说你可理解他去找很多这样一个老师,然后他让这个模型去生成几个输出,比如说我们就以两个为例吧,比如说呃,他去问,他说呃。
34:19
我爱你后面记的是什么?一个一个人的一个模型的输出给出来的中国,一个人的输出给出来的China,那其实放在中文的语境里面,你可能会觉得中就是中文后面接中文会比中文后面接China会更好一点嘛,所以说你会觉得说后面接中文的这个得分更高,对,然后有了这样一个更高和更低的这种区别,就相当于说你要去学的一个模型,就是说呃。我爱你后面接中国的得分,比如说是一分,我爱你后面接穿搭得分是00:05,然后有了这样的很多一分,00:05等等的这样一种方式,你去训练一个模型,然后他能够做到,就就是说,呃,你去问GBT一个问题,他给了你一个回答,那这个回答是多少分,你就可以预测出来了,那预测出他多少分有什么用呢?那其实就跟比如说。
35:13
呃,我们小时候学习一样,就说你当然是希望说你学习最终去考试拿分越高越好嘛,那现在相当于说已经给你搞出了一个评卷评分的一个老师,你相当来说只要去朝着那老师给你打分月告的地方去做,或者去考就OK了,所以第三步他做的事情就是说,呃,老师已经让你找出来了,那下一步你就让老师来纠正小孩子他的一个表达嘛,那小孩子就要去学的,呃。往老往配合老师的方式去学,或者说呃,老师你如果小孩子如果学,让老师给他打分更高,然后小孩子如果学好就去鼓励他,鼓励他就相当于给他奖励更高一点嘛,然后通过这样的方式的话,就可以让小孩子不断去朝着更好的方向去发展,那这个其实就是缺GBT它的一个训练的一个原理,当然其实他本身他没有把自己的技术方案公开出来,但是大家默认都是他是按照按照的他之前的一篇工作文章instruct gpt去做的,对,然后这个就是instruct gpt它的一个训练的一个三步走的一个方式。
36:19
OK,然后在前面呃,稍微介绍了一些,比如说去GB它的一个原理以后,然后我们再看一下,就是说在日常的一些,呃,不管说写写博客或创作的一个角度上面,然后我们如何可以在哪些维度去用这样的一些工具吧,对,然后第一个的话。呃,聊到一个场景是翻译,当然其实在说他的各种应用场景的时候,其实呃,我们要了解一件事情,说你要用好GP确的gpt,你的最重要的一点就是说你要学会如何写好你的一个提示词,然后这个提示词的话,其实大家随便一搜的话,也有各种各样的一些教程,这里其实也不详细展开了,然后这里举的一个例子,简单说就说你要告诉比如说TBT,你充当的一个任务是什么,你要做的是什么事情,然后有哪些限制啊,约束啊,以及说你最终希望他输出的格式是怎样子,然后他最终就可以给出你要的东西,当然你可以同时让他给你多种不同风格的一个翻译结果,这样都是OK的。
37:22
然后第二个的话,这个其实是我自己去自己去做了一套系统啊,然后这个系统的目的其实就是之前有聊到过说呃算法的它的一个进展实在太快,每天各种东西太多了,你不可能去呃逐个去读过嘛,所以说我去做一套系统,目的就是为了去把各种信息做一个速读,那这里的话其实主要做几个事情啊,就这也简单介绍一下,就是说呃,首先我会去像刚刚聊到就是我去爬各种不同平台上面一些热点的一些东西或新的一些研究,然后其实更多的会是一些论文或博客相关的吧,然后把这些东西爬下来后,可能会做一些文本的一些处理,然后会去做一些用AI来做一些文本的摘要,然后以及说呃,你有了一些文章后。
38:09
或者说有了这样一个论文后,你可以针对论文里的内容,让跟AI进行一些对话,来做一些交互式的这种提问回答也好,当然右上角这个不是我自己做,是现成的,也有这样很多这样的一个呃平台或工具,能够让你实现说你去跟呃,你想去阅读的一些文章去做一些交互式的这种提问回答的一个方式,然后以及说可以去做一些文本润色,这样都是OK的。然后这里的话就是举一个简单的例子啊,然后这个这个代码我只是从中随便摘了一下,然后便于大家可以简单的理解做什么事情,然后这里其实我们看最前面一个大的一个循for循环,其实就去便利,比如说你爬到一堆的一些链接,然后中间其实有两大步吧,就是两三步吧,比如说中间昨夜的那边有个做一个summarize,就是做一个对你的一个文章做总结嘛,下面一个trans就做一个翻译嘛,然后以及说会存一些,右边就是把这样一些东西给他存下来,然后右右边的这个图其实就是一个,呃,我们比如说拿到一篇最新的。
39:09
论文他快速就可产生这样的一个,呃,有图有文字的一个论文的一个概述的一个方式,用来速读对。然后另外就是说他也可以用来帮忙,比如说你要写一些博客,不知道呃怎么去写,怎么去组织你的一个结构,你可他来帮你写一些大纲,这些都是OK的,然后像这里举一个例子去写大纲,可以看到他写的其实也是很好的。然后以及说其实呃大模型或去了GP,他懂有知识肯定是远超呃不管说在座或者整个人类的水平的,因为他知道的基础实在太多了,所以说关于很多可能是基础方面东西,呃他的一个搜索效率或回答的效果可能比很多的搜索引擎你去搜到结果来的都要好,所以说你也可以把它当做一个呃基础知识的一个这样一个对话机器人来使用。
40:02
对,然后以及还有最后一点就是,呃,其实大家如果有写博客写文章的话,有时候不知道会不会遇到,就是说你写完那篇文章,你不知道起个什么。标题更能够做一个标题党,或者说大家点击可能会更高,这个时候你同样也可以用gpt来让他帮你起一个标题,然后你在还是可以跟他交互式,比如说左边那家写些标题,虽然花里胡哨,但是我觉得他多说一点,比如右边交要简便一点,他也给你简便了一下,再给出最后的一个结果。对,然后我今天的分享主要就这些,然后看大家有什么问题,谢谢。
我来说两句