00:00
大家好,我是贺谦eo教育的CPU啊,说起eo教育可能我相信大家可能都没听说过啊呃,但我们的主要的产品叫class啊,相信孩子如果大一点可能都会用到啊,那我今天的分享呢,主要就是三个部分啊,一呢是公司以及我们的产品的介绍,第二呢。讲一下这个。AIGC在我们公司的这个探索的应用啊,最后呢,我也讲一下,就是我们对这个向量数据库未来发展的一个期待。那公司介绍呃,我们叫eo教育啊,Eo教育的这个名字来历呢,是因为我们最初创办的时候呢,想了一个口号啊,叫em power education online啊,简称呢就eo,这是我们公司注册的名字啊eo啊中中文呢,就取了这个英译叫eo教育。
01:03
那在。最初呢,我们思考说要要赋能这个教育行业啊,也是在那个差不多那个时候啊,各大厂商互联网厂家也提出这个产业互联网啊,那我们当时就想的比较大啊,我们想做这个教育产业互联网啊,当然做了几年以后呢,呃,我们觉得是他应该不叫教育行业啊。不叫教育产业了,应该叫教育产业链互联网啊,因为这个从头到尾涉及的特别多,这个以后后面讲一下啊,那那刚开始实力有限啊,我们只选了其中的一个点啊,就是这个在线教室啊,那从一四年开始,我们就做这个在线教室,这个产品叫class,他主要负责解决这个在线的或者远程的,呃,这个教育学的一个沟通问题啊。那当时呢,我们想的。
02:00
那个时候的音视频产品呢,都是类似呃,腾讯会议或者zoom这种啊,它是它是针对会议来设计的,那教育呢,他这个沟通的过程是更复杂啊,所以我们希望呢,它变得更高效,所以我们设计了一个呃全协同的。整个一个界面是全协同的,里边包括了协作文档啊,协作的矢量图编辑器啊,协作的窗口管理啊,我现在管它叫呃,一个全云端的应用层的操作系统啊,同时支持多人协作,且支持音视频,那这个就是定义定位的就比较大,所以我们做了好多年啊,实际上从一四年一直做到一九年。啊才才相对比较成熟,就class这一个产品,那这里边有很多的困难啊,那比如这个我们当时想打造全球联通的啊,既然在线嘛,就就大一点啊,做个全球联通的,呃,所以呢,就自建了这个IDC啊,并且呢,呃,随着时间的发展呢,我们和最初呢,就是和腾讯云啊打通了,那现在呢,已经和众多的这个公有云厂家打通了,我们现在呃,构建了一个混合云的。
03:15
一个服务体系,然后呢,软件层面呢,我们构建了这个,呃,为了支持class刚才的这些需求啊,我们构建了这个。基于云的RTC啊,云音视频的这个体系,然后呢,云通信的体系啊,做各种协同。协同引擎啊,那我们还做了这个分布式的云盘,以及这个呃,分布式的文档啊,协同文档啊,做这一系列的这个基础的呃技术,然后基于这些技术呢,最初呢,只构建了一个class这个产品啊,那当然现在已经比较多了啊,我们有这个T车啊。呃,在做,可能程序员比较多,一句话解释啊,叫get up for teachers啊,那程序员用get up共建项目啊,我们提这个产品呢,是说让老师们像get up的方式一样去更这个构建更多的课程。
04:11
那当然我们还有学习管理系统啊,还有notebook啊,是一个虚拟物理化学实验啊,这是我们收购来的公司,但是我们收购来之后呢,把它也改造成了可以全协同的了。那教育为什么说教育是个产业链呢?因为这个链条特别长,从业人数特别多,角色也很多啊,有出版社啊,教研机构啊,学校老师,学生家长啊,参与者众多,还有教学管理者啊,有教育部门啊。共同在这里边完成一件非常复杂的事情啊,那么过去呢,这个整个这个行业没有特别给他们做的这个各种产品啊,所以他们都用,呃,办公类的产品啊,通过解决方案。
05:01
把这些事情串起来啊,就非常的复杂,每每一家,每一个地方,每一个公司,每一个人,每个老师采用的方法可能都不一样啊,那我们现在就想把这个统一起来啊,让整个数据呀,流程体验啊。是是一体化啊,所以我们做的这个产品啊。内容包括就后面这个。这么多产品的一个有机组合啊,我们希望把整个这个产业链打的更加的通顺一点啊,从而实现这个全程的数字化。啊,进而AI时代到来呢,我们再把它升级的更加的智能化。那下面讲一下这个ATC在我们公司已经有哪些这个探索啊,那教育呢,刚前面也讲了它方方面面。链条特别长啊,但很多时候他有个共性啊,就这从从业的人大多数时候都是在做这个内容生成啊,那这一波的AI浪潮的爆发呢,也正好是AIGC啊,那么他理应可以。
06:13
用在这个教育产业链的方方面面。那我们目前呢,是有几个这个探索啊。第一个呢,是我们做一个学习助手啊这个。这是我们的一个界面啊,这个有点像微信哈,呃,左边呢,这是一个群。点开了这个群以后呢,这个右边有有聊天有课程,整个课程啊,类似慕课这样cosa这种慕课,他课程资料都在这个课程的这个页面。然后我们还支持拉上那个在线沟通的课,那么会产生很多的这个录像啊,那这个是在这个lesson这个里边。那录像呢,我们现在也会通过这个。
07:00
呃,AI的技术把它这个文字化啊。那么不管是这个聊天里产生的内容啊,课程里放进来的内容,还是上课产生的内容啊,还有一些其他的,我们把它全部都这个向量化啊,存入到这个,呃,向量数据库里面啊,那么我们目前这个新加了一个type,就AI助教啊,那这个呢,就可以提供给学生老师啊,用来针对。本课程下所有的内容来进行一个一个复习也好啊,问答也好啊,提供这么一个功能啊,那这个呢,就是。我们现在还没有发布这个产品哈,还在内测,正在跟那个腾讯云向量数据库进行紧密的这个合作,那这个其实对向量数据库我觉得提出了一些新的要求哈。后面再说。呃,刚才是第一页进来呢,我们有有几个问题啊,因为很多学生或者老师,他其实现在对这个AI还比较陌生,他不太会用啊,所以这里我们会变的。
08:09
变一些提示啊,告诉他可以这样使用AI。那么假设这个学生问了一个问题啊,那他问什么呢?说昨天老师讲的课的哪部分我没有听懂啊,那么我们通过向量数据库的这个向量检索,检索到对应的最匹配的内容啊,并通过AI的能力生成这么一个回答啊,同时呢,我们下面这部分呢。会把这个。引用的哪个内容,比如说哪个PDF的第几页,或者说某段视频,或者老师上课的视频的第几分钟啊。是引用了这些内容来回答的学生所提的问题啊,那么学生呢,就可以点这个链接。去打开对应的PDF。或者是当时的录像啊,然后进行这个。
09:02
学习和复习啊,这是这么一个产品。刚前面有个图说了,我们覆盖了很多产品哈,那这是我们flowing,是我们的,呃,一个内容生产流转。的一个工具啊,我个人定位呢是。呃,也是有点大哈,我我认为是OFFICE365的。弯道超车型的产品啊。那这个视频我是摁一下就能播吗?这是个视频。通过这个AI的集成,我们可以让他写这个全新的文档啊,并且格式呢,都我们已经处理好了啊,减少大家直接用大模型去拷来拷去再调格式的这个过程啊,那同时呢,还可以选中部分进行扩写,续写或者是修改风格等等。
10:17
这里只放了一个这个文档写作部分的这个能力啊,当然我们实际上写表格啊,已有的文章整理成表格啊,或者说空从从零开始生成PPT啊,或者已写已经写好的文章让他整理成PPT啊,这些功能都已经上线啊。呃,就是双11那天上线啊。网站呢是点CN啊可以直接体验。第三个产品呢,是呃,刚才跟那个百川智能的那个讲的很像啊,就是呃,还有那个销售易,就我们class呢,现在也已经比较复杂了,是一个比较庞大的一个产品啊。
11:03
那我们的客服工作也非常重啊,这个客服的培训啊,以及提供服务的这个效率,呃,都。都都需要这个AI的技术来加持啊,那我们内部呢。也重新自己做了一个这个东西啊。这也是个视频,我们可以看一下,但这个里边呢,也很多的用到了这个向量数据库啊,呃,因为我们一开始就是没有准备自己做啊,所以就用了这个腾讯云的向量数据库,那么这里边我们最大的工作就变成了去把原有的文档啊,全部重新全部重写,写成针对AI友好的方式啊,这个工作量是非常大啊,也有刚才这个销售易提到的这个问题啊,就更多的知识,更好的回答,实际上是存在于过去我们的用户产生的工单之中的啊,所以我们把这个文档。
12:01
呃,重新整理,然后甚至这个过去问的问题的faq全部都重新整理了。然后实现的这样的产品。好,最后呢,就是再回到咱们今天的主题啊,向量数据库。就是向量数据库的,它不是一个特别新的概念了啊,实际上很多年前就有了啊,但是他过去呢,主要是用在这个人脸识别啊,图像检索啊,推荐服务等等方面,他呢就是隐藏在这些。呃,这些功能的背后啊,我们大家其实很少讨论这个向量数据库啊,那么为什么现在又突然热了呢,或者是火了呢?啊,我觉得是跟这个大模型的一些缺陷啊,是有关的啊。呃,大模型现在呢,在智能上面是很强了啊,但是呢,刚才前面百川这边也讲,呃,他。
13:00
还需要很多这个这个外部知识的配合,实时实时知识的配合啊,那么这个一旦结合。一旦结合想把真的这个mi,呃,大模型呢,用起来以后呢,会发现原有的这个向量数据库啊,存在种种的限制啊,那比如说。比如说。呃,这个过去的这个香料出库,它是一个很大的一个空间啊,基本上就若干个索引啊,我们在一个很大的索引空间里搜索东西,那如果说我们class刚才是以班级群一个课程来回答问题,那么意味着我们。这个平台上有数百万个课程群啊,未来还会更多啊,那么那么向量数据库呢,没法提供,就过去的向量数据库没法提供非常多的这个索引啊,那么那么。
14:01
那我就只能把很多内容放到同一个索引里啊,这样会极大降低这个向量的搜索效率啊,所以呢,呃,这边跟腾讯云这边聊过是吧,我们也在这方面一起做一些,呃,这个探索和改进啊,那。前面新通院的领导也讲过,就说这个过去的向量数据库向未来发展大致有两个方向啊,一呢是。过去的这个向量数据库,把它升级的更适应于我们这种应用啊,那看起来就是要做这些分库分表啊,什么这些东西,这个看起来特别像过去的呃,单实例的数据库,把它变成分布式所要做的工具工作啊,那么还有一个还有一个方向呢,就是拿现在已有的各种成熟的呃分布式数据库。给他增加向量的支持啊,其实从我们现在这个浅显的认知和应用情况来看呢,呃,可能后面的这种呢。
15:07
反而是更加能够快速的实现我们的一些诉诉求的啊,那我相信对于腾讯这种大厂来说,可能两个方向都在探索啊。最后呢,我分享一个个人的看法哈,商业角度上,呃。通常来讲,一个高新技术的诞生,那么它都意味着成本是比较高的啊,那么他这种高新技术的。呃,走向应用的这个路线会是什么呢?啊,通常最先的是这个国防与安全啊,因为这一块呢,它是不计成本的投入啊,那接下来呢,就是暴利行业啊,暴利行业看怎么理解了啊,我这里写的这个黄赌毒啊,灰产黑产的啊,诈骗呀,是就我们平台上曾经有一段时间产生了很多的这个。
16:00
呃,诈骗的东西,后来我们也是引入了AI的能力,然后才把这个遏制住啊,曾经有一段时间,我们我们的class是全国第一大诈骗发声平台啊,呃,非常痛苦啊,然后呢,接下来是这个,呃娱乐行业,呃娱乐行业为什么排在第三呢?就是因为它有边际效应,比如说我用AI的能力生成了一个内容或者什么东西啊,它可以被呃数十万啊上百万的人来消费啊,他有边边际效应,所以他也能应用一些高新技术啊,那最后呢,实际上就是我们这类哈,就比较惨的啊,就是用户用一次。我就必须产生一次的价值啊,要么呢,就得我把这一次使用的成本降到足够低啊,相信这个腾讯云前面也讲了这一块啊,呃,腾讯云向量数据库在降低每次使用成本上面所做出的努力啊,这个呢就是对我们来说就是最好的消息啊,因为我们就希望呃,最低的成本。
17:05
啊,提供这个服务啊,因为我刚前面讲的这些应用,基本上都是用户单次使用,就必须产生这一次使用的这个价值啊,他有没有什么扩扩散啊,多次多人消费的这种价值啊,那这个就是我最后。对这个商业如何应用AI技术的一点呃,个人的感想,好,那我今天的分享就到这啊,谢谢大家。
我来说两句