00:03
大家好,欢迎来到腾讯云开发者社区,腾讯销售数据库团队共同打造的腾讯云销售数据库快速上手训练营第三节,然后在前面两个章节呢,我们都给大家去简单讲,简单介绍了一下,然后第一个部分我们给大家介绍到了向量以及向量检索技术以及向量数据库,第二节呢,我们可以给大家介绍到了我们腾讯云上线数据库的一些核心能力以及亮点,然后在后面的3节课呢,我们就会去给大家以实战的方式,然后去带大家实际上手以及体验我们腾讯像数据库提供的这种比较呃简单上手的这种可以看到效果的DEMO,然后也给大家去快速上手使用我们腾讯像数据库,然后在这里呢,我们下面就会切换到我们整个呃,代码和文档界面,先去给大家简单的去过一下。然后在我们的腾讯上数据库,整个啊官网的文档里面呢,我们可以看到其实我们已经上线了非常多的一些实践的教程,然后在本次的呃,后面三节课里面呢,我们都会以这种实践教程的形式,然后去带大家真正上手去体验我们的一个实践教程,以及使用上我们腾讯像数据库,然后在这一次的一个内容里面呢,我们是去用腾讯像数据库,以及加上我们的混员大模型,大模型去给大家快速搭建一个RARA应用实践,其实在之前的期天入门课程里面呢,我们也给大家去搭建了一个,但是下来之后我们也介绍一些用户的反馈,第一个是说可能呃咱们一个呃,流程还是比较复杂,第二个是里面都是一些代码的操作,可能会对一些呃,初学者或者是小白的一些用户,他们可能会比较比较不是那么友好,然后在这一次呢,我们也是用这种比较简单易上手的,就是能够让大家每个人都操作的懂的方式,然后去实现一个效果非常不错的,然后也可以。
01:52
呃,有这种可视化界面的一个,呃,大概的一个DEMO,然后在这里呢,也是我们的一个文档,后续呢,我们这个大概也可以是,呃,主动去帮官网文档上去查看这个文档的一些详细的信息,然后呃,这一次呢,我们这个文档,我们也是会参照这个文档里面的一些步骤,然后去进行一个配置,然后。
02:13
首先第一个步步骤的配置呢,就是我们去,呃,在我们腾讯云上去开通一个像数据库的实例,然后相信大家在之前的话,可能都有去开通过我们的一个免费测试版的实例,然后都是可以去正常使用的,然后在我们云上这里呢。也可以看到在这个页面的话呢,我们会有一些像数据库实例,然后后续的话呢,等会儿我会用我们已经有的这种像库,像数据库实例,然后去给大家去做一个。呃,相应的一个演示,然后再回到我们刚刚那个界面。在这个界面里面呢,我们呃核心呢,还是需要去下载,我们刚刚呃里面已经提供了这种压缩包,然后去把我们的源码给下载下来,然后在呃第二两个部分呢,我们也会去有这种DEMO文件的下载,我们也是给大家提供了一个PDFDEMO,还有我们C文件的一个DEMO,然后等会儿我们可以去快速的去上传,然后感受一下我们整个DEMO的一个效果。
03:13
然后接下来就让我们切换到。切换到整个代码界面,然后去给大家呃,实际的上手去搭建一下我们整个呃,腾讯数据库加会员大模型的一个IG应用。好,然后呃,刚刚呢,我们也是需要大家在那个文档里面把我们的呃源码给下载下来,然后下载下来解压之后呢,其实我们就可以得到在左侧非常多的。呃文件的信息,然后在这个里面呢,其实我们根据呃,大家如果能够看到文档的话呢,也可以根据文档一步一步的去进行操作,然后在这个里面呢,我也会去带大家去呃一步一步的去进行配置,然后核心的在这个里面,其实很多的一些呃逻辑或者是说功能,我们都已经去帮各位开发者去呃实现好了,就比如说我们刚刚提到了可能会有一些文档的上传操作,以及呃整整个和模型的搭配这一块的操作,其实我们都是已经在这个里呃给大家集成好了,然后大家只需要点进我们这一个呃项目里面,然后可以看到有个conf feed这个文件夹,然后文件夹下面呢,就是我们整个项目的配置,然后项目的配置呢,核心包含三个部分,那第一个部分是我们腾讯项库的配置部分,然后第二个部分呢,是们的model,就是我们的大模型的配置部分,然后第三个是我们启动了server,就是我们呃届时会在浏览器生成一个本地的链预览链接,然后我们可以去通过在呃网页里面去输入这个链接,以及加上我们端口。
04:38
去体验一下我们整个DEMO的一个效果。然后核心的我们仅需要去改的,如果是说呃咱们呃,对于模型这一块儿,呃,可能目前还没有去开通模型的服务,也可以去参考一下我们混员大模型在云上的一个开通的指南,同时呢,在我们刚刚的腾讯像数据库那篇的一个实践文档里面也有给大家去列举,就是怎么一步一步去把我们腾讯我们混员模型的服务给开通好。
05:05
然后在这里呢,我就不不去给大家演示整个在云上去开通像数据库实例,还有去开通我们模型服务的一个呃步骤了,然后同时在呃这些步骤里面呢,都可以去到我们的官网文档上去找到详细的一个步骤。然后在这里面,我们第一步核心要去配的就是我们项目数据库的一个连接地址,然后在这里面的话呢,呃,我们直接去把我们腾讯项数据库呃控材的一个地址粘贴过来,然后就放在这就可以了,然后同时呢,第二行的key就是我们的一个连接密钥,然后也可以在我们的腾讯云的控台上找到,然后我们也直接填到这里,然后第三行和第4行的话呢,其实是我们的,呃真正的去往我们相关数据库里面去创建实例,呃创建我们的数据库和创建表的一个库,呃库名和表名,然后我们这儿呢,都是以这种默认的test AI DB和test AI AI collection这种呃形式放在这儿的,如果是说咱们觉得这个名字不太合适的话,也可以主动去进行一个更换。
06:02
然后在呃模型配置这一方面呢,我们呃目前。主要接入的是混圆这个模型,然后我们去提供了呃三类一个模型的一个选择,然后我默默认选的话呢,是turbo这个模型,它的效果会好一些,然后下方第三行和第4行的secret ID和secret key呢,需要我们的用户到我们的控台界面上去把它给复制下来,然后在这里呢,我就直接把我自己账号的这个ID和key给粘贴过来。然后这里呢,就把我们的ID还有直接给从控制台上复制过来,然后整个呢,我们在配置这一块,呃,整个配置就已经完成了,其实大家也可以看到,就非常简单,然后。整体呢,配置的行数,其实就核心的就这4行,就一个我们像数据库的连接地址,还有我们的密钥,第二个的话就是模型的一个,呃,使用的一个ID和secret key.
07:00
然后在这里呢,我们呃配置完成之后呢,其实我们是需要去安装一些我们这个项目的一些依赖的,其实里面我们也使用到了一些其他的依赖,然后去把我们整个项目给跑起来,然后整个项目的依赖呢,我们也写到这个requirements这个文件夹,呃这个呃目录下呃这个文本里面,然后大家呢,也可以去使用啊PP install这个命令,然后PPP3,然后这个命令去把我们的呃一些依赖的包都给做,都给安装好,然后因为呢,我本身我本地是已经把这一些。依赖给安装好的,然后这里也只是大概给大家去执行一下,然后看一下这个效果。对,然后呃,这里安装好了之后呢,其实我们在。呃,后面的话呢,就相当于我们的配置和我们的呃一些依赖都已经安装好了,然后我们直接在我们的这个呃根目录像呢,就是我们这个文件夹document search DEMO这个根目录下呢,直接去执行这个python3.py,然后就可以把这个项目直接给跑起来。
08:02
对,然后呃,这个项目跑起来之后呢,其实我们就可以看到它会给到我们一个running的一个呃,Local的一个URL,然后这里可以看到跟我们的配置文件里面写的其实是一模一样的,就在7869这个端口号的,然后我们把这个地址复制一下,然后我们在浏览器里面打开。对,然后现在呢,我们就转到浏览器的界面,然后我们去填入我们刚刚复制过来的一个地址,就是这个7869的一个端口号,然后我们在本地的话呢,就可以看到这样一个界面,然后这样的界面呢,就对比之前我们给到的这种呃,纯代码去交互的一个DEMO,它的一个体验效果会好不少,然后在这个呃里面呢,我们就是把整个rag应用的全链路,我们都给大家去进行了一个封装,然后在第一个部分呢,就是我们的初始化知识库这一块。
09:00
初始化知知识库这一块呢,它会呃,在我们首次使用的时候,会要各位用户去帮忙点一下这个开始初始化,然后他会对应的去建立我们刚刚配置的这一个库名和表名,然后去呃支撑我们后续的一个使用。然后这第二个部分呢,就是我们知识上传,然后这个呃,后面介绍的时候,我会去给大家详细的讲解,然后还有第三个部分,就包含我们的景去,呃,我们的像数据库里面去进行相似性检索,然后还有第4个就是呃,用我们检索第三步检索回来的内容,再加上我们模型的能力去生成一个效果,然后这两步第三步和第4步可能大家现在还理解起来可能没那么清晰,到时候我实际演示的时候,大家就可以理解到这一个效果是什么样子的,然后接下来呢,我们就切换到第一个初始化知识库这儿,然后去给大家去看一下整个初始化的一个过程。大家可以看到,其实整个初始化的过程非常快,然后它实际上就是你去连接到我们刚刚那一个相应数据库的实例,然后去创建并初始化的我我们的一个数据库,还有数据表,然后其实这里的步骤就完成了,当你看到呃这一个提示的时候,其实整个初始化的过程就完成了,基本上就在一秒之内就可以完成,然后到我们呃第二步就是知识上传这一块呢。
10:14
就实际上是需要我们去把刚刚的在那个文档里面给到两,给到各位的两个文档,就一个是呃,我们的一个PDF的文件,然后另外一个的话呢,是我们的一个。耳的文件,然后我们就可以直接去点击这种上传,然后把它给拖在上上传上去。然后这里看到有2个,其实我们现在上传这个PDF的。然后整个上传的话呢,也是在后台,他会去交给数据库的A套件去进行我们PDF的一个内容识别,还有我们的一个解的过程,然后这个上传完成之后呢,你就可以看到,呃,在最后面呢,上传完成成功之后,就可以看到这样一段话,然后就相当于您可以就对这一个文档的内容去进行一些相关的提问了,然后我们可能还是还想去上传更多的,然后我们呃,再去上传一下刚刚的markdown这个文档。
11:07
然后如果后续有更多的一个文件呢,也可以去通过这种方式去进行一个界面上的快速上传,如果说要批量去进行上传的话呢,你也可以直接把这个DEMO,然后加载到本地之后去进行一些代码上的修改,然后就可以在本地去进行这种批量的一个上传。然后这里我们两个文档都上传完了之后呢,我们就到第三步,就是我们整个知识检索这一步,你看到整个知识检索这一步呢,呃,就是实际上就是跟我们去用这种对话类的产品是一样的,比如说我们去用会员啊,或者一些其他的大模型这种服务啊,是类似于一个交互的逻辑,然后在这个里面呢,我们刚刚上传了两个文档,然后这里我们也去简单的用一些已经,呃。比较明确的一些问题去提问他,比如说。因为我们刚刚上传了一篇文档,里面其实是包含了有一篇呃,腾讯会议的文档的,然后我们这儿可以去直接去提问腾讯会议如何加入会议,稍等一下。
12:08
然后我们点回撤之后呢,其实可以看到它的响应速度非常快,然后这一个步骤呢,它会直接去从我们的腾讯云上上数据库里面,把相关的TOP3的知识点都给召回回来,也为看到召回回来第一个知识点是呃入会的第一种方式,就是我们的会议号入号,第二种方式啊,第二个知识点的话,其实是稍微有一点不相关的,然后是我们的整个主页的这个介绍,然后因为主页介绍里面它包含了一后这一个呃加入会议的一个方式,所以说它其实也是在呃正常召回来的嘛,然后。还有一个入会的方式呢,其实也是包含了我们的一个邀请成员,其实也是相关的,站在语音这个层面上,然后可以看到呢,他会把TOP3的一个相关性的知识给召回回来。然后召回回来之后呢,其实这一步仅仅是召回,然后还不是rag跟模型搭配的部分,搭配的部分,如果是说我们要让模型去回复我们的问题的话呢,我们可以去把这一句话,然后。
13:01
丢到这一个我们的提问窗口里面去,然后他就可以去结合上我们刚刚的一个召回回来的知识,然后以这种对话的形式,可以看到以这种对话的形式,然后给咱们一个回复,然后这个是刚刚我们提问的腾讯会议如何加入会议这一个问题的一个答案。然后在这里它可能生成的内容会比较多,然后都是包含了我们去加入会议的一个办法,比如说我们输入会输入会议号啊,还有等等一些入会的一些选项啊,以及同时我们的呃相应的一个截图,就是在我们的文档里面的图,它也会以这种呃图文并茂的形式,然后给咱们返回回来,然后另外呢,我们也可以去问一下呃,腾讯销上数据库相关的一些问题,比如说我们这里去呃先去看一下呃,我们这个问题就是腾讯销上数据库如何构建大模型字库这一个。问题它可以其实也是会呃召回三条知识的,然后第一个知识呢,就是呃包含了我们如何构建大模型知识库这样一个知识点,然后其其他后面两个知识点呢,都是不相关的,然后其实跟这个问题相关的知识点就是第一个,也就是我们排名分数最高的这一个知识点,然后这个知识点呢也可以去。
14:14
呃,放到我们的这第4步,直接去用RG这个模式去进行,呃,一个回答,然后这这个回答呢,也可以看一下,他会去把我们刚刚的。这个背景知识,然后交给大运元模型,加上我们的query信息处理之后,然后得到一个给用户的一个回答,可以看到他可以告诉您,呃,我们去搭建这种呃服务的话呢,是分为这种方式的,然后具体有哪些需要注意的和相应的一个图片,然后他都会呃完整的返回来。对,因为这里可能后面呃,它生成的内容也会比较多,然后这个图片的话呢,我们是自己去做个处理的,他再把这个链接给过来,然后会渲染到我们的前端的页面上。然后另外呢,呃,我们也可以去问他更多的一些问题,以及我们啊,如果是上传了自己的一些文档的话呢,也可以去提问跟咱们文档相关的一些内容。
15:10
然后这节课呢,我们是去给大家演示了腾讯向量数据库,加上混源大模型,去搭建一个呃,Rag应用的DEMO。然后在这个里面呢,我们也是演示了这种从0~1的比较完整的从初始化知库到知识上传,然后再到我们的仅检索,然后再搭配上我们模型能力去给到用户一个比较好的回答的一个完整的演示。然后在这个里面呢,就是我们整个第三节课的一个内容,然后在下面一节课呢,我们会去给大家演示一下如何使用上我们腾讯项目数据库最新上线的两路检索的一个能力,以及说我们目前呃双重检索的一个能力,再配合上我们的embedding的功能,然后可以给大家的开发去节省多大的工作量,然后从而去提升大家的一个接入效率,然后请大家继续收看后面的一个课程,谢谢大家。
我来说两句