00:01
大家好,今天给大家介绍一下我们的开源项目前置平台q no, 希望通过这个视频能帮你轻松上手使用它。如果你对这个项目感兴趣,也欢迎点赞starfork。首先大家可以在GE或者geiarb中搜索no。打开我们的开源的一个项目地址。大家可以在这里下载我们的一个源码,在下载之前。请详细阅读我们的一个read me的一个文档。其中有完整的一个安装部署教程,以及相关的一些注意事项。啊,那我们开始本期视频的讲解,本期视频会基于我们的演示站。带大家初步了解一下我们签字平台的内容,对代码部分感兴趣的同学后续会有陆续的视频讲解,大家可以持续关注。接下来打开我们的演示站,输入账号密码登录。
01:08
目前。千支平台开源版本主要分为知识中心、知识抽取、知识应用、数据管理。啊,以及系统管理相关的监控相关的一些模块。首先呢,我们看到的是呃公制裁的界面,在这里可以直观的了解到系统的一些,然后实体的一些统计啊,关系统计,财运组统计啊,文件类型统计啊,近期的一些处语数量统计等等这一系列的统计概览项,然后帮助你更啊直观的了解到这个系统的一些数据情况,接下来我们看一下知识中心的模块。该模块主要是用于管理我们所有的一个知识,并为后续的知识抽取提供。数据来源首先我们需要将知识进行一个分类,目前这个分类是支持这个多层级的一个分类。
02:04
然后呢,我们就可以上上传相应类别的一些文件。啊,我们目前支持TXTBFXLSX。Do cxr csv这些主流的一个文件格式,同时呢也支持基础的预览。然后下载啊删除啊这些技术的文档操作。接下来我们看一下知识抽取模块。在抽取之前呢,我们需要先进行一个概念和关系的一个配置,那概念配置功能主要是为了告诉系统你需要抽取哪些类型的一个视频。举个例子,比如说我们需要抽取周杰伦啊,刘德华,比尔盖茨这些人物,你就需要配置一个啊人物的一个概念,同时呢,每个人物也有又会有一些自己的属性,比如说姓名啊,年龄啊,性别爱好等等的这些属性。
03:02
那我们概念配置好了之后,我们就可以对概念进行一个关系的配置,那这里我们需要选择一个起点,选择一个终点。这是提点,重点就是我们刚刚配置的关系,然后再配置我们啊这两者之间的一个关系,组成一个三元组,一个格式,后续呢,我们就可以根据这个配置的三元组进行一个抽取。好,接下来我们就可以进行知识抽取了。知识抽取又分为非结构化抽取和结构化抽取,我们先来看一下非结构化抽取。首先我们需要先添加一个啊,非计划抽取的一个任务。首先填写一下任务名称等基本信息。然后在直中心中选择一个我们需要抽取的一个文档,以及导入我们需要抽取的一个三元组。然后点击确定保存,然后就可以点击执行啊,提交任务,等待这个我们后台的异步抽取任务完成即可。
04:02
这里需要额外的说明一下,由于我们啊支持抽取的啊,占用资源较高,当前也是在不支持在线抽取,大家可以在本地部署抽取的一个服务进行体验。另外,当前开源版本使用的抽取工具为deep ke对抽取的实体类型及关系类型是有限。啊,也不能直接适用于所有的一个场景,所以在我们的商业版中使用的是大模型抽取,可以做到0样本,抽取结果呢,也更加的精准。如果大家有兴趣,可以联系我们的工作人员进行咨询。好,接下来我们就看一下它的一个抽取的一个结果。那么我们以上文件的抽取内容呢?会以图谱的形式展现。啊,那我们这个图包括一些放大缩小全屏啊,这些基础的一些徒步工具。啊,点击这个图谱的节点。
05:00
啊,也可以对节点的详细信息进行一个审查,如果说发现有问题的数据,也可以在这边进行编辑删除啊,这些操作啊,以保证图谱的一个准确性,最终呢,经过审查后的图谱,我们可以点击这个发布出去啊,目前这个图谱是以发布。有想法。然后我这边就是可以编辑了。然后发布出去之后呢。啊,就会啊,放到最终的一个图谱中。好,这个就是非计划抽取的内容,接下来我们看一下结果抽取。嗯,首先同样我们也是需要添加一个齐行万收取的一个任务的,也是啊,需要啊。填一下这样的任务名称啊,这些技术的一些信息,然后与飞机文化不同的是,我们需要去配置它的一个数据源啊,目前使用的是啊,本地的一个啊是不连接。
06:00
然后我们就可以导入啊,相关的一些这些表。啊,然后我们需要对表进行一个映射啊,我们现在用的MYSQL数据源,它的表映射到我们,呃,知识平台其实就是对应的一个概念。那它里面的字段呢,其实映射到我们这里面,就是我们刚刚配置的概念的属性。然后。然后我们概念属性配置完了之后啊,我们需要对它的一个关系,就是相当于我们的关联表的一个概念啊,关联表啊也进行一个映射,然后这些配置完了之后,同样也是提交啊这个任务啊进行一个抽取。然后同理我们抽取结果啊,跟我们的结构化抽取啊,非结构化抽取是类似的,这边我就不过多介绍了,同样也是只是发布操作,然后发布完了之后也是到我们最终的一个图中。
07:06
好,接下来我们看一下知识应用模块。啊,这是应用模块,这里就是我们刚才所说的一个最终的一个图谱,就是经过我们审核确认发布过没有问题的一个图谱。啊,我们就可以在这边进行一个整体的浏览和探索。啊,这里也额外说明一下,目前我们的开源版本对于知识的应用仅限于知识图谱的一个展现方式啊,当然了,关于知识图谱的应用远远不止这些,在我们的商业版中,已将知识图谱的数据全部交给了大模型。不同于传统的IG,我们使用了graph rag.模式啊,开发了这个。知识问答。只推荐值检索、知识服务等更多的功能,有兴趣的同学可以联系我们的工作人员进行咨询。
08:01
啊,接下来还有一个我们数据管理模块,这边就是我们上面结构啊,抽取所配置的一个数据源,就是在这里配置的,我们可以在这边啊配置一些数据源,这边都是一些。基础的数据库配置,我这边就不过多介绍了,然后还有一些系统的一些系统级别的相关功能啊。这边啊,我们就大概过一下了解一下即可。就是用户管理这边就是管理我们所有的一个用户角色管理这边是用于后续控制权限的一个地方。菜单管理这边就可以管理我们现在所有的一个菜单的一个情况。部门办理。没管理。字典管理单数所指通知公告。这些操作日志啊,登录日志啊,这些都是有的。还有系统监控,就是我们一些啊,结构化数据,非化数据的一些任务啊。数据的一些。
09:01
监控啊。服务监控。完成那些监控。啊,一些代码生成的一些工具。以上呢,就是我们。开源平台的核心模块。如果你觉得这个项目对你有帮助。欢一下。欢迎在这里start一下啊,也可以提交啊issue或者提交PR。我们一起共建,如果你有任何问题,也可以在评论区或者是我们的QQ交流群。又被加了一天,真的。啊,QQ教群留言我们会第一时间回复啊,感谢您的支持,我们下期见。
我来说两句