系列文章的上一篇我们已经进行了UIE抽取,非结构化知识抽取整理,转化。但是目前仅在于通过分词提取实体、属性、关系,还没有通过大模型来进一步高效率高精准度来提取这些关键字段,因此后续我们都整个流程优化空间都很大,最终我们的目标就是集成数据库以及大模型,对非结构化知识(包含图片,PDF等通过OCR算法识别)自动化抽取,再落库分发接口展示。目前我们需要进一步认识知识存储数据库,这里使用Neo4j进行讲解演示。如觉得项目有用请不吝支持。
Neo4j 是一个开源的图数据库管理系统,它以图形结构存储数据,能够高效处理复杂的连接和关系数据。Neo4j 使用图数据模型来表示数据中的节点、边和属性,使其特别适合构建和存储知识图谱。
图数据模型:Neo4j 以节点(Node)、关系(Relationship)和属性(Property)为基本构建块,可以灵活地表示复杂的数据结构。
Cypher 查询语言:Neo4j 的查询语言 Cypher 是一种用于图形数据操作的声明性语言,用户可以使用简单的语法进行复杂的查询、插入、更新和删除操作。
高性能:Neo4j 专为高效的图遍历设计,能够快速响应复杂的图查询,特别是在处理深层次的关系时。
图算法支持:Neo4j 提供多种图算法,支持社区检测、路径搜索、中心性分析等,帮助用户从数据中发现潜在的知识。
可视化与分析:Neo4j Browser 和 Bloom 提供了强大的可视化功能,使用户可以直观地查看图数据,便于分析和展示。
刚入门的话推荐先安装Neo4j的桌面版方便了解功能和使用,Neo4j Desktop附带了Neo4j图形数据库的开发者版许可证。开发人员版提供了Neo4j企业版的所有功能和特性,供个人在单台机器上进行开发使用。Neo4j Desktop不支持多机功能(例如集群)。
使用Neo4j Desktop,可以创建和管理计算机支持的任何数量的本地数据库。Neo4j数据库由数据库管理系统(DBMS)实例托管,从Neo4j 4.0开始,可以在给定的DBMS实例中拥有一个或多个数据库。由于Desktop可以运行当前支持的所有Neo4j数据库版本,可以选择创建一个或多个DBMS实例来维护不同的Neo4j版本,根据数据库包含的数据类型将数据库分开,或者实现特定的DBMS配置。可以管理DBMS的配置,添加插件,查看日志,备份和还原数据,升级Neo4j版本等,以获得运行Neo4j的完整生命周期。
Neo4j-Desktop下载,注意下载的地方不能有中文路径,注意和JAVA兼容的版本,Desktop与Java JDK版本17和11以及最新版本的Bloom、Browser和Neo4j Enterprise Edition捆绑在一起。
下载之后需要注册一个Neo4j的账号,注册完毕之后会给一个激活码
激活码粘贴到这个位置,激活就可以了。
需要使用代理来访问互联网或访问外部网站,可以从侧边栏的“设置”菜单配置代理设置。设置代理有三种不同的方法:
可以创建本地数据库管理系统(DBMS),也可以连接到远程DBMS,并在项目中添加文件。Neo4j Desktop允许管理多个项目,并且可以通过拖放在不同项目之间轻松移动DBMS和文件。但是一次只能有一个活动的DBMS或远程连接。
项目中的每个DBMS都包含一个数据库列表,当选择DBMS时,该列表会展开。如果DBMS停止,数据库列表将被缓存。当启动DBMS时,列表会再次更新。但是对于新的DBMS,在DBMS首次成功启动之前,数据库列表不可用。
使用“新建”菜单在本地或从目录创建项目。还可以从存档中导入项目,示例从官方网站导入示例项目:
如果install下载不了的话可以配置一下代理,如果实在没有代理的话可以直接在github上面下载安装到本地,然后
拉取zip包即可,开启DBMS
数据库管理系统(DBMS)是一个Neo4j服务器实例,它包含系统数据库和默认数据库的最小值。创建DBMS后,默认数据库称为neo4j,但您可以重命名它或创建一个新的数据库作为默认数据库。现有的DBMS也可以通过DBMS菜单访问。
当在项目中创建新的DBMS时,将使用默认版本的Neo4j。可以选择不同版本的Neo4j,但需要下载资源因此需要科学上网。插件是可以为DBMS启用的附加功能。
Neo4j Desktop可以直接查看和修改DBMS的设置。通过从“更多选项”菜单中选择“设置”:
但是对于大多数设置,修改需要重新启动DBMS才能使更改生效。同样,日志文件;debug.log、neo4j.log、query.log和security.log也可以直接从桌面的“更多选项”菜单中的“日志”中查看。这将打开一个单独的窗口,显示所选的日志文件。
默认情况下,Desktop为每个创建的DBMS设置以下内存配置:
dbms.memory.heap.initial_size=512m
dbms.memory.heap.max_size=1G
dbms.memory.pagecache.size=512m
除了管理本地DBMS,Neo4j Desktop还允许连接到远程实例。例如这可以是在GCE、Aura上运行的实例,也可以是在本地网络上托管的实例。远程连接使用螺栓协议:
有几种方法可以与图形交互。一种方法是使用图形应用程序,Desktop附带了此类应用程序的列表。其中两个是Neo4j浏览器和Neo4j Bloom,其他是Neo4j实验室支持的应用程序。Neo4j Browser和Bloom用于可视化和查询图形,但其他应用程序提供关系数据库的导入工具、监控工具和查询日志分析器等。
图形应用程序可以在桌面图形应用程序库中的列表中找到。
除了添加DBMS,Desktop还允许将文件和文件夹添加到项目中。可以是Cypher文件和Neo4j浏览器指南,当单击它们时,它们都会在Neo4j浏览器中打开。此外还可以将数据库转储文件添加到此部分。转储文件可用于还原DBMS,从而将其添加到项目中。
要添加文件,您可以使用项目中的“添加”下拉菜单,也可以将文件拖放到“文件”部分。如果将文件放置在Project文件夹中,例如使用文件管理器或从命令行,Desktop会拾取它们并在本节中显示。下拉菜单允许您按名称、大小、创建日期、上次修改日期或上次打开日期过滤添加的文件和文件夹。
了解了一下Neo4j桌面版的操作之后,那么下一章我们开始进行Neo4j项目从0到1的部署和使用。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。