前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文速学-知识图谱从零开始构建实战:知识图谱搭建构架实践-知识展示

一文速学-知识图谱从零开始构建实战:知识图谱搭建构架实践-知识展示

原创
作者头像
fanstuck
发布2024-10-31 15:52:22
1252
发布2024-10-31 15:52:22
举报
文章被收录于专栏:大模型快速上手实践

前言

系列文章的上一篇我们已经进行了UIE抽取,非结构化知识抽取整理,转化。但是目前仅在于通过分词提取实体、属性、关系,还没有通过大模型来进一步高效率高精准度来提取这些关键字段,因此后续我们都整个流程优化空间都很大,最终我们的目标就是集成数据库以及大模型,对非结构化知识(包含图片,PDF等通过OCR算法识别)自动化抽取,再落库分发接口展示。目前我们需要进一步认识知识存储数据库,这里使用Neo4j进行讲解演示。如觉得项目有用请不吝支持。

Neo4j简介

1.1. 什么是Neo4j?

Neo4j 是一个开源的图数据库管理系统,它以图形结构存储数据,能够高效处理复杂的连接和关系数据。Neo4j 使用图数据模型来表示数据中的节点、边和属性,使其特别适合构建和存储知识图谱。

1.2. 知识图谱存储的发展历程

  • 早期数据库:在知识图谱发展的初期,数据存储主要依赖关系型数据库(如 MySQL、PostgreSQL),这些数据库以表格形式存储数据,强调数据的结构化。然而,随着数据复杂性的增加,传统的关系型数据库在处理复杂关系时效率显著降低。
  • 图数据库兴起:为了解决关系型数据库在处理复杂关联时的局限性,图数据库应运而生。图数据库以图形结构为基础,能够直接表示实体之间的关系,极大提高了查询效率和数据关联分析的能力。
  • 知识图谱的普及:随着自然语言处理、机器学习和大数据技术的发展,知识图谱成为数据分析、人工智能和推荐系统等领域的重要组成部分。图数据库如 Neo4j 也因此得到广泛应用,成为知识存储和管理的核心工具。

1.3.Neo4j的主要功能

图数据模型:Neo4j 以节点(Node)、关系(Relationship)和属性(Property)为基本构建块,可以灵活地表示复杂的数据结构。

Cypher 查询语言:Neo4j 的查询语言 Cypher 是一种用于图形数据操作的声明性语言,用户可以使用简单的语法进行复杂的查询、插入、更新和删除操作。

高性能:Neo4j 专为高效的图遍历设计,能够快速响应复杂的图查询,特别是在处理深层次的关系时。

图算法支持:Neo4j 提供多种图算法,支持社区检测、路径搜索、中心性分析等,帮助用户从数据中发现潜在的知识。

可视化与分析:Neo4j Browser 和 Bloom 提供了强大的可视化功能,使用户可以直观地查看图数据,便于分析和展示。

Neo4j安装和使用

2.1Neo4j安装

刚入门的话推荐先安装Neo4j的桌面版方便了解功能和使用,Neo4j Desktop附带了Neo4j图形数据库的开发者版许可证。开发人员版提供了Neo4j企业版的所有功能和特性,供个人在单台机器上进行开发使用。Neo4j Desktop不支持多机功能(例如集群)。

使用Neo4j Desktop,可以创建和管理计算机支持的任何数量的本地数据库。Neo4j数据库由数据库管理系统(DBMS)实例托管,从Neo4j 4.0开始,可以在给定的DBMS实例中拥有一个或多个数据库。由于Desktop可以运行当前支持的所有Neo4j数据库版本,可以选择创建一个或多个DBMS实例来维护不同的Neo4j版本,根据数据库包含的数据类型将数据库分开,或者实现特定的DBMS配置。可以管理DBMS的配置,添加插件,查看日志,备份和还原数据,升级Neo4j版本等,以获得运行Neo4j的完整生命周期。

Neo4j-Desktop下载,注意下载的地方不能有中文路径,注意和JAVA兼容的版本,Desktop与Java JDK版本17和11以及最新版本的Bloom、Browser和Neo4j Enterprise Edition捆绑在一起。

下载之后需要注册一个Neo4j的账号,注册完毕之后会给一个激活码

激活码粘贴到这个位置,激活就可以了。

代理设置

需要使用代理来访问互联网或访问外部网站,可以从侧边栏的“设置”菜单配置代理设置。设置代理有三种不同的方法:

  • HTTP
  • Local PAC file
  • Remote PAC file

2.2 Neo4j使用

Projects

可以创建本地数据库管理系统(DBMS),也可以连接到远程DBMS,并在项目中添加文件。Neo4j Desktop允许管理多个项目,并且可以通过拖放在不同项目之间轻松移动DBMS和文件。但是一次只能有一个活动的DBMS或远程连接。

项目中的每个DBMS都包含一个数据库列表,当选择DBMS时,该列表会展开。如果DBMS停止,数据库列表将被缓存。当启动DBMS时,列表会再次更新。但是对于新的DBMS,在DBMS首次成功启动之前,数据库列表不可用。

使用“新建”菜单在本地或从目录创建项目。还可以从存档中导入项目,示例从官方网站导入示例项目:

如果install下载不了的话可以配置一下代理,如果实在没有代理的话可以直接在github上面下载安装到本地,然后

拉取zip包即可,开启DBMS

DBMS

数据库管理系统(DBMS)是一个Neo4j服务器实例,它包含系统数据库和默认数据库的最小值。创建DBMS后,默认数据库称为neo4j,但您可以重命名它或创建一个新的数据库作为默认数据库。现有的DBMS也可以通过DBMS菜单访问。

当在项目中创建新的DBMS时,将使用默认版本的Neo4j。可以选择不同版本的Neo4j,但需要下载资源因此需要科学上网。插件是可以为DBMS启用的附加功能。

Neo4j Desktop可以直接查看和修改DBMS的设置。通过从“更多选项”菜单中选择“设置”:

但是对于大多数设置,修改需要重新启动DBMS才能使更改生效。同样,日志文件;debug.log、neo4j.log、query.log和security.log也可以直接从桌面的“更多选项”菜单中的“日志”中查看。这将打开一个单独的窗口,显示所选的日志文件。

内存配置

默认情况下,Desktop为每个创建的DBMS设置以下内存配置:

代码语言:shell
复制
dbms.memory.heap.initial_size=512m
dbms.memory.heap.max_size=1G
dbms.memory.pagecache.size=512m

远程连接

除了管理本地DBMS,Neo4j Desktop还允许连接到远程实例。例如这可以是在GCE、Aura上运行的实例,也可以是在本地网络上托管的实例。远程连接使用螺栓协议:

图形应用

有几种方法可以与图形交互。一种方法是使用图形应用程序,Desktop附带了此类应用程序的列表。其中两个是Neo4j浏览器和Neo4j Bloom,其他是Neo4j实验室支持的应用程序。Neo4j Browser和Bloom用于可视化和查询图形,但其他应用程序提供关系数据库的导入工具、监控工具和查询日志分析器等。

图形应用程序可以在桌面图形应用程序库中的列表中找到。

项目文件

除了添加DBMS,Desktop还允许将文件和文件夹添加到项目中。可以是Cypher文件和Neo4j浏览器指南,当单击它们时,它们都会在Neo4j浏览器中打开。此外还可以将数据库转储文件添加到此部分。转储文件可用于还原DBMS,从而将其添加到项目中。

要添加文件,您可以使用项目中的“添加”下拉菜单,也可以将文件拖放到“文件”部分。如果将文件放置在Project文件夹中,例如使用文件管理器或从命令行,Desktop会拾取它们并在本节中显示。下拉菜单允许您按名称、大小、创建日期、上次修改日期或上次打开日期过滤添加的文件和文件夹。

了解了一下Neo4j桌面版的操作之后,那么下一章我们开始进行Neo4j项目从0到1的部署和使用。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • Neo4j简介
    • 1.1. 什么是Neo4j?
      • 1.2. 知识图谱存储的发展历程
        • 1.3.Neo4j的主要功能
        • Neo4j安装和使用
          • 2.1Neo4j安装
            • 代理设置
          • 2.2 Neo4j使用
            • Projects
            • DBMS
            • 内存配置
            • 远程连接
            • 图形应用
            • 项目文件
        相关产品与服务
        大模型知识引擎
        大模型知识引擎(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大语言模型的知识应用构建平台,结合企业专属数据,提供知识问答等应用范式,更快更高效地完成大模型应用的构建,推动大语言模型在企业服务场景的应用落地。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档