首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Wikidata】维基数据详解

【导读】维基数据(Wikidata)是一个具有超过4600万个数据项的维基数据库,本文介绍了利用SPARQL方法对维基数据进行查询等操作,以便大家对维基数据有更深入的了解。...Wikidata也是维基媒体基金会的一个项目。 尤其是: “Wikidata作为其维基媒体姊妹项目结构化数据的中央存储,包括维基百科(...)。”...可以将Wikidata看成具有超过4600万个数据项的维基数据库(2018年4月)。 根据维基媒体的使命,每个人都可以添加和编辑数据,并免费使用它。 ? ? ?...使用Wikidata查询服务作为端点为我们提供了以下结果: https://query.wikidata.org/ 现在,我们只能获得成员国的标识码。...在Wikipedia中打开法国以查看其Wikidata项目: ? 2. 检查WikiData项: ? 在这里,你只需将鼠标悬停在关系“成员”和“欧盟”项目上即可获得他们的标识码。

4.1K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    多语言互通:谷歌发布实体检索模型,涵盖超过100种语言和2000万个实体

    这个知识库收集了来自 Wikipedia, Wikidata 和 CIA World Factbook 的数千亿事实。...谷歌的研究人员使用了所谓的增强型双编码器检索模型(enhanced dual encoder retrieval models )和 WikiData 作为他们的知识库,这些知识库包括大量不同的实体。...WikiData 包含名称和简短的描述,通过与所有维基百科版本的紧密联系,它还将实体连接到从相应语言的维基百科页面提取出来的描述和其他特性当中。...研究人员从104种语言的与 WikiData 实体相关的大规模数据集中提取了6.84亿个 mention ,他们说这个数据集至少是以前只用英语进行实体链接工作时使用的数据集的六倍。...通过对 Wikipedia 和 WikiData 的操作,使用增强双编码检索模型和基于频率的评估实验提供了令人信服的证据,证明用一个涵盖100多种语言的单一模型来执行这项任务是可行的。

    85820

    自然语言处理学术速递

    本次调查主要关注四个主题:(1)链接数据集的Wikidata实体存在哪些,它们的使用范围有多广,以及它们是如何构建的?(2) Wikidata的特性对实体链接数据集的设计有影响吗?如果有,如何影响?...(3) 当前的实体链接方法如何利用Wikidata的特定特性?(4) 现有实体链接方法未利用哪些Wikidata特性?...这项调查显示,当前Wikidata特定实体链接数据集的注释方案与其他知识图(如DBpedia)的注释方案没有区别。因此,自然适合Wikidata的多语言和时间相关数据集的潜力并没有被释放。...此外,我们还表明,大多数实体链接方法使用Wikidata的方式与任何其他知识图使用Wikidata的方式相同,没有机会利用Wikidata特定的特性来提高质量。...许多方法还包括来自Wikipedia的信息,它很容易与Wikidata结合,并提供Wikidata所缺乏的有价值的文本信息。

    60320

    伯克利&清华从GPT等预训练语言模型中无监督构建出知识图谱!

    首先来简单介绍一下知识图谱: 现有大型知识图谱,诸如Wikidata、Yago、DBpedia,富含海量世界知识,并以结构化形式存储。...然而长期以来,知识图谱的构建通常基于手工标注,耗时耗力(例如Freebase和Wikidata)。...更进一步的,我们在更大规模的Wikidata上验证了我们的结果。 表3中实验结果表明,在更大规模的语料上,相比TAC KBP,MAMA取得了比开放信息抽取方法好得多的表现。...值得注意的是,Wikidata中知识的构建,很多并非从Wikipedia的文本得来,所以实验的F1表现要比小规模、完全从目标文本中构建的TAC KBP要低一些。...包含已经存在于现有Wikidata中的知识,例如,(鲍勃·迪伦,职业,歌手),(鲍勃·迪伦,获奖,格莱美终身成就奖),(鲍勃·迪伦,妻子,萨拉·朗兹)等。

    1.9K20

    手把手教学构建农业知识图谱:农业领域的信息检索+智能问答,命名实体识别,关系抽取,实体关系查询

    labels.txt: 5000多个手工标注的实体类别 predict_labels.txt: KNN算法预测的15W多个实体的类别 /wikidataSpider/wikidataProcessing/wikidata_relation.csv...: predict_labels.txt中实体在wikidata中对应的三元组关系 attributes.csv: 部分实体的属性(互动百科页面中直接得到) wikidataSpider/weatherData...导入完成后再把值改回去) 进入/wikidataSpider/wikidataProcessing中,将new_node.csv,wikidata_relation.csv,wikidata_relation2...c:NewNode) ASSERT c.title IS UNIQUE //导入hudongItem和新加入节点之间的关系 LOAD CSV WITH HEADERS FROM "file:///wikidata_relation2...CREATE (entity1)-[:RELATION { type: line.relation }]->(entity2) LOAD CSV WITH HEADERS FROM "file:///wikidata_relation.csv

    81120

    BERT的新草料!Google从知识图谱自动生成文本,预训练史诗级增强!

    文中使用的数据集主要是公开的英文知识图谱Wikidata KG,模型能够将其转换为自然语言文本,以创建一个合成语料库。...为了将 Wikidata KG 文本转换为合成的自然的、流畅的语句,Google还开发了一个名为Text from KG Generator(TEKGEN)的语言化管道,它由以下几个部分组成: 一个大型启发式构造的...、能够自动对齐 Wikipedia 和 Wikidata KG 三元组的训练语料库,一个将 KG 三元组转换为文本的文本到文本生成器(T5) ,一个生成三元组组合语言的实体子图创建器,以及一个消除低质量输出的后处理过滤器...输出结果是一个包含整个 Wikidata KG 作为自然文本的语料库,我们称之为知识增强语言模型语料库。它由大约18M 个句子组成,包含 约45M 个三元组和约 1500个关系。

    41130

    从语义网到知识图谱

    2012年发起的另一个重要项目是Wikidata,该项目最初是德国wikimedia协会的一个项目,由谷歌、 Yandex 和Allen人工智能研究所等机构资助。...Wikidata 基于与维基百科类似的想法,即众包信息。然而,维基百科提供了百科全书式的文本(以人类读者为主要消费者) ,Wikidata 则是关于创建可用于程序或其他项目的结构化数据。...例如,许多其他wikimedia包括维基百科,使用Wikidata提供一些信息,然后呈现给人类读者。...Wikidata已经拥有了超过6600万个的数据项,自项目启动以来已经进行了超过10亿次的编辑,并且有超过20000个活跃用户。...wikidata作为一个知识图谱也是开放共享的。相比之下,围绕知识图谱的活动往往是由行业主导的,而主要的应用并不是真正开放的。

    1.8K10
    领券