(IANS)谷歌周四为科学界推出了一个新的搜索引擎,帮助他们理解数百万在线数据集。
这项称为数据集搜索的服务将帮助科学家,数据记者和极客找到他们的工作和故事所需的数据 - 或者只是为了满足他们的求知欲。
新的搜索引擎将像Google Scholar一样工作,该公司是学术研究和报告的热门搜索引擎。
“数据集搜索可让您在托管的任何地方找到数据集,无论是出版商的网站,数字图书馆还是作者的个人网页,”Google AI的研究科学家Natasha Noy在博客文章中说。
为了创建数据集搜索,Google为数据集提供商制定了指南,以便公司(和其他搜索引擎)可以更好地理解其网页内容的方式描述数据。
“这些指南包括有关数据集的重要信息:创建数据集的人员,发布时间,数据收集方式,使用数据的条款等等,”Noy说。
然后,Google会收集并链接此信息,分析同一数据集的不同版本的位置,并查找可能正在描述或讨论数据集的出版物。
“我们鼓励大大小小的数据集提供商采用这种通用标准,以便所有数据集都成为这个强大生态系统的一部分,”谷歌表示。
人们可以找到环境和社会科学中大多数数据集的参考,以及来自其他学科的数据,包括政府数据和新闻机构提供的数据,如ProPublica。
谷歌表示,数据集搜索可以使用多种语言支持其他语言。
领取专属 10元无门槛券
私享最新 技术干货