首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

地球科学数据共享的挑战与实践

科学数据已渗透到科学研究的方方面面,科学数据已进入“大数据”时代。科学数据共享现今具有重要的意义和迫切的实际需求。进行科学数据共享,可以支持科学研究的再现和验证,也有助于研究者利用现有数据研究新的科学问题,更有助于提升科学研究和创新水平,促进科学的可持续发展。

但由于科学数据共享的复杂性,尤其是在地球科学领域,科学数据的收集、汇交、发布、共享、激励、评价等仍面临诸多挑战。

科学数据共享实践示意图

《地球科学数据共享的挑战与实践:以中国西部生态与环境科学数据中心为例》(王亮绪,李新著. —北京:科学出版社,2019.1)一书以地球科学数据共享为核心,在回顾科学数据共享发展历史的基础上,从研究科学数据共享的概念、内容与技术为起点,阐述科学数据共享的理念,以科学数据共享平台的设计与实现为工具,结合科学数据的汇交与共享具体实践,分析和评价科学数据共享的实际成效。

科学数据共享的简要框架

科学数据共享的本质就是科学数据的开放和共用,并使其在共享过程中发挥出更大的价值。为实现共享的本质目标,科学数据共享平台包括三个核心部分,即数据汇交和整理、数据管理以及数据发现和获取,分别针对数据提供者、科学数据中心以及数据用户,科学数据共享平台的核心任务就是满足这三类用户的实际需求。科学数据共享的动力主要有两个方面,即推动科学的发展以及寻求科学研究的再现和验证。而科学数据共享面临的挑战是多方面的,包括数据量的持续增长和数据存储的挑战、保证数据可持续共享的挑战、科学数据汇交的挑战、科学数据质量的挑战等。国内在科学数据共享方面也存在对应的挑战,同时存在其他问题,包括没有明确的科学数据汇交政策、不完善的科学数据共享体系、对数据的产权还不够重视等。

科学数据共享平台的整体框架

本书在分析科学数据共享需求的基础上,探讨了科学数据共享涉及的各利益相关者的实际利益需求,设计了一套用于实际业务的科学数据共享流程,包括数据共享流程、数据申请流程、离线申请管理流程以及数据发布流程,并定义了元数据评审和文献支持两种科学数据共享平台需要的扩展功能。以元数据为核心,对内联系科学数据实体,对外实现科学数据共享功能。以现有开源技术为基础实现了一套功能可扩展的科学数据共享平台,并在科学数据共享实践过程中逐步优化、调整相应的功能,核心功能覆盖了科学数据的发现、获取、发布和服务等,并以此数据共享平台为核心,扩展了科学数据共享的辅助功能,包括科学数据的知识挖掘功能以及科学数据库的对外共享功能,以应对科学数据共享的诸多挑战。

在进行科学数据共享实践过程中,本书介绍了三个具体的共享实践,即中国西部环境与生态科学数据中心的数据共享实践、黑河综合遥感联合试验的数据共享实践以及黑河计划数据管理中心的数据共享实践。在中国西部环境与生态科学数据中心的实践过程中,形成了一套适合科学数据共享的方法体系,包括保证科学数据的有效信息传递、保证科学数据共享中利益相关者的权益、保证科学数据共享的可持续发展等。在黑河综合遥感联合试验数据共享实践过程中,对共享系统进行了拓展,对科学数据及期刊文献进行了对应管理,并采用元数据分析方法介绍了黑河综合遥感联合试验的数据概貌。在黑河计划数据管理中心数据共享实践过程中,从制度和技术上实现了科学数据汇交支持,更加注重保护数据作者的权益,同时集成了黑河流域生态水文观测数据库,解决了黑河计划数据共享的实际挑战。

▲ “

黑河计划数据管理中心”实践案例样页

基于黑河综合遥感联合试验数据共享服务的实际成效,本书对科学数据共享的服务成效进行了探讨。在服务成效分析上,从用户申请的数据结果分析了用户申请数据的时间热点、空间热点以及主题热点,从申请数据的用户行为分析了用户的时间、单位、项目及其与黑河综合遥感联合试验项目组的关系。在文献分析方面,对黑河综合遥感联合试验数据产出的文献进行了分类,认为其包括专题文献、引证文献以及数据作者推荐文献三个类别,并从期刊来源、文献作者、研究主题三个方面进行了分析。同时针对黑河综合遥感联合试验专题分析了科学数据共享在提升文献引用方面的积极作用。利用定量化的访问、下载、引用数据,分析了黑河综合遥感联合试验数据集在共享时这三类定量数据之间的关系,并分析了从访问到下载、从下载到引用的统计规律。

最后,基于科学数据共享的实践结果,我们尝试总结科学数据共享的成效并评价科学数据共享过程。利用科学数据中心的成效分析数据,发现科学数据中心也存在马太效应和长尾效应。利用网络信息计量学方法和网站访问记录方法,评价了西部数据中心的共享成效。在这两个科学数据共享评价的实例基础上,我们参照期刊文献评价方法提出了一种面向数据的科学数据共享评价框架,定义了单一科学数据评价模型以及科学数据集合评价模型,并以西部数据中心的数据集和黑河综合遥感联合试验数据集为例探讨了科学数据共享评价实例。

伴随着大数据、云计算、语义网、关联科学等新技术的到来,国内外对元数据与科学数据共享的相关研究会更加深入,科学数据共享的能力会进一步增强。不过,科学数据共享仍将继续面对诸多挑战,包括如何吸引用户参与到科学共享的进程中、重视科学数据资源建设、提高知识挖掘能力、加强面向机器的科学数据共享服务、推动科学数据的出版和引用等。

sdfd

本文摘编自《地球科学数据共享的挑战与实践:以中国西部生态与环境科学数据中心为例》(王亮绪,李新著. —北京:科学出版社,2019.1)一书“前言”,有删减,文中插图来自该书正文,标题为编者所加。

(区域生态与环境过程系列丛书)

ISBN 978-7-03-059332-0

责任编辑:许 健

本书以地球科学数据共享为核心,以研究科学数据共享的概念、内容与技术为起点,阐述科学数据共享的理念,设计了一套用于科学数据中心业务的共享流程,包括数据共享流程、数据申请流程、离线申请管理流程以及数据发布流程,定义了元数据评审和文献支持两种科学数据共享平台需要的扩展功能。结合地球科学数据的汇交与共享,以3个具体的共享实践为例,阐述了地球科学数据共享的具体实践。并基于黑河综合遥感联合试验数据共享服务的实际成效来分析和评价地球科学数据共享,分析用户申请数据的时间热点、空间热点以及主题热点,对数据文献进行引证分析。

(本文编辑:刘四旦)

地球为你而转!

欢迎关注:赛杰奥(sci_geo)

科学出版社地球科学订阅号

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190116B0RID200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券