在今天召开的新闻发布会上,中国科学院对外发布“地球大数据科学工程”2018年度成果——地球大数据共享服务平台。
如今,科学数据的积累、开放、共享,已经成为世界科技发展的重要资源和推动力。地球大数据共享服务平台是集成多领域海量数据,服务数据驱动的科学发现与决策支持的科学平台。该平台以共享方式为全球用户提供系统、多元、动态、连续并具有全球唯一标识规范化的地球大数据,通过建立数据、计算与服务为一体的数据共享系统,推动形成地球科学数据共享新模式。目前共享数据总量约5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库 49万条数据记录、中国生物物种名录 360万条、微生物资源数据库42万条、组学数据目前在线10亿条。目前用户能够在线检索到40%数据,随着硬件条件不断完善,平台数据将陆续上线,并且每年将以3PB的数据量进行更新。
据了解,此次重点发布的是地球大数据共享服务平台的两个核心系统——数据共享服务系统、CASEarth Databank系统,以及一个区域系统——数字丝路地球大数据系统。
数据共享服务系统,是地球大数据专项数据资源发布及共享服务的门户窗口,目前能提供5PB数据的共享服务。该系统可提供项目分类、关键词检索、标签云过滤、数据关联推荐等多种数据发现模式,同时提供在线下载、应用程序编程接口访问等多种数据获取模式,支持可定制的多格式数据在线查看、预览和查询,并能够应对各种个性化需求,进行统计、收藏、推荐、下载和评价服务。数据共享服务系统采用全球唯一标识,随时随地精准定位与解析,是国内首次遵照国家标准《信息技术科学数据引用》(GB/T 35294-2017)在国家重大项目数据共享平台发布数据引用,为数据有序化关联及全生命周期管理提供保障。地球大数据专项汇交并对外发布的全部元数据,用户可以利用这个系统,根据数据共享权限进行共享服务。
CASEarth Databank系统,提供长时序的多源对地观测数据即得即用产品集,包括1986年中国遥感卫星地面站建设以来20万景(每景12种产品,共计240万个产品)的长时序陆地卫星数据产品,基于高分卫星1/2、资源3号卫星等国产高分辨率遥感卫星数据制作的2米分辨率动态全国一张图,利用高分卫星、陆地卫星等国内外卫星数据制作的30米分辨率动态全球一张图,以及重点区域的亚米级即得即用产品集等。该系统制定全球遥感数据产格网规范,自主研发了高效的对地观测数据引擎Databox,引入人工智能等先进技术,面向一般用户、行业用户和科学家用户,提供不同层次的对地观测数据分析与信息挖掘服务。未来,用户不仅可以利用其数据、计算和技术来实现应用,也可以上载多源数据,嵌入算法模型,并结合系统资源来完成特定的专题信息挖掘、知识发现和融合决策。
数字丝路地球大数据系统,包括“一带一路”区域资源、环境、气候、灾害、遗产等专题数据集94套、自主知识产权数据产品57类、共享数据超过120万亿字节。目前,该系统已具备千万亿字节级的软硬件环境,在国际上率先研发了通用大数据平台下地球大数据提取、转换与加载工具集,实现了6大类数据的检索、共享、产品可视化展现,并通过中、英、法等多语言版本在国际相关单位实施共享。
中科院副院长张亚平表示,致力于推动地球大数据实现从被动共享到主动共享的转变,从项目资源驱动到平台与服务驱动的转变,中科院力争在科学数据共享及其体制机制若干关键问题上取得实质性突破,为中科院乃至国家层面形成良好的数据共享新生态、新局面贡献智慧和力量。
(经济日报 记者:沈慧 责编:胡达闻)
领取专属 10元无门槛券
私享最新 技术干货