引述外媒报道,机器学习算法在生物多样性研究中比比皆是,但有时没有适当的归因或监督。为了提高学术水平,谷歌表示将为机构发布一个AI工作流,该工作流是与全球生物多样性信息设施(GBIF),iNaturalist和Visipedia合作开发的。
这家科技巨头的研究人员表示,该工作流将支持团队之间的数据聚合和协作,同时确保语料库遵循标准化的许可条款,使用兼容的文件格式,并为手头的任务提供公平,足够的数据覆盖范围。
“在物种识别中使用机器学习的希望正在实现,显示了其在生物多样性研究中的变革潜力,”来访教师Serge Belongie和Google Research工程总监Hartwig Adam在博客文章中写道,该博客与在莱顿举行的下次生物多样性大会相吻合,荷兰。“国际讲习班…以竞赛为特色,目的是开发出性能最佳的分类算法,从野生动物的照相机陷阱图像到植物标本室的压花样本。这些竞赛所产生的令人鼓舞的结果促使我们将生物多样性数据集和ML模型的可用性从车间规模扩展到了全球范围。”
工作流程将包括两个部分:由GBIF打包的数据集以及由Google和Visipedia训练和发布的模型。前者将经过审核,以确保它们满足基线许可证和引文要求,并且将通过数字对象标识符(用于唯一标识对象的持久标识符或句柄)进行发布,并通过国际标准化组织的DOI引文图表进行链接。同时,后者将在TensorFlow Hub(Google机器学习模型的公共存储库)中提供文档,并在其中附带有关出处,架构,许可信息等的信息以及在用户提供的交互式模型演示中运行图片。
Belongie和Adam说:“学术研究传统的核心是引用和归因惯例,因此,随着ML扩展到生命科学领域,它应该带来与这些惯例相对应的对等物。” “从更广泛的意义上讲,人们越来越意识到ML社区中道德,公平和透明的重要性。我们期待与全球机构合作,以实现[机器学习]对生物多样性的新的创新使用。”
领取专属 10元无门槛券
私享最新 技术干货