首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

这个生物医学的谷歌搜索,能将数据变为救人性命的良药

NIH研究所一隅。图片来源:NIH

来源 Statnews

作者 Ruth Hailu

翻译 桑颂

编辑 魏潇

每年,美国国立卫生研究院(National Institutes of Health,NIH)都要花费数十亿美元用于生物医学研究,其内容涵盖了从细胞水平的基础研究到以人为对象的临床试验。这些研究结果发表在杂志或展示在学术会议上,而后研究者们会在这些发现的基础上继续开展下一个研究。

但是,这些数据被收集起来之后呢?我们能从中得到更多信息吗?如果我们将这么多年以来的所有研究数据集中起来,我们能获得一些对我们自身、所患疾病和可能的治疗方法的新认识吗?

生物医学领域的“Google”

NIH 在 2016 年发起了“生物医学数据翻译器”(Biomedical Data Translator)项目,其愿景是:为生物医学数据建立一个能够从数百个独立的数据源中筛选信息的“谷歌(Google)”,帮助研究者将不同格式和特点的数据集中的“点”连接起来

“现在能够获得的数据实在是太多了,出版物、数据库等等都可以……,而且人们很难在短时间内挖掘出所需信息并理解它们,”美国国家推进转化科学中心(National Center for Advancing Translational Sciences)的克里斯汀·科尔维斯(Christine Colvis)这样表示,他是这个项目的领导人。

该项目已经向美国19 个机构提供了约 1750 万美元的资助经费,希望可以整合多年来分布在各种平台上的、从电子医疗记录到基因组序列的各种数据,并使用新的机器学习工具对这些庞大的数据进行组织和梳理

这意味着翻译器项目和谷歌是不同的:它能够在之前没有关联的数据集之间建立联系。用科尔维斯的话来说,这个“翻译器可以发现 A 与 B 关联而 B 又与 C 关联……等等,并向你展示 A 与 Z 是如何通过超过 100 个数据源联系在一起的。”

“最聪明的人”的跨地域合作

科尔维斯表示,这个项目的规模和协作性是其特点之一,也是使其成功的部分原因。“翻译器”项目里的每个小组每周参与三到四次线上会议,并且每年举办两次“编程马拉松”——在这场“马拉松”里,所有的小组会用一周的时间聚在一起,面对面进行故障排除和想法讨论。

阿拉巴马大学伯明翰分校(University of Alabama at Birmingham,UAB)项目组的威尔·伯德(Will Byrd)认为:“这个项目实际上是一个技术可行性研究:首先,我们能否将不同数据源合并为一种通用内容,能够让使用者可以基于此对他们的问题进行检索?一旦解决了这个问题,接下来我们是否可以通过检索问题的答案,来推理出具体模型或潜在信息、为新药发明或者药物再利用做准备?这就是我们的愿景。”

这个项目招募成员的过程也不同寻常——想加入他们,你需要完成一系列“问题闯关”式的任务

“你可以登录项目网站并解答这些问题,每答对一个问题就可以解锁申请书 PDF 文档中的一页。答对所有问题,集齐完整的申请文档,你就可以提交了,”伯德说。“他们想招募能解决特定类型问题的小组。”

其中一些参与机构致力于数据架构,比如将各种数据集的格式标准化。

“目前的一个普遍问题是,我们收集来的数据库没有一个统一的格式——它们从未考虑过通用性,”伯德说。“ NIH 收集这些数据已经花费了数亿美元,但人们却无法访问它们。即便你是一位生物学家或物理科学家也不可能,除非你是编程专家。”

另一些人则负责为这项工作建立一个供研究者使用的平台,用以筛选信息、解释他们的检索结果——这些工作通常需要一个计算机科学家来做。这个平台可以帮助研究人员理解罕见疾病背后的机制并找到治疗方法,也有助于他们理解为什么特定的药物和化合物会起作用。

来自斯坦福大学(Stanford University)项目组的研究工程师斯特凡诺·伦西(Stefano Rensi)表示,他们小组的主要目标是创建一种工具,能够帮助制药界的研究人员浏览科学文献,更好地理解他们认为可能有效的化合物的生物学机制。

“也许你检索到了好几屏的医学文献信息而且挨个点开看了一遍,它大体上会告诉你什么化合物会起作用,但并不能告诉你它们为什么起作用,”伦西说。“你会惊叹于一次检索后出现的药物和化合物的数量,并发现自己根本不怎么清楚它们的作用原理。”

此外,还有一些直接致力于改善患者治疗效果的项目,如 UAB 开发的 AI 系统 mediKanren。这个团队的负责人马特·迈特(Matt Might)最近在这项 AI 成果的帮助下,找到了威胁他儿子生命的病因。

虽然这些机构的研究领域可能不同,但所有的参与者都强调了这个项目共同协作的重要性。

“这大概就像从一群全国最聪明的人那里得到了一份很棒的想法列表,”伦西说。

为了“共同的目标”

马萨诸塞州博德研究所(Broad Institute)的科学家保罗·克莱蒙斯(Paul Clemons)认为,小组之间的物理分隔使得优先顺序很难保持一致,但就算是大家在自己的单位独自工作,每周例会和编程马拉松也能帮助成员们集中在同一个大目标上。

“我们会允许那些可能推动整个项目里程碑式进展的事项优先执行,”克莱蒙斯说。“这是一种持续的平衡和优先顺序调整,能帮助我们所有人朝着同一目标前进。”

翻译器项目的目标是非常宏伟的,比如找到“拥有同一种症状,或者影响同一种类型细胞的所有疾病”,同时这些项目参与者也坚定地希望能够对患者的治疗手段进行持续改进。

“最终,我们希望拥有一个能够真正和人类推理争锋、可以推动治疗方法发展的系统,这样我们就能够更快地为更多患者获取更丰富的治疗手段,”科尔维斯说。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190822A0ANHG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券