首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习破解疾病影响人体的密码

机器学习破解疾病影响人体的密码

原创
作者头像
用户11764306
发布2025-09-29 18:14:32
发布2025-09-29 18:14:32
930
举报

破解疾病影响人体的密码

计算机科学家Marinka Zitnik在其职业生涯早期曾面临一个生物医学谜题:在12,000个基因中,哪些基因在模型生物对细菌感染的反应中发挥作用?这堪称真正的"大海捞针"。

当Zitnik将她设计的机器学习算法应用于生物医学数据时,它预测了八个最可能涉及的基因。当这些候选基因在实验室进行测试时,研究团队发现其中六个确实与感染有关。她的方法取得了惊人的成功。

"作为一个当时接受计算机科学培训的人,能在另一个领域产生影响真是太有意义了,"Zitnik说,"这对我来说是一个转折点。"

这个转折点发生在2013年,引领了她十年来的机器学习研究,并最终使她成为哈佛医学院生物医学信息学的助理教授。在哈佛的Zitnik实验室,她专注于如何利用机器学习实现准确诊断以及新治疗方法的开发。

瓶颈与挑战

在Zitnik攻读博士期间,她发表了多篇机器学习论文,被各种生物医学机构的科学家阅读。许多人邀请她到实验室合作,将她的算法应用于他们的数据。

其中一个与德克萨斯州休斯顿贝勒医学院的合作特别令人鼓舞:12,000个基因的挑战。传统方法需要数千次筛选实验,依次测试每个基因。Zitnik算法的成功意味着节省了大量时间和资源。

"那是我第一次看到,将AI预测与实验室中的实验生物学工作相结合,可以将实验产量提高一个数量级,"Zitnik说。

治疗数据共享平台

更重要的是,Zitnik希望在全球范围内释放AI增强医学的潜力。从她早期与生物医学社区的合作中,她深知获取和整理高质量医学数据以训练机器学习模型的困难。

她通过某研究奖项,利用某弹性计算云和某机构机器学习部署工具,推出了治疗数据共享平台(TDC),这是一个国际倡议,旨在跨治疗模式和发现阶段访问和评估AI能力。

TDC的核心是专注于药物发现和开发的开源数据集和最先进的机器学习模型的集合,伴随着更广泛的资源和工具生态系统,包括尖端机器学习模型的基准测试和排行榜。

"这是生物医学和生物化学研究人员与机器学习科学家之间的交汇点,"Zitnik说,"这是一个蓬勃发展的社区。"

TDC是世界上同类最大的开源平台,涵盖了从识别潜在治疗分子到优化和规划实验室实验的整个药物发现和开发过程。

罕见病的帮助

Zitnik还热衷于利用她的技术帮助罕见病患者和临床医生。世界上有超过7,000种罕见疾病,她说。每种疾病的已知病例数很少,但总体上影响很多人。

为了开发常见疾病的诊断模型,通常需要数千名患者的数据,并标注该诊断。对于罕见疾病,这种标注的患者数据根本不存在。

"这个问题不能通过投入更多资金来解决,"Zitnik说,"它需要新的思维方式。"

相反,Zitnik和她的团队正在将医学原理和关于生物相互作用、化学、遗传学、患者症状和药物相互作用的先验科学知识纳入模型的神经架构中。

"这使我们能够使用非常少量的标记患者数据,有时甚至完全没有患者数据,来训练复杂的深度学习模型,"Zitnik说。

生物医学数据的云计算能力

云计算更广泛地对Zitnik实验室的工作至关重要。

"我们需要在许多不同类型的健康数据上反复训练我们的模型,确保它们在不同患者群体、不同化学结构等情况下表现良好,即使输入数据相对混乱,"Zitnik说。

除了推出TDC,Zitnik的某研究奖项还支持了离散研究项目。2021年,当COVID-19大流行在全球肆虐时,Zitnik和她的团队想知道AI方法在识别现有药物以重新用于治疗新兴病原体方面的效果如何。

与从头开发药物相比,识别已上市或处于后期临床试验阶段的药物可以节省多年时间,并可能节省数十亿美元。

级联网络效应

药物发现的一个成熟策略是利用分子对接。如果感染病原体需要与人类细胞表面的特定蛋白质对接才能增殖,那么与该蛋白质对接的治疗分子可能会阻断病原体的作用。

事实上,Zitnik的模型确实识别出一种与SARS-CoV-2靶向相同蛋白质结合的药物。但关键是——它还发现了76种通过间接系统效应成功减少病毒感染的药物。

"这项工作的最大成果之一是发现了这组似乎通过级联网络效应起作用的药物,间接影响了病毒攻击的蛋白质,"Zitnik说。"我们称这些为网络药物。如果没有如图神经网络这样的算法,它们能够使用基于生物医学知识的原理进行间接观察和推断,我们将无法识别这些药物。"

这种由生物医学AI驱动的新发现方法让Zitnik对未来感到兴奋。她看到了这些工具为个体细胞、疾病和患者生成更准确科学假设的潜力,并有助于弥合实验室与临床环境之间的差距。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 破解疾病影响人体的密码
  • 瓶颈与挑战
  • 治疗数据共享平台
  • 罕见病的帮助
  • 生物医学数据的云计算能力
  • 级联网络效应
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档