前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >清华大学生命科学学院张强锋教授:AI 理解生命科学的海量数据,解析复杂调控网络

清华大学生命科学学院张强锋教授:AI 理解生命科学的海量数据,解析复杂调控网络

作者头像
HyperAI超神经
发布2024-07-15 13:48:14
1050
发布2024-07-15 13:48:14
举报
文章被收录于专栏:HyperAI超神经

作者:田小幺

编辑:李姝,李宝珠

清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授在第六届北京智源大会的「AI for Science」论坛上以「当人工智能遇上生命科学」为题,分享了如何利用 AI 结合冷冻电镜实现蛋白质结构的解析。

「人工智能技术的进展,给生命科学带来了革命性的突破,能够让我们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络。」

在第六届北京智源大会的「AI for Science」论坛上,清华大学生命科学学院、清华-北大生命科学联合中心研究员、博导张强锋教授以「当人工智能遇上生命科学」为题,分享了如何利用 AI 结合冷冻电镜实现蛋白质结构的解析。

HyperAI超神经在不违原意的前提下,对张强锋教授的深度分享进行了整理汇总,以下是演讲实录。

AI for Science 是 AI 应用非常重要的方向之一。Science 需要理解这个世界,AI 可能是其中一个非常重要的途径,在这方面具有非常大的发展潜力。

我将为大家介绍 AI 和 Life Science 的发展历程与趋势,Life Science 是 Science 非常重要的一个门类,主要聚焦在生物医药方面。

生命科学发展历程

人们生活在这个世界上,青春和健康是所有人永恒的梦想,所有人都关心 Life Science。

这是高更的一幅画,画的是一个人一生的过程,从婴童到成年,再到最后步入老年,这个过程是每个人的必经之路,在这个过程中人们有各种各样的生命健康问题,而 Life Science 就是要理解生命健康的问题,并且寻找到一些疾病的应对方案。Life Science 发展历史悠久,可以说是自然科学里面最重要的分支之一。

客观来讲,人类从几百年前才真正进入科学时代,Life Science 的第一个发展阶段就是博物学时代,大家通过在地球上采集各种各样不同的物种、研究它们的关系,开始理解生命从何而来,这个阶段的发展顶峰应该是达尔文进化论的出现,可以看作是生命科学、生物学的 1.0 版。

进入现代以后,人们研究世界的视角开始走向微观,逐渐能够从分子、基因的角度理解宏观生物学背后的微观机制。所以,生命科学 2.0 版是分子生物学,它的顶峰是 DNA 双螺旋结构的发现和解析,人类借此才开始真正理解生命遗传的奥秘。

Francis Harry Compton Crick 不光解析了 DNA 双螺旋,还建立了中心法则,对生命科学有纲要性的指导。从 DNA 到 RNA 再到蛋白质,人们好像建立起了现代生命科学的大厦。而正像一百多年前,人们觉得已经建立了完美的物理学大厦,但却始终觉得有两朵乌云在物理学大厦上面飘荡。生命科学遇到的问题更复杂、更庞大。

现代生命科学在最近 20 年左右开始进入高速发展时代,产生了非常多的数据,包括不同组学、方面、层次、维度,从基因到细胞,再到组织、个体,可以说是真正的海量大数据。

这个时候,大家开始意识到生命科学研究的复杂性。例如一个基因可能受环境和其他基因的影响,一个基因如果发生变化也会影响到很多性状。人们研究一个基因的时候,会涉及到更加广泛的知识,所有基因和所有疾病或多或少都存在联系。正因如此,人们真切感受到了生命科学的复杂性,绝对不仅仅是中心法则就能概括的。

AI 解析复杂的生命科学

正如微积分推动了现代力学的建立,技术是推动科学进展的重要动力。类似的,我觉得生命科学的发展也需要有新的数学工具和新方法。人工智能的发展给生命科学带来了革命性的突破,能够让人们有机会理解生命科学的海量大数据、解析生命科学的复杂调控网络,也是研究生命现象、生命系统的强有力工具。

2016 年 3 月 15 日,AlphaGo 打败李世石,这是个历史的瞬间。我在机场听到这个新闻后,心潮澎湃地写下了一段话:A moment comes, which comes but never in human history, when the earth civilization steps out from the old to the new, when the human age starts to end, and when a new type of intelligence, to be long glorified, finds its first utterance.

今天我们所讲的人工智能,很多时候指的是以深度学习为代表的、比较狭义的技术,但其实人工智能本身是一个广义的定义。

大家之所以关注到了人工智能,主要是因为这十多年来其获得了突破性的进展,从最开始的图像识别,再到刚才提到的 AlphaGo,再到大家如今所熟知的 ChatGPT 等大语言模型。

AlphaFold 可以说是 AI for Science 最突出的代表,使用人工智能方法预测蛋白质结构,而且获得了接近于实验解析的准确度。所以,一定程度上可以认为,我们已经解决了蛋白质结构预测的问题。当然,各种各样的应用突破和科学突破的背后,依托的是丰富的技术进展。

回到生命科学本身,刚才说的 AlphaFold,也在去年获得 Lasker Award,历史上超过 50% 的 Lasker Award 都能够获得诺贝尔奖,我们也非常期待 AlphaFold 能够获得诺贝尔奖。

随着大语言模型的出现,人工智能进入到了一个新的发展阶段,从蛋白质设计到单细胞大模型的建立,甚至在基因表达调控网络解析方面,都已经产生了非常深远的影响。这些工作目前都在推进之中。

人工智能生物医学应该算是人工智能和生命医学的融合,会在各种不同的领域开枝散叶。

关于张强锋教授

张强锋教授

张强锋教授本科毕业于中国科学技术大学「少年班」,此后留校直到博士毕业,获得计算机博士学位。在 2006 年毕业的当年,27 岁的张强锋选择从零开始,远赴美国攻读哥伦比亚大学生物化学和分子生物物理系的博士学位,通过 5 年时间获得了第二个博士学位,随后在哥伦比亚大学和斯坦福大学医学院继续进行了 4 年的博士后工作。2015 年,张强锋回国任清华大学生命科学学院助理教授,2018 年至今任清华大学生命科学学院副教授,同时也是清华大学结构生物学高精尖创新中心 PI,曾获拜耳研究员奖、杨森研究员奖。

张强锋教授主要致力于新兴的人工智能和生命科学交叉领域研究,主要通过结合人工智能和大数据分析,进行结构生物学、基因组学、RNA 生物学等技术开发和科学问题研究,研究兴趣包括并不限于 RNA 结构组技术及算法、单细胞基因组测序技术及算法、基于冷冻电镜的蛋白质结构建模等。另外,张强锋教授还对一些人工智能算法开发特别感兴趣。特别是,现阶段人工智能方法能解决什么生命科学问题、生物医学数据的人工智能方法有哪些特殊的不同于其他人工智能领域之处、人工智能是否会带来生命科学研究的新的范式。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 HyperAI超神经 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 生命科学发展历程
  • AI 解析复杂的生命科学
  • 关于张强锋教授
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档