首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AlphaFold3及其与AlphaFold2相比的改进

    蛋白质结构预测是生物化学中最重要的挑战之一。高精度的蛋白质结构对于药物发现至关重要。蛋白质结构预测始于20世纪50年代,随着计算方法和对蛋白质结构的认识不断增长。最初主要采用基于物理的方法和理论模型。当时的计算能力有限,这些模型往往难以成功地预测大多数蛋白质的结构。蛋白质结构模型的下一个发展阶段是同源建模,出现在20世纪70年代。这些模型依赖于同源序列具有相似结构的原理。通过将目标序列与已知结构的模板序列进行多序列比对,首次成功地确定了以前未解决的序列的结构。然而,这些模型的分辨率仍然有限。20世纪80年代出现了从头开始的方法,带来了下一个分辨率提升。这些方法应用了基于物理的技术和优化算法。结合计算技术的进步,这导致了蛋白质结构预测的显著改进。为了对所有这些新方法进行基准测试,从90年代初开始了蛋白质结构预测技术评估的关键阶段(CASP)系列活动。近年来,机器学习和深度学习技术已经越来越多地集成到蛋白质结构预测方法中,尤其是自2007年以来使用长短期记忆(LSTM)以来。

    01

    Bioinformatics | 通过可解释的深度学习预测蛋白质与多肽结合位点

    今天给大家介绍山东大学魏乐义教授等人在Bioinformatics期刊上发表的文章“Predicting protein-peptide binding residues via interpretable deep learning”。识别蛋白质与多肽的结合位点对于了解蛋白质功能机制和探索药物发现至关重要。尽管前人已经提出了许多相关的计算方法来解决这一问题,但这些方法大都高度依赖第三方工具或信息进行特征提取与设计,容易导致计算效率低下、预测性能不高。为了解决这一问题,作者提出了PepBCL,这是一种新的基于BERT的对比学习框架,仅基于蛋白质序列预测蛋白质-多肽结合位点。PepBCL是一个独立于特征设计的端到端的预测模型,在基准数据集上显著优于许多SOTA方法。此外,作者团队还探讨了PepBCL中注意力机制对于蛋白质结合区域中结合位点周围残基序列特征的挖掘能力,从而对模型如何预测结合位点进行了一定的解释。最后,为了方便研究人员使用,作者团队还搭建了一个在线预测平台作为所提出的PepBCL的实现,其服务可以访问如下网址:https://server.wei-group.net/PepBCL/。

    02

    Nat. Commun. | 借助机器学习设计和筛选合成细胞中新兴蛋白质功能

    今天为大家介绍的是来自Petra Schwille团队的一篇论文。最近,机器学习(ML)的应用为计算蛋白质设计领域带来了惊人的进步,使得针对工业和生物医药应用的蛋白质定向工程设计成为可能。然而,为细胞核心相关的新兴功能设计蛋白质,比如能够在时空上自组织并因此构建细胞空间的能力,仍然极具挑战。虽然在生成方面,条件生成模型和多状态设计正在兴起,但对于新兴功能而言,无论是计算上还是实验上,都缺乏专门为蛋白质设计项目所需的筛选方法。在这里作者展示了如何为机器学习生成的蛋白质变体实现这种筛选,这些蛋白质变体能在细胞内形成时空模式。对于计算筛选,作者采用了一种基于结构的分而治之方法来找到最有希望的候选者,而对于随后的体外筛选,作者使用了由自下而上的合成生物学建立的合成细胞模拟体。

    01

    N. Engl. J. Med. | 人工智能在分子医学中的应用

    新的方法,如基因组测序和质谱技术,大大增加了科学家和医疗专业人员获取更精确诊断和增强治疗精准度所需的分子数据的数量。虽然在DNA和RNA的基因测序方面取得了最大的进展,但蛋白质和代谢物高维度测量的医疗应用也在增加。为了适应这些分子“大数据”的数量、速度和多样性,分析工具也得到了改进。机器学习的出现被证明特别有价值。在这些方法中,计算机系统使用大量数据构建预测性统计模型,并通过整合新数据进行迭代改进。深度学习是机器学习的一个强大子集,其中包括使用深度神经网络,已在图像对象识别、语音识别、自动驾驶和虚拟助理等领域具有高知名度的应用。现在,这些方法正在医学领域应用,以提供临床指导性的医疗信息。在这篇综述文章中,作者简要描述了生成高维分子数据的方法,然后重点介绍了机器学习在这些数据的临床应用中扮演的关键角色。

    02

    【Mol Cell】解析顺式调控密码(二)

    顺式调控密码的最小单位——类似于遗传密码的密码子——是转录因子结合位点(TFBS)。转录因子通常包含结构化和进化保守的DNA结合域(DBD),它们识别并结合一个6-12个碱基对的DNA序列,称为转录因子的“基序”。转录因子基序通常用序列标志或位置权重矩阵(PWM)描述,以表示转录因子结合特异性的退化性。DBD的保守性和高通量测量转录因子序列特异性的方法使得约有1600个已编目的转录因子在人类中被识别,并确定了这些已知转录因子的结合基序。然而,转录因子结合基序无法完全预测大多数转录因子在体内的DNA结合。虽然大多数TFBS至少包含对其首选基序的部分匹配,但大多数转录因子仅在基因组的一小部分基序上发生结合。尽管可以通过包括核苷酸围绕核心基序或使用更复杂的序列偏好表示(如二核苷酸基序和DNA形状),来提高对某些转录因子基因组结合的预测,但对于大多数转录因子来说,对体内结合的最佳预测因子是染色质的可访问性,可以通过DNase-seq或ATAC-seq等高通量测序方法来测量。这种观察结果主要归因于DNA上核小体的存在,这些核小体必须被称为“先驱”因子或共结合转录因子组合所取代或排除。

    01

    【RNA】万字综述:生命的起源于RNA?

    达尔文的断言:“目前关于生命起源的思考纯粹是废话”,现在已经不再成立。通过综合生命起源(OoL)研究,从其开始到最近的发现,重点关注(i)原生物化学合成的原理证明和(ii)古代RNA世界的分子遗迹,我们提供了科学对OoL和RNA世界假说的全面最新描述。基于这些观察,我们巩固了这样的共识:RNA在编码蛋白质和DNA基因组之前演化,因此生物圈从一个RNA核心开始,在RNA转录和DNA复制之前产生了大部分的翻译装置和相关RNA结构。这支持了这样的结论:OoL是一个渐进的化学演化过程,涉及一系列介于原生物化学和最后的普遍共同祖先(LUCA)之间的过渡形式,其中RNA起到了核心作用,沿着这条路径的许多事件及其相对发生顺序是已知的。这一综合性合成的本质还扩展了以前的描述和概念,并应有助于提出关于古代RNA世界和OoL的未来问题和实验。

    02
    领券