一
论文题目:
Protein sequence design with a learned potential 论文摘要:
蛋白质序列设计的任务是几乎所有蛋白质工程问题的核心,在开发指导设计的能量函数方面已经付出了巨大的努力。在这里,作者研究了一个深度神经网络模型的能力,它可以自动设计蛋白质骨架上的序列,它直接从晶体结构数据中学习,没有任何人类指定的先验。该模型可推广到训练期间未见的拓扑结构,产生实验上稳定的设计。作者评估了该方法对一个新的TIM-barrel的可推广性。该模型产生了新的序列,两种设计的高分辨率晶体结构显示出与硅模型的一致性。研究结果证明了一个完全学习的蛋白质序列设计方法的可操作性。

论文链接:
https://www.nature.com/articles/s41467-022-28313-9 Github链接:
https://github.com/ProteinDesignLab/protein_seq_des
二
论文题目:
Combinatorial optimization of mRNA structure, stability, and translation for RNA-based therapeutics 论文摘要:
在包括 COVID-19 在内的多种人类疾病正在开发治疗性 mRNA 和疫苗。然而,它们的优化受到 mRNA 不稳定性和低效蛋白质表达的阻碍。作者描述了克服这些障碍的设计原则。我们开发了一个基于 RNA 测序的平台,称为 PERSIST-seq,以系统地描述细胞内 mRNA 稳定性、核糖体负载以及不同 mRNA 文库的溶液内稳定性。令人惊讶的是,与高核糖体负载相比,细胞内稳定性是蛋白质输出的更大驱动力。作者进一步介绍了一种称为 In-line-seq 的方法,适用于数千种不同的 RNA,它揭示了减轻水解降解的基于序列和结构的规则。研究结果表明,可以设计高度结构化的“超级文件夹”mRNA,通过假尿苷核苷修饰进一步增强稳定性和表达。研究证明了作者的工作是的 mRNA 稳定性和蛋白质表达的同时改善,并提供了计算实验平台。

论文地址:
https://www.nature.com/articles/s41467-022-28776-w 代码地址:
https://github.com/DasLab/openvaccine-CE-analysis
三
论文题目
摘要
低温电子显微镜 (cryo-EM) 已成为蛋白质结构测定的主要方法,但使用低温电子显微镜密度图准确模拟原子结构仍然具有挑战性。作者提出了一种混合方法,CR-I-TASSER(低温电磁迭代线程装配细化),它将深度神经网络学习与 I-TASSER 装配模拟相结合,用于自动低温电磁结构确定。该方法以具有模拟和实验密度图的 778 种蛋白质为基准,其中 CR-I-TASSER 为 643 个目标构建了具有正确折叠(模板建模 (TM) 得分 > 0.5)的模型,比其他一些目标中的最佳模型高 64%高分辨率数据样本的从头和基于细化的方法。详细数据分析表明,CR-I-TASSER 的主要优势在于基于深度学习的 Cα 位置预测,可显着提高线程模板质量,从而通过优化的片段组装模拟提高最终模型的准确性。这些结果证明了一种新的途径来确定冷冻电镜蛋白质结构,具有高精度和鲁棒性,涵盖各种目标类型和密度图分辨率。

论文地址
https://www.nature.com/articles/s41592-021-01389-9 代码地址
https://zhanggroup.org/CR-I-TASSER/download.html
四
论文题目:
Masked graph modeling for molecule generation 论文摘要:
从头开始,高通量分子设计是一个具有挑战性的问题,应用于药物发现和材料设计。作者引入了一个掩蔽图模型,该模型通过捕捉观察到的节点(原子)和边(键)上的条件分布来学习图上的分布。作者通过迭代掩蔽和替换初始化的图的不同部分来训练模型,然后对模型进行采样。作者使用GuacaMol分布学习基准来评估我们在QM9和ChEMBL数据集上的方法。作者发现有效性、KL-divergence和Fréchet ChemNet Distance分数与新颖性是反相关的,并且可以在这些指标之间进行比现有模型更有效的权衡。在分布度量上,模型优于先前提出的基于图的方法,并与基于smiles的方法具有竞争力。最后,作者展示了模型在保持与训练分布的物理化学相似性的情况下,生成具有特定属性的期望值的分子。

论文链接:
https://www.nature.com/articles/s41467-021-23415-2 github链接:
https://github.com/nyu-dl/dl4chem-mgm