首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | 字节跳动等机构放大招,APM 解锁多链蛋白设计新姿势

AI+Drug 文献速递 | 字节跳动等机构放大招,APM 解锁多链蛋白设计新姿势

作者头像
用户1151118
发布2026-01-08 12:43:10
发布2026-01-08 12:43:10
760
举报

1. An All-Atom Generative Model for Designing Protein Complexes

期刊: arxiv 链接: https://arxiv.org/abs/2504.13075v1 代码: https://github.com/bytedance/apm

简介: 论文提出全原子蛋白质生成模型APM,能进行多链蛋白质建模、设计具有结合能力的蛋白质复合物等任务,且在下游应用表现出色。APM通过整合原子级信息,采用独特架构和训练方法,解决多链蛋白建模、全原子表示和序列结构依赖等挑战。实验使用来自PDB、Swiss-Prot、AFDB等的单链和多链数据,在单链和多链蛋白质相关任务及下游任务(如抗体和肽设计)中,APM与其他模型对比展现出优势。该研究为蛋白质复合物设计提供了新的有效工具,推动了蛋白质设计领域的发展。


2. CellFlow enables generative single-cell phenotype modeling with flow matching

期刊:biorxiv 链接: https://www.biorxiv.org/content/10.1101/2025.04.11.648220v1 代码: https://github.com/theislab/CellFlow, https://github.com/theislab/cellflow_reproducibility

简介:论文提出CellFlow框架,利用流匹配技术对单细胞表型进行建模,可预测多种扰动下的细胞表型。它将实验变量编码并聚合为条件嵌入,通过流匹配和最优传输学习映射关系。实验涵盖多种数据集,如PBMCs、斑马鱼胚胎等。在预测细胞因子反应、斑马鱼胚胎发育等任务中,CellFlow表现出色,能有效捕捉复杂细胞分布变化。该框架为单细胞表型研究提供了有力工具,有助于加速生物发现。


3. Biologically-informed Interpretable Deep Learning Framework for Phenotype Prediction and Gene Interaction Detection

期刊:biorxiv 链接: https://www.biorxiv.org/content/10.1101/2025.04.11.648325v1 代码: https://github.com/chequet/genepair

简介:本文介绍了GENEPAIR框架,用于解释基于基因组数据训练的深度学习模型,以检测基因与表型的关联及基因间相互作用。该框架通过特征消融量化基因特征对模型预测的影响。实验基于UK Biobank的BMI数据,构建DNN模型并与线性模型对比。结果表明,DNN在预测BMI上表现更优,且GENEPAIR识别出与BMI相关的基因和新的基因间相互作用。


4. Benchmarking Biopharmaceuticals Retrieval-Augmented Generation Evaluation

期刊: arxiv 链接: https://arxiv.org/abs/2504.12342v1

简介: 该论文提出生物制药检索增强生成评估(BRAGE)基准,用于评估大语言模型在生物制药领域的查询和参考理解能力(QRUC),并提出基于引用的分类方法量化QRUC。论文采用问答格式构建数据,从专家处收集开放式生物制药查询,利用LlamaIndex从PubMed和谷歌搜索结果中获取参考资料。实验在BRAGE上评估主流大语言模型,结果显示不同模型的QRUC存在明显差距,如Gemini-1.5-pro在英文部分宏观平均F1分数最高,且模型在不同查询类别上表现各异。


5. How to Detect and Defeat Molecular Mirage: A Metric-Driven Benchmark for Hallucination in LLM-based Molecular Comprehension

期刊: arxiv 链接: https://arxiv.org/abs/2504.12314v1

简介: 论文针对大语言模型在分子理解任务中的幻觉问题,分析其来源并提出Mol-Hallu评估指标和幻觉减少后处理阶段(HRPP)。通过分析PubChemQA数据集确定知识捷径会加剧幻觉,Mol-Hallu基于科学蕴含关系量化幻觉程度,HRPP利用幻觉敏感偏好数据集优化生成文本。实验以多种大语言模型为基线,在PubChemQA数据集上进行评估,结果表明各模型幻觉率在40-60%,HRPP能有效缓解幻觉。


6. Streamlining Biomedical Research with Specialized LLMs

期刊: arxiv 链接: https://arxiv.org/abs/2504.12341v1

简介: 文章提出将领域特定大语言模型PharmaGPT与多通道检索系统结合的Synapse Chat系统,能提供全面准确的生物医学响应。PharmaGPT经大量生物制药和化学领域语料训练,多通道检索系统整合多种数据检索方式。通过对比Synapse Chat和ChatGPT在信息相关性辨别任务中的表现,发现Synapse Chat在不同语言和噪声水平下更精准。此外,该系统在药物问答、化合物结构识别等方面表现出色。


7. Regular Time-series Generation using SGM

期刊:arxiv 链接: https://arxiv.org/abs/2301.08518v1

简介:该论文提出一种基于分数生成模型(SGMs)的时间序列合成方法TSGM,首次将SGMs应用于时间序列合成领域,并设计了新的去噪分数匹配机制。方法上,构建由编码器、解码器和条件分数网络组成的模型,通过训练学习条件对数似然的梯度。实验使用5个真实世界数据集,对比8个基线模型,以预测分数和判别分数为评估指标。结果显示,TSGM在多数情况下生成质量和多样性最佳。该研究为时间序列生成提供了新的有效方法,在相关领域具有重要应用价值。


8. Interpretable AI-driven Guidelines for Type 2 Diabetes Treatment from Observational Data

期刊: arxiv 链接: https://arxiv.org/abs/2504.12417v1

简介: 论文利用人工智能和优化方法,创建了精确、结构化且基于数据的2型糖尿病治疗进展指南。研究从波士顿医疗中心1998-2014年的患者就诊数据中筛选训练队列,用随机森林模型处理混杂偏差,训练树模型制定治疗方案,再组合成决策管道。在波士顿医疗中心和哈特福德医疗保健的外部数据集上测试,结果显示该管道使患者糖化血红蛋白(HbA1c)降低幅度比医生治疗方案更高。此研究为2型糖尿病治疗提供了可解释且有效的决策流程,有助于优化临床治疗。


9. QSAR-Lit: A No-Code Platform for Predictive QSAR Model Development - From Data Curation to Virtual Screening

期刊: Journal of the Brazilian Chemical Society 链接: https://dx.doi.org/10.21577/0103-5053.20250063 代码: https://github.com/LabMolUFG/QSARlit

简介: 论文介绍了QSAR-Lit这一创新的无代码综合工作流程平台,能从数据整理到虚拟筛选进行定量构效关系(QSAR)模型开发,解决了现有软件在数据准备和建模方面的不足。该平台基于Python的Streamlit框架开发,涵盖数据集整理、QSAR建模和虚拟筛选等功能模块,使用多种算法进行数据处理和模型训练。研究用来自Gene Tox数据库和ChEMBL的数据集进行测试,结果显示生成的模型预测性能良好。QSAR-Lit为药物研发提供了高效易用的工具,推动了相关领域的研究进展。


10. Deep‑ProBind: binding protein prediction with transformer‑based deep learning model

期刊: BMC Bioinformatics 链接: https://doi.org/10.1186/s12859-025-06101-8 代码: https://github.com/salman-khan-mrd/Deep-ProBind

简介: 文章提出Deep-ProBind模型,通过整合序列和结构信息预测蛋白质结合位点,解决传统方法准确性不足的问题。该模型利用Transformer和基于进化的注意力机制编码肽段,用SHAP算法选择特征,再由深度神经网络进行分类。实验使用来自文献的基准数据集,经十折交叉验证,模型在基准数据集上准确率达92.67%,在独立样本上达93.62%,优于现有模型。这表明Deep-ProBind在预测蛋白质结合肽方面可靠性高,为药物研发提供了有力支持。


11. Compositional Flows for 3D Molecule and Synthesis Pathway Co-design

期刊: arxiv 链接: https://arxiv.org/abs/2504.08051v1

简介: 本文提出组合生成流(CGFlow)框架,可在生成组合对象时对连续状态建模,应用于3D分子和合成途径共设计,实现了高结合亲和力和高采样效率。该框架由组合流和状态流交织而成,结合GFlowNets进行采样,并通过特定的训练目标进行优化。在LIT-PCBA和CrossDocked基准测试中,基于CGFlow的3DSynthFlow方法在亲和力、采样效率和合成成功率等方面表现出色。


12. HMAMP: Designing Highly Potent Antimicrobial Peptides Using a Hypervolume-Driven Multiobjective Deep Generative Model

期刊: Journal of Medicinal Chemistry 链接: https://doi.org/10.1021/acs.jmedchem.4c03073 代码: https://github.com/wl-wl/HMAMP-main

简介: 论文提出HMAMP方法,通过多目标优化设计具有理想属性的抗菌肽,解决传统方法在平衡抗菌肽多属性时的不足。该方法融合生成对抗网络和强化学习技术,利用超体积最大化概念训练模型,并通过微调预测模型获取帕累托前沿和膝点。实验使用多个数据库的数据集,对比五种基准方法,结果表明HMAMP生成的抗菌肽多样性和效力更高。该研究为抗菌肽设计提供了有效途径,推动了肽类抗生素的研发。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. An All-Atom Generative Model for Designing Protein Complexes
  • 2. CellFlow enables generative single-cell phenotype modeling with flow matching
  • 3. Biologically-informed Interpretable Deep Learning Framework for Phenotype Prediction and Gene Interaction Detection
  • 4. Benchmarking Biopharmaceuticals Retrieval-Augmented Generation Evaluation
  • 5. How to Detect and Defeat Molecular Mirage: A Metric-Driven Benchmark for Hallucination in LLM-based Molecular Comprehension
  • 6. Streamlining Biomedical Research with Specialized LLMs
  • 7. Regular Time-series Generation using SGM
  • 8. Interpretable AI-driven Guidelines for Type 2 Diabetes Treatment from Observational Data
  • 9. QSAR-Lit: A No-Code Platform for Predictive QSAR Model Development - From Data Curation to Virtual Screening
  • 10. Deep‑ProBind: binding protein prediction with transformer‑based deep learning model
  • 11. Compositional Flows for 3D Molecule and Synthesis Pathway Co-design
  • 12. HMAMP: Designing Highly Potent Antimicrobial Peptides Using a Hypervolume-Driven Multiobjective Deep Generative Model
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档