网络地址转换(Network Address Translation,缩写为NAT),是一种在IP数据包通过路由器或防火墙时重写来源IP地址或目的IP地址的技术。
过去五年,基于深度学习(Deep Learning, DL)的从头分子生成方法迎来爆发式增长,仅报道的新方法就接近200种。代表性工作包括:
研究人员提出了一种整合多种计算方法的策略,用于在全蛋白组尺度上预测蛋白–蛋白相互作用,并构建功能网络。该方法融合了三类互补信息来源:基于三维结构的PrePPI方...
研究人员提出了一种名为 Sequence Display 的新型实验平台,可在单次实验中生成大规模蛋白序列–活性数据集。该方法通过将蛋白变体的功能活性编码为相邻...
单序列蛋白结构预测因无需依赖同源信息而具有重要应用价值,但其精度长期受限。研究人员提出TDFold,一种基于二维几何模板扩散的新方法,通过生成高质量的残基间几何...
Fadini, A., Li, M., McCoy, A.J. et al. AlphaFold as a prior: experimental struct...
蛋白语言模型产生的嵌入表示已成为连接序列与结构、功能等生物学任务的重要桥梁,但这些表示本身的可靠性长期未被系统评估。研究人员提出一种模型无关的方法,用于量化蛋白...
随着大语言模型驱动的智能体不断发展,其在自动化复杂任务和科学数据探索中的潜力日益凸显,但在生物医学数据分析领域仍受限于多工具调用和多步骤推理的复杂性。研究人员提...
计算辅助分子设计(Computational-Aided Molecular Design, CAMD)正在从"经验驱动"走向"数据驱动"。图神经网络(GNN)...
近年来,AI 驱动的蛋白质结构预测取得了里程碑式的进展。当前主流方法可归为两大范式:
研究人员提出了首个面向乳腺超声影像分析的基础生成模型 BUSGen,该模型在超过350万张乳腺超声图像上进行预训练,学习了丰富的乳腺解剖结构、病理特征以及临床变...
研究人员提出了一种基于血浆蛋白质组学的深度联合学习模型 ProtAIDe-Dx,用于同时诊断与痴呆相关的六种疾病。该模型基于超过17,000名个体的数据进行训练...
同源性搜索在计算生物学中具有基础性作用,它能够帮助研究人员识别生物序列之间的进化关系和功能相似性。然而,随着生物数据库规模的爆炸式增长,现有方法在效率和精度之间...
过去十年,图神经网络(GNN)和消息传递神经网络(MPNN)在学习图结构数据方面取得了突破性进展,成为分子物理、社会科学和经济学建模多体相互作用的主流工具。在分...
空间转录组技术为在组织原位解析基因表达提供了重要手段,但如何将二维切片数据整合为三维结构仍然是核心挑战。空间对齐,即基于空间坐标和基因表达信息对多个组织切片进行...
通过人工智能模型生成的合成数据正逐渐在医疗研究领域获得关注,尤其在血液学和肿瘤学等高风险领域。通过复制真实世界数据的统计特性、变量间关系及行为模式,合成数据集可...
随着科研论文数量的指数级增长,研究人员已难以全面掌握自身领域内的全部进展。研究人员探索利用大语言模型从材料科学文献中提取关键概念及其语义信息,构建概念图以发现人...
通用生物人工智能(GBAI)代表了一种对“生命语言”(即从DNA到细胞功能的信息流)进行建模的变革性方法。为此,哈佛大学医学院、斯克里普斯研究所等机构的研究人员...
研究人员致力于从头设计能够结合小分子的蛋白质,这一方向有望实现针对任意小分子的按需传感器构建。在本研究中,研究人员结合深度学习与基于物理的建模方法,构建了一类具...
蛋白语言模型在变异效应预测中展现出巨大潜力,但当前高性能方法通常需要结合结构、同源序列或群体遗传信息,导致模型复杂度增加且适用性受限。研究人员提出一种高效的协同...
随着单细胞转录组数据规模的快速增长,基于大规模预训练的基础模型正在成为网络生物学的重要工具。然而,模型规模的提升也带来了计算资源消耗的显著增加,限制了其在实际研...