BioJournal Link
【优质期刊】文献【泛读,精读】笔记。关注癌症,生信,多组学,数据库 ,科研工具,精准医学,临床研究,生物技术,计算机技能,大语言模型的应用。
326篇原创内容
公众号
Basic Information 英文标题:AI-driven discovery of synergistic drug combinations against pancreatic cancer 中文标题:基于人工智能 的胰腺癌协同药物组合发现 发表日期:29 April 2025 文章类型:Article 所属期刊:Nature Communications 文章作者:Mohsen Pourmousa | Alexey V. Zakharov 文章链接:https://www.nature.com/articles/s41467-025-56818-6 Abstract Para_01 胰腺癌治疗通常依赖于多药物方案,但最佳组合仍然不明确。 这项研究评估了预测方法,以利用来自 国家转化科学促进中心(NCATS)的数据识别协同药物组合。 对496种32种抗癌化合物的组合进行筛选,实验确定了协同作用和拮抗作用的程度。 三个研究小组(NCATS、北卡罗来纳大学和麻省理工学院)利用这些数据应用机器学习 (ML)方法,预测160万种组合的协同作用。 在88种测试中,有51种显示出协同作用,其中图卷积网络的命中率最高,随机森林的精度最高。 除了突出机器学习 的潜力外,这项工作还提供了307种实验验证的协同组合,证明了其在治疗胰腺癌中的实际影响。 Introduction Para_01 胰腺癌表现出显著的基因组异质性,研究发现平均有63种遗传异常出现在12个功能通路中。 胰腺导管腺癌(PDAC)是最常见的类型,由于其对系统治疗的异常抵抗性,与其他实体瘤相比,它带来了独特的治疗挑战。 过去十年中,胰腺癌的预后没有改善,由于耐药性的增加,治疗变得无效。 因此,发现具有高疗效和低毒性的抗胰腺癌药物至关重要,这也是肿瘤学界面临的最具挑战性的任务之一。 Para_02 药物组合已成为许多疾病的标准疗法,包括疟疾、HIV、结核病和癌症。 联合治疗可以带来诸如增强疗效、降低毒性以及避免单药治疗耐药性的优势。 在临床环境中已经发现了有效的药物组合。 同时,越来越多的非临床研究致力于识别协同作用的药物对。 已批准的药物具有已知的毒性特征和大规模可获得性,是这些发现的理想候选药物。 在胰腺癌背景下采用联合治疗可以应对疾病的异质性和适应性,从而提高治疗效果,并提供一种有希望克服耐药机制的策略。 尽管最近文献中报道了一些计算模型 ,但胰腺癌背景下组合协同作用的程度仍大多未被探索。 Para_03 由于可用和潜在的药物样分子数量庞大,可能的组合数量呈二次方增长,以及实验验证的耗时性,确定有效组合的过程仍然具有挑战性。 虽然组合的高通量筛选(HTS)是此任务的一种既定方法,但独特的化学组合数量庞大仍然限制了其效率。 这一挑战不仅适用于胰腺癌,也适用于许多需要联合治疗的疾病。 在此背景下,计算方法为高通量筛选(HTS)和体外筛选提供了一种高效的补充。 Para_04 定量结构-活性关系(QSAR)建模是最受欢迎的计算药物发现方法之一,它采用统计或机器学习 方法来建立和验证计算分子特征与分子实验测得生物活性之间的相关性。 这种方法在癌症药物发现中得到了广泛应用,使用的方法从简单的线性模型 到非线性机器学习 方法,如神经网络 (NN)、支持向量机(SVM)或随机森林(RF)。 历史上,QSAR研究主要集中在单药治疗上,但最近的进展已转向预测药物协同作用。 Cheng等人引入了一种基于QSAR的生物网络邻近度测量方法,用于预测高血压和癌症中的药物协同作用。 其他研究利用机器学习 和深度学习 技术进行协同作用预测,Preuer等人证明了深度学习 在大规模肿瘤筛选中的优越性。 DREAM AstraZeneca-Sanger药物组合预测挑战提供了一个全面的组合细胞系筛选数据集 ,包括分子数据,如体细胞突变、拷贝数变异、DNA甲基化和基因表达谱,以及化合物数据,包括潜在药物靶点和化学特性。 Jin等人引入了ComboNet,这是一种联合建模 分子结构和生物靶点的深度学习 架构。 该模型 预测了30种组合,测试显示在新冠背景下发现了两种协同组合(7%命中率)。 其他研究引入了计算方法,如DrugComboRanker、DIGRE和RACS,以有效预测用于实验验证的药物对。 这些方法依赖于各种数据类型,如已知的疾病通路相互作用、治疗后基因表达或药物-蛋白质相互作用,这可能限制它们的泛化能力和预测准确性。 Para_05 本研究汇集了三个独立团队——国家转化科学促进中心(NCATS)、北卡罗来纳大学教堂山分校(UNC)和麻省理工学院(MIT)——利用多种机器学习 方法,发现针对胰腺癌的新药物组合。 NCATS通过进行基于细胞的实验开始研究,筛选了1785种单药化合物,并确定了其中32种最有效的化合物。 NCATS随后筛选了496种组合,测试了这32种化合物的所有两两组合。 三支团队利用这496项筛选结果训练机器学习模型 ,各自从包含160万种组合的虚拟库中预测出前30种协同作用的组合。 最后,NCATS在基于细胞的实验中测试了预测组合的协同作用,结果显示各团队平均命中率为60%。 本研究不仅证明了机器学习模型 在预测协同作用方面的有效性,还报告了与PANC-1细胞相关的307种协同作用组合,这些组合涉及多种作用机制(MoAs)。 简要而言,结果部分呈现了所有发现,首先介绍数据概览,然后分别展示NCATS、UNC和MIT的建模结果。 随后,该部分对预测的组合进行了实验验证,并探讨了针对PANC-1细胞最协同组合的生物学相关性。 讨论部分涵盖了研究的计算和实验方面。 Results Data overview 数据概览
Para_01 图1展示了本研究中工作流程的概述,结合了计算和实验方法。 三种不同的建模方法导致了88种组合的提名。 Fig. 1: Workflow illustrating the combination of computation and experiment to discover synergistic drug combinations.
- 图片说明
◉ 从MIPE4库中筛选的1785种单药化合物在PANC-1细胞中进行了高通量筛选,发现了32种活性化合物。◉ 这32种化合物的所有两两组合产生了496种组合的协同作用数据。◉ 这些协同作用数据被三个机器学习 团队用作训练数据集 。◉ NCATS使用了随机森林(RF)、XGBoost和深度神经网络 (DNN);UNC使用了RF、梯度提升、DNN和图卷积网络(GCN);MIT使用了GCN。◉ 训练特征包括分子描述符,如Avalon和Morgan指纹、RDKit描述符以及生物特征。◉ 模型 预测了160万种虚拟药物组合的协同作用,每个团队选出的前30种组合在PANC-1细胞中进行了实验验证,平均命中率为60%。
Para_02 该研究首先从1,785种化合物的库中选择了32种化合物。 图2a展示了这些化合物在PANC-1细胞检测中的单药剂量-反应曲线中的活性分布。 IC50值范围在2 nM到3 µM之间,表明活性值存在差异。 对32种化合物的所有可能两两组合进行筛选,通过滴定生成10×10矩阵,产生了包含496种组合的建模数据集 。 进行重复检测使得能够分析多个协同效应指标的检测结果可重复性(补充表1)。 图2b和补充图1展示了gamma、beta和Excess HSA评分的相关性。 虽然所有指标都确认了检测结果和矩阵筛选技术的可重复性,但gamma评分的更高相关性导致其被选为协同效应指标。 机器学习 使用每种组合的平均gamma评分进行模型 训练。除了gamma评分外,训练数据还包括化合物的SMILES表示、IC50值和作用机制。 Fig. 2: Analysis of the variation and reproducibility of PANC-1 training dataset.
- 图片说明
◉ 32种化合物在单药剂量-反应曲线中的活性变化。◉ Log(IC50)的范围在−8.7到−5.5之间(约2 nM−3 µM)。◉ 实验的可重复性。496种组合在两次重复中的Gamma值具有0.83的皮尔逊相关系数。◉ Gamma值小于0.95的组合被认为是协同作用的。◉ 其他协同作用指标的类似图表见补充图1。◉ 源数据以源数据文件 的形式提供。
Para_03 本研究专注于识别协同组合,而不考虑加性与拮抗之间的区别。 每个小组都使用了自己的方法开发模型 ,无论是通过使用训练数据中的gamma分数,还是从IC50值中创建定制的协同度量标准。 然而,该研究定义了一个精确的阈值来评估模型 在前瞻性实验中的性能:gamma分数低于0.95表示协同作用,而分数高于0.95则表示非协同作用。 Para_04 1785种化合物的原始库产生了1,592,220种组合。 排除训练集中的496种组合后,测试集的总数减少到1,591,724种组合。 尽管测试集省略了训练集中的特定组合,但它仍然包括涉及该集合中化合物的组合。 测试数据集 包含SMILES表示、IC50值和MoAs,但不包含gamma值。 建模工作集中在对测试组合的协同作用进行预测,然后再进行实验验证。 三个独立的研究小组分别进行了建模方法,每个小组都提供了三份排名前30的协同组合列表。 所选组合经过实验测试以评估模型 的准确性。 NCATS modeling results NCATS建模结果
Para_01 补充表2提供了关于模型 的详细统计信息。 交叉验证方案遵循了一化合物出局的方法,导致了32个分割。 当使用相似的描述符类型时,没有一种机器学习 方法(RF、XGBoost和DNN)优于其他方法。 另一方面,仅使用Avalon或Morgan指纹的RF和XGBoost模型 在接收者操作特征(ROC)图中的曲线下面积(AUC)值显著高于仅使用RDKit或内部描述符的模型 。 大多数模型 结合了多种描述符类型,AUC值接近75%。 然而,组合方法相比单独使用单一指纹并未提高性能。 表现最好的模型 使用了Avalon-2048指纹,并结合了RF分类与回归,获得了0.78 ± 0.09的AUC(图3)。 该模型 预测并选择了具有最高协同概率的前30种化合物。 Fig. 3: NCATS’ random forest models to predict Gamma.
- 图片说明
◉ 训练集包括由32种药物(全部与全部)组成的496种组合。◉ 交叉验证策略是逐一化合物排除,因此有32个折叠。◉ 每对的Avalon 2048指纹的平均值将组合特征化为一个2048维向量。◉ 回归。◉ 该图叠加了32个验证集的预测结果(每个折叠中保留的),皮尔逊系数为0.52。◉ 分类。◉ 模型 生成了32个ROC图(为清晰起见未显示),平均AUC和标准差分别为0.78 ± 0.09。◉ 蓝色线条,平均ROC图;灰色区域,±1个标准差;红色虚线,随机预测基准;Gamma < 0.95,协同作用;Gamma ≥ 0.95,非协同作用。◉ Morgan 2048和RDKit描述符的类似图表见补充图2和3。◉ 源数据已作为源数据文件 提供。
UNC modeling results UNC建模结果
Para_01 补充表3提供了有关模型 的详细统计数据。 两种交叉验证方法评估了模型 的性能,一种是单化合物排除验证,另一种是全部排除验证。 单化合物排除策略评估的是包含一个训练化合物和一个非训练化合物的组合,结果大多数模型 的正确分类率在0.6到0.65之间,阳性预测值在0.6到0.7之间。 全部排除策略评估的是不包含任何训练化合物的组合,产生的正确分类率在0.5到0.55之间,阳性预测值在0.5到0.6之间。 这种差异反映了全部排除策略的额外挑战。 两种策略的Y随机化产生了与随机预测一致的验证统计结果。 Para_02 在化学表示中包含实验IC50值的模型 并未显著优于未包含这些值的模型 。 此外,描述符组成策略(无论是对列进行平均还是求和)在基于描述符的模型 中表现相似。 Para_03 UNC 使用仅描述符开发了三个模型 ,并开发了两个结合描述符和 IC50 数据的模型 。 共识模型 预测是通过将三个描述符共识模型 预测和两个描述符 + IC50 个体模型 预测取平均值得到的。 排名前 30 的推荐组合并非直接来自 共识模型 或仅描述符模型 的前 30 名排名列表。 相反,除了模型 预测外,选择过程还遵循三个补充标准。 表 1 列出了这三个相互排斥的选择层级。 测试集化合物的 IC50 值作为其中一个标准。 另一个要求是配对中的一类化合物存在于训练集中。 第三个标准确保该组合对应于训练集中最协同作用机制的配对。 Table 1 UNC nomination strategy. Each successive tier nominates combinations not previously nominated by an earlier tier, ensuring the tiers remain mutually exclusive 表1 UNC提名策略。每一层依次提名之前未被更早一层提名的组合,从而确保各层之间互斥
Para_04 根据这些标准,第一层级包括共识得分高于0.7的组合,两个活性化合物,一个训练集中的化合物以及协同作用机制对,共得到12种组合。 第二层级通过仅描述符预测选择排名靠前的组合,包含两个活性化合物,一个训练集中的化合物,没有协同作用机制对,又增加了12种组合。 第三层级通过共识模型 排名选出前六种组合,包含两个活性化合物,没有来自 训练集的化合物,以及协同作用机制对。 MIT modeling results MIT建模结果
Para_01 补充图4展示了图卷积模型 的ROC曲线,该模型 在五种不同随机划分的平均测试AUC为0.840 ± 0.036。 补充表4列出了每种划分的AUC值。 补充图5显示了预测协同评分的分布情况,补充图6突出了最常出现的化合物及其平均协同评分。 该模型 预测了1,591,724种组合的协同评分,并通过限制每种化合物最终选择前五种组合来确保多样性,从而选出了前30种组合。 没有一种化合物出现在超过五种组合中。 Experimental validation of predictions 预测的实验验证
Para_01 每个机构独立提出了用于测试的前30种组合列表。 图4展示了每个机构选择的化合物组合。 这些列表重叠极少,突显了它们开发过程的独立性。 只有两种组合同时出现在MIT和UNC的前30项选择中。 对88种独特组合的实验测试涉及在PANC-1细胞系检测中的重复测量,使用滴定法生成10 × 10剂量-反应矩阵,类似于为机器学习 训练生成数据。 Fig. 4: Predicted synergy of unseen combinations by three independent models.
- 图片说明
◉ NCATS,(b) UNC,(c) MIT。每个机构提名了30种组合,导致对称矩阵中每种组合产生60个协同值。◉ 体素表示在化合物1和化合物2轴上的化合物之间的得分。◉ 颜色条表示各团队采用的不同协同得分范围。◉ 为了清晰起见,省略了化合物名称,可在源数据中找到,作为源数据文件 提供。
Para_02 使用相同的γ截断值来定义协同作用(γ < 0.95),三个机构的所有模型 都表现出显著的命中率。 麻省理工学院的图卷积模型 表现突出,正确预测了30种化合物组合中的25种,命中率为83%。 NCATS的随机森林模型 结合了分类概率和回归伪概率,以53%的命中率紧随其后,正确识别了30种组合中的16种。 UNC的模型 准确预测了30种组合中的12种,命中率为40%。 Para_03 基于88种组合的实验获得的协同作用值,一项回顾性评估分析了各机构最终模型 对这些组合的预测效果。 换句话说,每个小组报告了所有88种组合的预测标签,包括他们 最初提供的30种。 表2和补充图7展示了结果。 命中率随着模型 现在预测88种组合而不是原来的30种而发生了变化,MIT、UNC和NCATS分别达到了58%、57%和45%。 NCATS模型 实现了最高的平衡准确率(BACC = 0.59),并产生了最少的假阳性(FP),从而实现了最高的精确率(0.65)。 尽管MIT提供了最高的AUC值(AUC = 0.78),但它产生了大量的假阳性。 最后,三种方法的共识并未显著提高精确率。 Table 2 Performance of three models and a consensus model in predicting synergy of 88 nominated combinations 表2 三种模型 和一种共识模型 在预测88种推荐组合协同作用中的性能
Exploring the biological relevance of the most synergistic combination in PANC-1 探索PANC-1中最协同组合的生物学相关性
Para_01 有了实验协同值,本节将重点从建模转向分析实验结果。 在496个训练和88个测试组合中,分别有256个和51个具有实验确定的gamma分数低于0.95(图5)。 这些307个协同组合包括几种常见的化合物和MoAs。 如图6所示,Carfilzomib是最常见的化合物。 值得注意的是,涉及Carfilzomib的组合表现出最高的协同作用。 对MoAs的类似分析显示,蛋白酶体抑制是最常见的,其次是Polo样激酶1(PLK1)和组蛋白去乙酰化酶(HDAC)抑制。 尽管HDAC抑制不如PLK1抑制常见,但其产生的Gamma分数更理想。 Fig. 5: Distribution of Gamma for 307 experimentally-validated synergistic combinations.
- 图片说明
◉ 大多数分数接近0.95。◉ 26种组合的分数低于0.5,表现出强烈的协同作用。◉ 源数据作为源数据文件 提供。
Fig. 6: Number of occurrence of compounds and MoAs among 307 experimentally-validated synergistic combinations colored by average synergy.
- 图片说明
◉ 化合物,(b) 作用机制。为了简化起见,(b) 中的每个作用机制都进行了缩写;例如,"HDAC"指的是"HDAC 抑制剂",其中 HDAC 是一种蛋白质名称。补充图 8 提供了缩写的详细信息。源数据以源数据文件 的形式提供。
Para_02 之前的分析考虑了所有Gamma分数低于0.95的协同组合(分布见图5)。 在307种组合中,有26种具有强烈的协同作用,Gamma分数低于0.5。 这些组合涉及20种不同的作用机制,详见补充表5。 网络分析(图7)确定了蛋白酶体-组蛋白去乙酰化酶(HDAC)抑制是最常见的协同组合,这一趋势即使在考虑所有Gamma分数低于0.95的协同组合时也是一致的(补充图8)。 在26种组合中,排除蛋白酶体抑制外,其他显著的协同作用机制包括HDAC抑制与突变型p53激活的结合以及HDAC-Survivin抑制。 Fig. 7: Network analysis of MoAs in 26 strongly synergistic combinations (gamma < 0.5).
- 图片说明
◉ 节点大小和边宽分别与MoA和MoA-MoA频率成比例。◉ 每个MoA为了简洁起见都进行了缩写;例如,"HDAC"指的是"HDAC抑制剂",其中HDAC是一个蛋白质名称。◉ 补充图8提供了缩写的详细信息。◉ 源数据已作为源数据文件 提供。
Para_03 评估协同组合中新兴的MoA-MoA相互作用的统计显著性仍然很重要。 在307种协同组合中,蛋白酶体-组蛋白去乙酰化酶(HDAC)抑制发生了9次。 如果这种相互作用被证明是最普遍的,它将鼓励进一步探索以推广这些发现并预测具有这两种MoA的其他化合物。 另一方面,观察到的MoA-MoA相互作用可能是偶然出现的。 为了测试其显著性,该过程涉及将这些结果与随机组合进行比较。 分析从307种协同组合中选取了64 种独特的化合物,并生成了307种随机组合,重复此过程1000次。 蛋白酶体-HDAC抑制平均发生4.4次,标准误差为1.9(见补充图9中的随机网络图)。 这种比较表明,在协同化合物中出现的9次显著超过随机预期(P值 < 0.01)。 蛋白酶体-HDAC抑制的重要性更加突出,因为它在更严格的协同标准下仍是最常见的相互作用(γ < 0.5;见图7)。 Discussion Para_01 胰腺癌的复杂性促使这项研究通过计算和实验方法的综合方法揭示协同药物组合。 三家独立机构开发了机器学习模型 ,并确定了30种针对PANC-1细胞的药物组合,仅有两种重叠选择,突显了他们 不同方法的互补性。 这次合作在使用图卷积网络(GCN)、随机森林分类和回归的组合以及一种包含多种算法和特征的定制选择过程时,取得了83%、53%和40%的显著命中率。 该研究报告了307种经过实验验证的协同组合。 其中,蛋白酶体抑制尤其当与组蛋白去乙酰化酶抑制结合时,作为一种反复出现且高度协同的作用机制浮现。 由于该研究将计算方法与实验验证相结合,每个类别都引发了若干讨论点。 Para_02 MIT 和 UNC 都使用了图卷积网络,但 MIT 的模型 性能更优可能是因为在 NCI-ALMANAC 的辅助数据上进行了训练,该数据包含来自 多种疾病的药物协同数据(4000 个数据点)。 此外,UNC 仅将图卷积网络作为更广泛建模方法和选择过程的一部分。 MIT 的模型 还因其对协同组合的多样化选择而脱颖而出。 图 4 展示了 NCATS 和 UNC 模型 经常识别出相同的化合物与其他多个化合物具有协同作用。 为了确保多样性,MIT 故意将最终选择限制为每个化合物的前五种组合,从而得到一个包含更多不同化合物的前 30 列表。 Para_03 提名过程除了算法和特征外,还会影响模型 的性能。 例如,NCATS可能通过不排除含有重复化合物的组合,从而获得了较高的PPV,选择了由单一重复化合物主要驱动协同作用的组合。 相比之下,MIT将其选择限制为每个化合物涉及的前五种组合。 UNC的三级筛选过程可能对其较低的特异性和平衡准确率有所贡献。 Para_04 将本研究的ML结果与现有文献进行比较,可以提供有价值的见解。 NCATS观察到RF、XGBoost和DNN的表现相似(参见补充表2),当化合物特征从Avalon或Morgan指纹转移到RDKit或自研描述符时,表现明显下降。 这表明,在这三种算法中,特征选择比算法本身更为重要。 Celebi等人也报告称,XGBoost和RF优于线性回归、Lasso和SVM。 因此,两项研究都表明,XGBoost和RF是预测协同作用的合适算法。 然而,这一结果与一项在大型肿瘤学筛选数据上训练DNN的研究结果相反,该研究展示了深度学习 相对于标准ML模型 (如RF和SVM)的优势。 总体而言,由于特征集和终点的不同,直接将本研究与其他研究进行比较具有挑战性。 例如,前一项研究使用化学和基因组信息作为输入,Celebi等人使用了来自 DREAM AstraZeneca-Sanger药物组合预测挑战的数据,该数据包含了来自 不同细胞系的更广泛信息,而本研究则使用了SMILES、MoAs以及PANC-1细胞中单药活性的指纹。 在类似的情况下,本研究提出的方法可能在不同数据集 (如其他疾病领域的数据集 )上表现不一致。 尽管与先前模型 直接比较存在挑战,但本工作通过严格评估模型 在160万种组合中的泛化能力,展示了其关键优势,从而实现了显著的命中率。 Para_05 在前瞻性发现的组合中,NSC-319726 和 AZD-8055 与多种化合物表现出协同作用,突显了它们潜在的临床相关性。 NSC-319726–AZD-8055 组合的实验确定的 gamma 得分为 0.78。 NSC-319726 是一种临床前的突变 p53 激活剂,正在研究其治疗胰腺癌的潜力。 突变 p53 是胰腺肿瘤发展的关键驱动因素,使其成为治疗干预的关键靶点。 在 p53 激活剂的开发方面已取得显著进展,尤其是 MDM2 抑制剂,它们通过稳定和重新激活 p53 的抑癌功能发挥作用。 值得注意的是,像 idasanutlin 这样的 MDM2 抑制剂已经进入 III 期临床试验,突显了它们作为胰腺癌有前景的治疗选择的潜力。 同样,AZD-8055 是一种 mTOR 抑制剂,正在研究其在治疗各种癌症(包括胰腺肿瘤)中的潜在作用。 mTOR 抑制剂如 AZD-8055 针对癌症细胞生长和存活的关键通路。 然而,mTOR 抑制的一个效果是激活自噬,这是癌细胞在压力下可以用来生存的过程。 为了抵消这一效应,自噬抑制剂如氯喹和羟氯喹已在胰腺癌的临床试验中与 mTOR 抑制剂联合使用。 不幸的是,结果并不令人鼓舞,因为临床上安全剂量的自噬抑制剂在疾病晚期并未显示出显著益处。 这可能是由于在患者安全剂量下无法实现足够的自噬抑制。 Para_06 评估治疗化合物和组合的总体细胞毒性至关重要。 本研究中的协同组合在PANC-1细胞系中表现出有效性,尽管未进行进一步的生物学验证。 未来的研究可以利用对照细胞系和更先进的模型 来探索细胞毒性。 来自 胰腺癌患者和正常组织的类器官可以更准确地反映肿瘤微环境,从而优化药物疗效和特异性的评估。球状体培养物能够模拟肿瘤的三维结构,也可以帮助评估化合物的渗透性和活性。 使用胰腺癌小鼠模型 的体内研究可以进一步评估治疗潜力,观察对肿瘤生长、转移和潜在毒性的效果。 这些先进模型 将通过提供全面的安全性和有效性评估,指导未来的研究向临床试验发展。 Para_07 这项合作研究的发现具有几个关键意义。 首先,它们突显了机器学习模型 在预测药物协同作用方面的有效性。 其次,它们强调了前瞻性验证的价值,即使对于资源密集型矩阵筛选也是如此,为模型 在现实场景中的预测能力提供了可靠的评估。 第三,这项研究为在精心设计的前瞻性研究中对不同复杂程度的常见机器学习 方法进行基准测试提供了一个有力的案例研究。 第四,它展示了合作研究的力量,其中不同的机器学习 方法可以相互补充各自的命中列表。 最后,进一步推进此处发现的组合或作用机制,在临床前研究中具有很强的潜力,能够推动胰腺癌有效疗法的发展。 Methods Para_01 这项研究符合所有相关伦理规定。 由于该研究仅涉及商业可用的细胞系(PANC-1,ATCC目录号CRL-1469),因此不需要额外的伦理批准。 Generation of the training dataset 训练数据集 的生成
Para_01 我们使用了NCATS内部的化合物库MIPE4,该库包含近2000种具有多样且冗余作用机制(MoA)的抗肿瘤化合物,包括批准药物、I至III期试验药物以及临床前分子。 该库的筛选以及所有后续体外实验均使用来自 胰腺外分泌癌的连续肿瘤细胞系(PANC-1,ATCC目录号CRL-1469),该细胞系常被用作这种高度侵袭性胰腺癌的模型 。 Para_02 MIPE4文库的初步筛选是通过重复单药剂量反应方式进行的(11个连续稀释度,1:3,范围为[46微摩尔 – 0.78纳摩尔])。 在该实验中,PANC-1细胞在含10%胎牛血清和1%抗生素混合物的DMEM培养基中生长。 实验当天,用0.25%胰蛋白酶处理5分钟以收获细胞,离心后将细胞悬浮液以500个细胞/5微升/孔的密度接种到培养基中。 细胞密度是根据72小时内细胞的高效增殖率进行实验选择的。 细胞被接种到白色组织培养处理过的1536孔Aurora板(Brooks Automation, Chelmsford, MA)上,使用MultiDrop Combi分配器(Thermo Scientific, Logan, UT),并在37°C、5% CO2条件下过夜孵育以使细胞贴壁。 接下来,使用pintool转移器(Kalypsis, San Diego, CA)向每孔加入23纳升DMSO中的化合物溶液。 作为阳性对照,我们使用了"无细胞"列,其代表化合物的100%杀伤能力(IC100),而DMSO则作为载体中性对照(IC0)。 细胞在37°C、5% CO2、95%湿度条件下与化合物或DMSO共同培养72小时。 检测方法使用了CellTiter-Glo®发光细胞活力检测试剂盒(Promega, G7573),这是一种基于ATP的活细胞检测方法。 该方法利用耐热萤火虫荧光素酶的特性,在直接加入细胞培养物后几分钟内即可生成稳定的"发光型"荧光信号并进行测量。 Para_03 在72小时刺激期结束时,使用BioRAPTR FRD分配器向每个孔中加入5微升CellTiter-Glo®试剂。 平板在室温下孵育10分钟,然后使用ViewLux平板读数仪(PerkinElmer,Waltham,MA)以3秒曝光时间读取发光信号。 Para_04 在增殖的PANC-1细胞中筛选MIPE文库,发现了32种化合物。 这些化合物在图2中的IC50值显示出变异性与效力,其效果值至少达到50%,并且符合曲线类别1.1和1.245。 这32种化合物产生32×31/2 = 496种组合,每种组合在10 × 10矩阵中进行测试,包含九个1:2的连续稀释。 每种化合物的浓度范围是单独选择的,以使它们的IC50大致位于该范围的中间。 每个1536孔板包括一个DMSO对照(IC0)和一种已知的抗癌药物硼替佐米(Bortezomib),作为阳性对照(IC100)。 提供了一个包括对阴性对照和阳性对照响应的筛选板示例,见补充图11。 每个区块都进行了重复测试。 训练数据的生成和机器学习 预测的验证均使用了PANC-1细胞系的10 × 10实验程序,并进行重复。 Para_05 为了进行矩阵筛选,化合物混合物通过 Echo 650 声波液体处理仪(Beckman Coulter)预先分配到空的 1536 孔白色固体底部板中,每孔 20 纳升。 然后,将板中加入 PANC-1 细胞悬浮液,细胞密度为 500 个/5 微升培养基,并放入组织培养恒温箱(5% CO2,37 °C,95% 湿度)。 72 小时后,向孔中加入 CellTiter-Glo® 试剂进行检测,方法如上所述。 Compounds standardization 化合物标准化
Para_01 训练和测试混合物中分子的化学结构按照我们的规范数据整理实践进行了标准化和整理,使用的是ChemAxon Standardizer版本20.946。 简而言之,所有化合物中的盐和溶剂被去除,随后去除了反离子、大分子有机化合物(Da ≥ 2000)、混合物和无机化合物。 使用ChemAxon Standardizer软件对特定化学类型如芳香族、硝基团、磺酸基团、互变异构体和质子化状态进行了标准化处理。 由于化学标准化是获得用于建模的整理数据集 的第一步,因此我们在基于描述符和基于图的方法中都使用了ChemAxon Standardizer进行结构分析。 Synergy quantification 协同效应量化
Para_01 组合协同作用的程度是通过将观察到的化合物组合反应与预期反应进行比较来量化的,预期反应是通过假设化合物之间没有相互作用的参考模型 计算得出的。 常用的参考模型 包括最高单药(HSA)47、Bliss48、Loewe49 和零相互作用效力(ZIP)模型 50。 本研究分析了不同的协同作用指标,如伽马(γ)、贝塔和超额HSA,以评估重复组合的可重复性。 它选择了伽马,因为其对重复中的变异更不敏感。 先前的一项研究通过三种伊布替尼-药物组合的等效图评估确定,γ < 0.95 表示协同作用32。 一致地,本研究将伽马分数低于 0.95 的组合分类为协同作用,而较高的分数表示非协同作用。 这些模型 预测了协同作用,但并未区分非协同作用的组合是独立的还是拮抗的。 Computational modeling approach 1: NCATS 计算建模方法1:NCATS
Para_01 对于机器学习 ,分子结构可以表示为数值特征向量或分子描述符。 我们采用了多种特征及其组合来评估不同的机器学习 方法。 每种组合包含两种化合物,因此两个特征向量被平均以生成每个组合的单一特征向量。 Avalon1024、Avalon2048、Morgan1024 和 Morgan2048 指纹以及 RDKit 描述符(https://rdkit.org)是使用 Python 的 RDKit 包生成的。 此外,使用自有的 Python 3.7.7 从 NCATS 预测器(https://predictor.ncats.io/)生成生物描述符。 作用机制被转换为特征向量如下:原始 1785 种 PANC1 筛选化合物有 821 种独特的作用机制。 每种作用机制被编码为长度为 821 的向量中的一个元素,每种组合的作用机制存在与否分别用 1 和 0 表示。 例如,具有两种不同作用机制的组合将被编码为一个有两个元素为 1,其余元素为 0 的向量。 Para_02 随机森林(RF)分类和回归、极端梯度提升(XGBoost)以及深度神经网络 (DNN)被用于基准机器学习 算法 。 ROC图的AUC测量了分类模型 的性能。 XGBoost的学习率被调整为0.01。 DNN由一个具有三层隐藏层的顺序模型 组成。 主要参数依次优化如下:学习率=0.0001,优化器=Adam,批次大小=128,轮数=70。 嵌套超参数调优方案优化了隐藏层,测试了第一层中的700、1000和2000个神经元,第二层中的500和700个神经元,第三层中的200和300个神经元。 最终的DNN架构在各层中分别使用了700、500和300个神经元。 Para_03 训练模型 的交叉验证方案是一个化合物排除法。 这种方法涉及从每个折中排除一个化合物,使得该折包含所有组合,但不包括包含该化合物的组合。 由于有32个化合物构成了组合(或训练数据),在此方案中共进行了32折交叉验证。 DNN中的嵌套超参数调优的交叉验证将每32折进一步划分为三个较小的折。 Para_04 共识建模通常优于单一的QSAR模型 。 NCATS使用两种方法开发了共识模型 :(i) 对单一模型 的概率进行平均,(ii) 从单一模型 中应用多数投票。 最终模型 采用了第一种方法,通过将回归值缩放到0到1的范围,将其转换为伪概率,然后从1中减去缩放后的值。 这种减法确保了较低的gamma值反映了更强的协同作用或更高的协同可能性。 然后该模型 对回归伪概率和分类概率进行平均。 Computational modeling approach 2: UNC 计算建模方法 2:UNC
General 通用
Para_01 使用 Python 中的 RDKit 包计算了训练集化合物和虚拟筛选库的 RDKit 描述符和 Morgan 指纹。 Simplex 描述符使用 HiT QSAR 程序计算。 机器学习模型 使用 Python 包 scikit-learn 和 PyTorch (用于神经网络 )开发。scikit-learn 模型 使用默认超参数。 所有模型 都作为分类器进行训练(使用二元标签),但通过不同方式生成一个"置信度分数"。 这些"置信度分数"在共识预测计算中进行了平均。 由于 Simplex 描述符计算成本较高,为了在完整测试集上计算共识预测,仅运行了基于描述符的模型 (使用 RDKit 描述符和 Morgan 指纹)。 随后,使用 Simplex 基础模型 和具有 IC50 数据的模型 评估了前 2000 个得分组合。 Mechanism of action selections 作用机制选择
Para_01 训练集中的列‘MOA 1’和‘MOA 2’被聚合和排序,以形成每行一个MOA对(训练集中每496个唯一药物对一行)。 然后按唯一的MOA对对矩阵行进行分组。 计算了每个280个唯一MOA对在原始训练集中包含的行数以及‘label’(活性二进制)列的均值。 将训练集中具有3个或更多代表性药物对且‘label’均值大于等于0.66的MOA对分类为训练集中出现的24个最协同的MOA对。 使用Chemotext59、ROBOKOP60和知识图谱挖掘61来识别和优化测试化合物的MOAs。 对测试集(160万唯一药物对)进行虚拟筛选,以去除不表示上述24个MOA对中的任何一个的药物对,得到一个由MOA模型 优先选择的888个唯一药物对子集。 Pure descriptor models 纯描述模型
Para_01 总共开发了15种仅使用伽马二元标签的模型 类型,用于共识计算。 在训练混合物中为每个化合物计算了两种描述符类型(RDKit描述符和Morgan指纹),并在每个描述符的位置通过逐元素平均或求和进行组合。 第三种描述符类型Simplex62是在训练混合物中计算的,不需要组合。 这些描述符/组合对被用作神经网络 、随机森林和梯度提升模型 的输入。 为了计算共识,对每种描述符的每种模型 的预测结果进行了平均。 这产生了三种共识模型 ,每种对应不同的描述符。 Descriptor and IC50 models 描述符和IC50模型
Para_01 开发了两种模型 ,结合了化合物的IC50数据:一种是图卷积模型 ,另一种是基于单纯形描述符的神经网络模型 。 为了开发图模型 ,每个组分化合物的标准SMILES字符串通过OpenChem软件包转换为图(邻接矩阵和节点特征矩阵)。 通过将单个邻接矩阵的直接和与节点特征矩阵的拼接创建了一个组合混合图。 该组合图通过图卷积网络,得到混合图的潜在表示,并将每个组分化合物的相应Log IC50值连接到该表示上。 该结果表示进一步通过神经网络 处理,并以分类得分为最终输出。 Para_02 对于神经网络模型 ,首先生成了混合单纯形描述符,然后进行了清理,去除了高度相关的单纯形。 所得的单纯形描述符通过神经网络 的多层处理后,每个组分化合物的对数IC50值被附加到混合表示中。 与图模型 类似,所得的表示作为神经网络模型 的输入,并产生分类得分作为输出。 每个模型 的定义如上,直到一组超参数(层数、每层的大小、学习率、训练轮数等)。 为了找到每个模型 的最优超参数,在多个模型 上进行了一种特定的混合导向外部验证。 对于广泛的超参数值,模型 之间仅观察到不显著的差异。 因此,在此范围内,选择了最终模型 以提高计算效率。 Computational modeling approach 3: MIT 计算建模方法3:麻省理工学院
Para_01 MIT的ComboNet28方法使用了一种图卷积网络,该网络将分子嵌入到连续特征向量中。 该向量是通过单药和组合数据自动学习的,而不是手工设计的。 当在单药数据上训练时,模型 以分子作为输入,并预测其是否能抑制癌细胞生长(二元标签)。 当在组合数据上训练时,模型 首先以组合(A,B)作为输入,并预测该组合的抑制分数c(AB)。 然后它预测它们的单药活性s(A)和s(B),并计算在Bliss独立性假设下的预期抑制分数:s(AB) = s(A) + s(B) - s(A)s(B)。 最后,它将组合(A,B)的分数量化为c(AB) - s(AB),此处称为定制协同评分,数值越高表示协同作用越强。 参考文献28提供了更多细节。 该评分给更具协同作用的组合赋予更高的值,与gamma不同。 除了胰腺癌(PANC-1)外,我们的模型 还基于从NCI-60(单药数据)65和NCI ALMANAC(组合数据)13收集的40种不同的细胞系进行训练。 按照多任务训练方案,我们的模型 总共在47K个单药和4K个组合数据点上进行训练,这比PANC-1数据要大得多。 为了评估我们的方法,我们将胰腺癌组合数据集 分为训练集(80%)、验证集(10%)和测试集(10%) Para_02 重要的是,在对ComboNet的这种改进中,我们省略了药物-靶点相互作用数据,这与最初的设想不同,因为它并未提高模型 的预测准确性。 Reporting summary 报告摘要
Para_01 有关研究设计的更多信息,请参阅与本文相关的Nature Portfolio报告摘要。 Data availability Para_01 用于建模的数据集 可在我们的GitHub 仓库中找到(https://github.com/ncats/PANC1)。 源数据已随本文提供。 Code availability Para_01 用于数据分析 和建模的脚本 在我们的 GitHub 仓库 (https://github.com/ncats/PANC1)66 下,采用 MIT 许可证。该仓库包含原始许可证信息和版权声明,确保完全符合 MIT 许可证条款。 没有访问限制,代码在 MIT 许可证下可以自由使用和修改。 MIT 模型 基于 ComboNet 的改编,如 Jin, W. 等人所述。Deep learning 识别出用于治疗 COVID-19 的协同药物组合28。 ComboNet 的原始源代码可在 https://github.com/wengong-jin/ComboNet 下以 MIT 许可证获得。 改编后的代码保留了原始许可证和版权声明,并在脚本 中包含了适当的署名。