首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    J. Chem. Inf. Model. | 提高化合物-蛋白质相互作用预测的方法:通过使用增加的负样本进行自我训练

    今天为大家介绍的是来自Yasushi Okuno团队的一篇论文。识别化合物-蛋白质相互作用(CPI)对于药物发现至关重要。由于实验验证CPI通常耗时且昂贵,因此期望计算方法能够促进这一过程。可用的CPI数据库迅速增长加速了许多机器学习方法用于CPI预测的发展。然而,它们的性能,特别是它们在外部数据上的泛化能力,往往受到数据不平衡的影响,这归因于缺乏经验证的非活性(负面)样本。在这项研究中,作者开发了一种自我训练方法,用于增加可信和信息丰富的负样本,以改善由数据不平衡导致的模型性能下降问题。构建的模型表现出比使用其他传统方法解决数据不平衡时更高的性能,且在外部数据集上改进明显。

    04

    GPB|DeepCPI:基于深度学习的化合物和蛋白质相互作用预测框架

    这次给大家介绍清华大学交叉信息研究院的曾坚阳教授的论文“DeepCPI: A Deep Learning-based Framework for Large-scale in silico Drug Screening”。分析化合物与蛋白质的相互作用(Compound-Protein Interactions, CPIs)和新型药物靶标相互作用(Drug Target Interactions, DTIs)在硅药研发过程中起重要作用,从大规模未标记的化合物和蛋白质预测新的CPI有利于高效的药物研发。基于此问题,曾坚阳教授课题组将无监督的表征学习和特征嵌入与深度学习方法相结合,提出了一种自动学习化合物和蛋白质的隐式但具有表达力的低维特征评估大型数据库中测得CPI的计算框架DeepCPI。作者在方法中引入了(i)语义分析和Word2vec 方法来获得化合物和蛋白质低维特征表示(ii)多模态深度神经网络(DNN)分类器预测相互作用概率,使得其模型比现有模型更好地可以借助大规模无标签数据学习化合物与蛋白质的低维特征,实现预测未知的新型CPI或DTI。

    01

    Bioinformatics|TransformerCPI:通过深度学习以及自我注意机制和标签逆转实验,改善CPI的预测

    这次给大家介绍中国科学院上海药物所郑明月研究员的论文“TransformerCPI: improving compound–protein interaction prediction by sequence-based deep learning with self-attention mechanism and label reversal experiments”。化合物-蛋白质相互作用(Compound-Protein Interactions ,CPIs)的识别是药物发现和化学基因组学研究中的关键任务,而没有三维结构的蛋白质在潜在的生物学靶标中占很大一部分,这就要求开发仅使用蛋白质序列信息来预测CPI的方法。为了解决这些问题,作者提出了一个名为TransformerCPI的新型变换神经网络,并引入了更为严格的标签反转实验来测试模型是否学习了真实的交互功能。实验表明TransformerCPI性能优异,可以反卷积以突出蛋白质序列和化合物原子的重要相互作用区域,这可能有助于优化配体结构的化学生物学研究。

    01

    [变革]上海统计局与一号店、上海钢联战略合作

    原标题:上海统计,在拥抱大数据时代中变革 “ 一个大规模生产、分享和利用大数据的时代正在来临。这是一个浩浩荡荡不可阻挡的历史潮流,谁拥有了大数据,谁就占领了制高点,取得了主动权。就政府而言,大数据必将成为宏观调控、国家治理、社会管理的信息基础;就企业来说,谁能够有效应用大数据,谁就占得了市场,赢得了机遇。现在许多发达国家纷纷将大数据利用提升到了重要的国家战略层面,我们也要适应这一大势,将大数据视为国家战略资源,主动拥抱大数据时代,积极抢抓机遇、应对挑战。”这是国家统计局局长马建堂在国家统计局与11家企业在

    010

    Bioinformatics|具有图和序列的神经网络的端到端学习的化合物与蛋白质相互作用预测

    这次给大家介绍Masashi Tsubaki教授的论文“Compound-protein Interaction Prediction with End-to-end Learning of Neural Networks for Graphs and Sequences”。关于化合物与蛋白质的相互作用 (Compound-Protein Interactions ,CPIs)预测的相关问题是当今药物研发的重要课题,能更高效准确的预测 CPI,对生物科研、化学实验和日常制药都会大有益处。Masashi Tsubaki教授现有模型处理不平衡数据集(即包含少量的正样本(即相互作用)和大量的负样本(即不相互作用)的数据集)的不良性能问题。基于此问题,Masashi Tsubaki教授将GNN(Graph Neural Network,图神经网络)和CNN(Convolutional Neural Network,卷积神经网络)引入 基础分类器模型并加入注意力机制调控,提出一种具有图和序列的端到端神经网络模型,通过端到端表示学习在平衡和不平衡数据集上实现更强大的性能,在某些方面了优化CPI的预测。

    02
    领券