是一项重要的任务,可以通过以下步骤来完成:
腾讯云相关产品和产品介绍链接地址:
增长最快的公司正是那些学习最快的公司。开展试验越多,学习到的东西也就越多。增长黑客的巨大成功往往来自一连串小成功的累加。一点一滴的认知学习都会带来更好的表现,催生出更好的试验想法,进而带来更多成功,最终将一次次小幅的改善转化为压倒性的优势。
近日,Oxford University Press网站报道了华东师范大学计算机学院何高奇副教授和华东理工大学药学院/华东师范大学人工智能新药创智中心李洪林教授课题组题为“VRPharmer: Bringing Virtual Reality into Pharmacophore-based Virtual Screening with Interactive Exploration and Realistic Visualization”的最新成果。该成果发表于国际著名学术期刊Bioinformatics,首次发布了在虚拟现实(VR)环境中,完成药效团的生成、编辑,以及基于药效团的药物虚拟筛选等全流程交互可视计算软件VRPharmer。
今天为大家介绍的是来自Asher Mullard.团队的一篇论文。CACHE的寻找靶点大赛突显了人工智能在识别难以药物化的靶点上识别小分子的潜力,以及这些计算筛选方法面临的漫长道路。
今天为大家介绍的是来自Petra Schwille团队的一篇论文。最近,机器学习(ML)的应用为计算蛋白质设计领域带来了惊人的进步,使得针对工业和生物医药应用的蛋白质定向工程设计成为可能。然而,为细胞核心相关的新兴功能设计蛋白质,比如能够在时空上自组织并因此构建细胞空间的能力,仍然极具挑战。虽然在生成方面,条件生成模型和多状态设计正在兴起,但对于新兴功能而言,无论是计算上还是实验上,都缺乏专门为蛋白质设计项目所需的筛选方法。在这里作者展示了如何为机器学习生成的蛋白质变体实现这种筛选,这些蛋白质变体能在细胞内形成时空模式。对于计算筛选,作者采用了一种基于结构的分而治之方法来找到最有希望的候选者,而对于随后的体外筛选,作者使用了由自下而上的合成生物学建立的合成细胞模拟体。
今天为大家介绍的是来自Walters团队的一篇论文,作者提供了一种在大规模数据库中高效搜索对应需求数据的方法。
今天给大家介绍2019年10月,北京大学基础医学院周源团队、崔庆华团队和河北工业大学李建伟团队合作在Genome Biology上在线发表的题为Benchmark of computational methods for predicting microRNA-disease associations的文章。该研究测试结果不仅为生物医学研究人员选择合适的miRNA-疾病关联预测因子提供了参考,还为开发更强大的miRNA-疾病关联预测因子提供了未来的方向。
今天给大家带来的是Paul Beroza、James J. Crawford 于2022年10月发表在nature communications上的《Chemical space docking enables large-scale structure-based virtual screening to discover ROCK1 kinase inhibitors》。作者提出了一种结合了两个优点的虚拟筛选方法(1)它避免了对完整的库进行枚举(2)利用蛋白质结构信息,通过分子对接来评价产生的分子。作者应用这种方法从近10亿种商业可用化合物中鉴定ROCK1的抑制剂。在购买的69种化合物中,27种(39%)的Ki<10μM(Ki是抑制常数,值越小抑制强度越大)。这篇论文的对接方法比传统的对接方法快好几个数量级。
今天为大家介绍的是来自Giuseppe Felice Mangiatordi团队的一篇论文。此项研究引入了一种名为"GENERA"的全新设计算法,它将自动药物类似物设计的深度学习算法"DeLA-Drug"的能力与生成具有目标定向性质分子的遗传算法相结合。GENERA被应用于血管紧张素转化酶2(ACE2)靶点,该靶点与许多病理条件(包括COVID-19)有关。通过两个分子对接程序,PLANTS和GLIDE,评估了GENERA在为特定靶点全新设计有前景的候选分子的能力。
近日,「德睿智药」与广州生物岛科学家团队的合作论文“An Extensive Benchmark Study on Biomedical Text Generation and Mining with ChatGPT”,发表在国际顶级生物信息学期刊Bioinformatics上。AI大语言模型应用于生物医药领域需要深入的领域理解能力,同时科学的模型表现评估也是研发出应用于生物医药领域大语言模型的基础。为此,本论文研究团队开发出一项全面的基准测试流程,以评估各种AI大语言模型在生物医学数据挖掘上的性能。
在药物发现的流程中,一个关键的限制步骤是对感兴趣的蛋白靶标进行潜在药物分子的实验筛选。快速准确地进行药物-靶标相互作用(DTI)的计算预测可以加速药物发现过程。近日,《Proceedings of the National Academy of Sciences》发表了一种使用预训练蛋白质语言模型的机器学习方法——ConPLex,用于预测药物-靶标结合,快速筛选候选物进行深入研究。
Chen YC. Beware of docking! Trends Pharmacol Sci. 2015 Feb;36(2):78-95. doi: 10.1016/j.tips.2014.12.001. Epub 2014 Dec 24. Erratum in: Trends Pharmacol Sci. 2015 Sep;36(9):617. PMID: 25543280.
现在通过LLM-Blender大模型集成框架,你输入问题,自动帮你排序各家LLM结果,然后“融合生成”最佳答案。
OpenAI最新研究 <Let’s verify step-by-step> 于昨天发布,引起了广泛关注。这个想法非常简单,可以用一句话来概括:
随机森林是常用的非线性用于构建分类器的算法,它是由数目众多的弱决策树构建成森林进而对结果进行投票判断标签的方法。
在人工智能飞速发展的今天,大模型的感知能力已经达到了令人惊叹的水平。但是,它们真的能够像人类一样,洞悉图片中的深层含义吗?为了探讨多模型大模型与人类的差距,来自中科院深圳先进院,M-A-P,华中科技大学,零一万物,滑铁卢大学等多家机构联合提出了首个用于评估多模态大模型(MLLMs)图像隐喻理解能力的综合性基准测试II-Bench。
今天给大家介绍阿尔托大学、图尔库大学以及芬兰分子医学研究所的研究团队发表在Nature Communication上的一篇文章“Leveraging multi-way interactions for systematic prediction of pre-clinical drug combination effects”。这项研究中,研究团队提出一个新的机器学习框架comboFM, 它可以精确地预测不同抗癌药物的组合在临床前研究中对特定癌细胞的反应,从而为系统地预筛选药物组合提供有效的手段。
今天为大家介绍的是来自JunJie Wee和Kelin Xia团队的一篇关于抗生素发现的论文。人工智能(AI)技术在改变抗生素发现行业方面具有巨大潜力。高效和有效的分子特征化是实现高准确性学习用于抗生素发现的模型的关键。作者提出了一种通过结合基于序列的2D指纹和基于结构的图表示的指纹增强的图注意力网络(FinGAT)模型。在特征学习过程中,序列信息转化为指纹向量,结构信息通过GAT模块编码为另一个向量。这两个向量被连接并输入到多层感知机(MLP)进行抗生素活性分类。模型经过广泛的测试并与现有模型进行比较。研究发现, FinGAT在抗生素发现中可以胜过各种最先进的GNN模型。
今天给大家介绍来自哈佛大学医学院的Mark W. Albers教授的课题组近日发表在Nature Communication上的一篇文章。文章中提出了一个机器学习框架DRIAD(Drug Repurposing In Alzheimer’s Disease),用于量化AD严重程度(Braak阶段)的病理与基因名称列表中编码的分子机制之间的潜在关联。80种FDA批准和经过临床测试的药物被应用于分化的人类神经细胞培养物,并收集了其扰动所产生的基因列表,DRIAD分析该基因列表从而产生了一个可能再利用的候选药物的排名表。对列表中得分最高的药物进行检查,以了解其靶点之间的共同趋势。
尽管LLM(大型语言模型)的模型和数据规模不断增加,但它们仍然面临事实错误的问题。现有的Retrieval-Augmented Generation (RAG)方法可以通过增强LLM的输入来减少知识密集任务中的事实错误,但可能会影响模型的通用性或引入无关的、低质量的内容。
标题:Robust, Occlusion-aware Pose Estimation for Objects Grasped by Adaptive Hands
2022年4月14日,美国国家癌症研究所 (NCI) 计算机辅助药物设计研究课题组的Wendy等人在JCIM杂志上发表综述,整理了当前用于药物研发的超大型数据库以及检索技术的情况。
最佳实践: 通过 @iceworks/eslint-plugin-best-practices 分析项目,提出符合当前工程特征(对 ice 和 Rax 项目友好)的最佳实践及阻塞问题发布卡口,帮助开发者优化项目性能,避免潜在 bug 。
2022年11月7日,美国杨百翰大学的Dennis Della Corte团队在Journal of Chemical Information and Modeling上发表文章MILCDock: Machine Learning Enhanced Consensus Docking for Virtual Screening in Drug Discovery。
本文列出的创建动画图表的步骤并不是孤立地考虑的,必须考虑整个过程。需要什么原始数据?如何将其聚合以显示想要什么?在绘制图表之前,是否需要对聚合数据进行进一步处理?使用哪种类型的图表?哪些数据(和其他信息)对查看者有用?需要VBA来自动化所有这些?
2023年12月8日,来自北卡罗来纳大学教堂山分校的Alexander Tropsha、卡内基梅隆大学的Olexandr Isayev等研究人员在Nature Reviews Drug Discovery发表综述文章Integrating QSAR modelling and deep learning in drug discovery: the emergence of deep QSAR。
集合函数被广泛应用于各种场景之中,例如商品推荐、异常检测和分子筛选等。在这些场景中,集合函数可以被视为一个评分函数:其将一个集合作为输入并输出该集合的分数。我们希望从给定的集合中选取出得分最高的子集。鉴于集合函数的广泛应用,如何学习一个适用的集合函数是解决许多问题的关键。为此,腾讯 AI Lab、帝国理工与中山大学合作发表论文《Learning Neural Set Functions Under the Optimal Subset Oracle》,提出基于最优子集的集合函数学习方法。该方法在多个应用场景中取得良好效果。论文已被 NeurIPS 2022 接收并选为口头报告(Oral Presentation)。
AI 科技评论消息,2 月 21 日,百度 NLP 团队提交的 V-Net 模型以 46.15 的 Rouge-L 得分位列微软的 MS MARCO 机器阅读理解测试第一名。目前人类评测 Rouge-L 得分为 47;BLEU-1 得分为 46。 据了解,百度提交的 V-NET 模型使用了一种新的多候选文档联合建模表示方法,通过注意力机制使不同文档产生的答案之间能够产生交换信息,互相印证,从而更好的预测答案。 AI 科技评论了解到,除了百度位列第一外,凭借 Microsoft AI and Research
作者:Zipporah Polinsky-Nagel, Gregory Brucchieri, Marissa Joy, William Kye, Nan Liu, Ansel Andro Santos and Merle Strahlendorf
在本文中研究团队提出了一种基于深度学习的可解释方法,用于发现新型抗生素结构。通过神经网络学到的抗生素活性相关的化学亚结构被用于预测抗生素的结构类别。研究团队通过图神经网络预测了超过1200万个化合物的抗生素活性和毒性,并通过可解释的图算法确定了具有高抗生素活性和低毒性的化合物的亚结构理由。实验验证表明,具有特定亚结构的化合物对金黄色葡萄球菌具有抗生素活性,其中一种结构类别对耐药性较强的金黄色葡萄球菌和肠球菌具有选择性。这一方法为深度学习引导的抗生素结构类别发现提供了新途径,并强调了机器学习在药物发现中的可解释性和对选择性抗生素活性的化学基础的洞察力。
主成分分析(Principal Component Analysis,PCA),是考察多个变量间相关性的一种多元统计方法,基本思想[1]就是在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。最后筛选出的几个替代原始数据的变量被称为主成分,它们是原始变量的线性组合,关系图如下:
腾讯混元大模型是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。腾讯已将大模型技术深度应用到多个业务场景中,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等在内的超百个业务和产品,已经接入腾讯混元大模型测试。
线索评分是一个有效的模型可帮助销售和营销部门确定哪些潜在客户对公司最具价值。但是线索评分系统只有在正确设置和使用的情况下才能发挥作用。否则就会浪费营销和销售的时间和资源。
在目前Instagram大约10亿用户中,超过一半的人每月都通过Instagram Explore来搜索视频、图片、直播和各种文章。可以预见,为这些用户构建服务基础的推荐引擎,需要负责整理上传到Instagram的数十亿条内容,这是个工程上的大难题,尤其是这些内容还是实时生成的。
Kubernetes API Server接受客户端提交Pod对象创建请求后的操作过程中,有一个重要的步骤是由调度器程序kube-scheduler从当前集群中选择一个可用的最佳节点来接收井运行它,通常 是默认的调度器default-scheduler负责执行此类任务。对于每个待创建的Pod对象来说, 调度过程通常分为三个阶段:预选、优选和选定三个步骤,以筛选执行任务的最佳节点。
AI 科技评论按:算力的提升可能会为旧的算法注入活力。近两年来,神经演化(Neuroevolution)的方法逐渐再次受到关注,包括 OpenAI、DeepMind、Google Brain、Sent
与往年不同的是,当全国考生奔赴考场的同时,还有一些大语言模型也成为了这场角逐中的特殊选手。
AI 研习社前段时间曾对 Uber 数日连发的 5 篇关于神经演化的文章进行了深度的解读。这些文章介绍了他们在遗传算法(genetic algorithm)、突变方法(mutation)和演化策略(evolution strategies)等神经演化思路方面的研究成果,并通过使用神经演化的方法在深度强化学习的训练中胜过 SGD 和策略梯度。这项工作宣告了神经演化方法进入了一个新的时代。
算力的提升可能会为旧的算法注入活力。近两年来,神经演化(Neuroevolution)的方法逐渐再次受到关注,包括 OpenAI、DeepMind、Google Brain、Sentient、Uber
从Gene Expression Omnibus数据中收集5个结肠癌样本微阵列数据和癌症基因组图谱(TCGA)。在预处理之后,GSE17537中的数据是使用用于微阵列数据的线性模型(LIMMA)方法鉴定差异表达基因(DEGs)。 DEG进一步进行了基于PPI网络的社区评分和支持向量机(SVM)。然后使用SVM和Cox回归分析通过四个数据集GSE38832,GSE17538,GSE28814和TCGA验证。
Foldseek为结构搜索程序,它可以轻松找到三维结构相似的蛋白质。 Foldseek允许研究人员鉴定结构类似的蛋白质。图片来源:DeepMind 当你发现一种蛋白质时,如何确定其功能?这正是Greg
所有与solr核心服务有关的交互,如查询处理,都是通过HTTP请求执行的。填写查询表单之后,创建一个HTTP Get请求并发送给Solr。
在现代微生物组学分析中,高通量的测试方法使得研究者可以一次性获取大量的数据信息,这时候所获得的数据里可能存在大量“冗余”;此外,在实际操作中,研究人员为避免遗漏重要的系统特征,往往倾向于较周到的选取测试指标,这些变量之间也很可能存在多重共线性。因此,在大数据量的多个数据集之间进行分析时,常常难以有效的进行数据挖掘。
摘要:本篇主要介绍我们构建的oCTS分类器优化训练系统,一个标注人员都可以优化分类器的训练系统。首先介绍了项目背景和目标,oCTS主要针对人工可标注的数据场景又好又快的训练分类器;然后重点介绍了项目技术概要,涉及主动学习、弱监督学习、知识蒸馏等方面;接着展示了产品形态和效果;最后对项目进行了总结,并阐述未来优化方向。对于中小团队希望又快又好的训练分类器可能有所帮助。
MIT 利用图神经网络 Chemprop 识别潜在抗生素,特异性杀死鲍曼不动杆菌。
近日,在IEEE BigData2020 Global Road Damage Detection Challenge 2020道路损坏检测竞赛中,滴滴AI视觉团队提出的CFM(Consistency Filtering Mechanism with Self-Supervised Methods)算法,在两个不同评测集中,以Test1得分0.6657,在全球80个参赛队伍中排名第二;Test2得分0.6219,在全球19个参赛队伍中排名第三,最终获得了总分世界第三的成绩。
AI 科技评论按:本文发布于 Google Research Blog,作者为 Hossein Talebi, 机器感知领域软件工程师兼 Peyman Milanfar 研究科学家。AI 科技评论做了不改动原意的编辑和修改。 美是否存在标准?在图像处理与计算机视觉领域,图像质量与美学的量化问题一直困扰着研究者们。从技术的角度来说,图片质量的评估主要与像素降级相关,比如噪声、模糊、压缩等等。而图像在美学层面的评估,则需要根据图片所传达的情感或美感所连接的语义级特征来评判。 近年来,在人类标记数据的训练下,CN
今天为大家介绍的是来自Trey Ideker团队的一篇论文。多靶点药物——抑制多种蛋白的化合物——具有多种应用,但设计难度大。为了应对这一挑战,作者开发了POLYGON,这是一种基于生成性强化学习的多靶点药物研发方法。POLYGON嵌入化学空间,并迭代抽样以生成新的分子结构;这些结构根据预测的抑制两种蛋白靶点的能力、药物样性和合成容易性得到奖励。在超过100,000种化合物的结合数据中,POLYGON以82.5%的准确率正确识别多靶点相互作用。作者随后针对十对具有记录的共依赖蛋白生成了新化合物。对接分析表明,顶级结构以低自由能和与经典单蛋白抑制剂相似的三维取向结合其两个靶标。作者合成了32种针对MEK1和mTOR的化合物,大多数在1-10μM剂量下对每种蛋白活性和细胞存活率的降低都超过50%。这些结果支持了生成模型用于多靶点药物开发的潜力。
在药物发现领域,CADD技术可以加速药物研发,而CADD又下分为SBDD,LBDD,FBDD,以及最近大热的AIDD。在SBDD领域,DOCKING始终是绕不开的话题,也是高通量虚拟筛选的利器,本文通过一篇综述,来尽可能的将DOCKING这一概念阐释清晰。
引言:本文通过非常浅显易懂的实例,介绍了提高Google SEM广告质量得分的几种常用方法。
领取专属 10元无门槛券
手把手带您无忧上云