00:00
哈喽,各位亲爱的观众朋友们,大家好,欢迎来到MCE主题直播间,我是今天的主持人小M,非常感谢大家的热情关注,我们的直播已经在2点准时开启了,本次直播有两轮精彩的抽奖等候着大家,目前我们直播间人数还不是很多,但是我们依旧按照老规矩,在正式开奖前,在正式开始之前来一波抽奖预热,大家可以通过点击屏幕上的提示来分享我们的直播间,邀请更多的朋友加入我们。如果您是视频号和B站平台端的公众,可以扫描屏幕左侧二维码参与本轮抽奖,凡是在开奖前进入直播间的朋友们都有机会参与,快去通知你的小伙伴们,一起享受这场科研的盛宴吧,那我们本轮抽奖一共有10个名额,奖品是高德打车20元代金券,转发直播间转发分享我们的直播间就可以参与本轮抽奖,大家一起去参与本次抽奖吧。
01:01
那在等待抽奖的同时呢?我有一个好消息要告诉大家。MC的年终大促来了,温情暖冬乐享科研MC暖冬季的促销活动正火热进行中,本次活动中呢,我们提供了重组蛋白以及同位素标记物、抗体、生化试剂和试剂和专享六五折的优惠,多肽和造膜产品下单呢可以享受1.5倍的牌价积分。抑制剂、激动剂、抗体抑制剂和小核酸药物种类种类多样,涵盖热门靶点燃料SIRNA,享受65折及1.5倍的牌价积分。
02:00
MC为您提供的一站式的药物筛选平台中的生物活性化合物库以及类药多样性化合物库,更有55折的优惠呢。骨架多样库和药物片段药物片段库以及类天然产物类天类天然产物库、类药共价化合物库、靶向rana化合物库等,这些优质的化合物库呢,都限时享用的是也是五五折的折扣,一起加速了药物发现之旅。除此之外呢,MC还为您准备了科研惊喜好礼刮不停的活动,满1000元会送您一张暖冬惊喜卡,每满2000元刮号卡会加增加一张,最高可共享4张刮网卡,一共拥有百分之百的中奖率,不仅有会员卡券可供您线上使用,更是准备了非常热门的科研好礼等您来刮中。
03:07
科研路上MC拜年,好运连连。听说使用了MC的产品,你的研究成果发表速度会更快哦。想要了解以上的福利优惠活动呢?您可以登录您可以登录MC的官网首页查看以上的活动信息,或者直接咨询我们当地的销售代表。啊,那提前要恭喜以上获奖的萌佳人获得了我们第一轮的奖品,你们真的太幸运了。那接下来言归正传,本次直播的主题呢是AI在新奥发现中的作用。2024年诺贝尔物理奖和化学奖均颁发给了人工智能AI领域,标志着AI在各个领域的发展趋势势不可当。在新药研发中AI发挥着重要的作用。AI筛选目前有哪些新的技术以及可以和哪些应用场景结合呢?本次直播将带您深入了解CADD和AIDD如何加速新药研发,探究他们的前世今生,并且呢,也会带您进一步的解析如何基于蛋白配体进行AI筛选,以及DELL和AI如何共同探寻更广泛的化学空间。此外呢,本次直播还为您带来AI筛选在构建RA文库中的应用内容。
04:29
那我们本期直播也是给大家啊带来了几款比较热销的虚拟筛选极现货化合物库的一个套餐,一共有三款套餐,包括这个圣奇款升级款呢,中间是有嗯,其中是包含10万个分子的虚拟筛选和50个现货的化合物化合物嗯第二款是我们的经典款,它包含100万个分子的虚拟筛选以及100个现货化合物,以及我们呃比较优质的这款是升级款plus的一百一百万个分子的虚拟筛选以及100个现货化合物,那MC为您提供的都是一次性提供国内现货的化合物,那我们本次直播呢,也是呃,给大家带来了专属的福利,限时8折优惠,MCE为您提供也是一次性提供的现货,那就在嗯,也是在我们的1月10日前,也就是本次直播起的1个月内,成单即可解锁超值礼。
05:29
包,那大家可以看到我们的礼品池都是比较热门的科研或者生活用品,也会根据您订购的套餐不同,可选择的礼品数量也有所不同,如果您选择我们第一个套餐的话,就是在我们的礼品池内可以任意6选1,第二个套餐可以任意6选2,第三个套餐呢,就可以任意6选3个礼品。如果您有兴趣的话,可以截图本页面留存,那添加我们右上角直播小助理的微信进行预约,记得附上您的科研单位、课题组以及您意向的套餐,记得带上我们本次直播的暗号,那我们本次直播的暗号就是这句话,要筛就选MCE。
06:11
如果你有意向的话,记得添加我们小助理的微信,带上我们的暗号哦。那我后面也会给大家再介绍一次本次活动的,那我们也是话不多说,赶快开启我们,嗯,这这一次的直播,那本次直播呢,邀请到了MC的高级产品经理及范阳老师,如果在老师分享的过程中呢,大家有任何的疑问,也欢迎大家在评论区中提出,我们会在直播后段的答疑环节为大家一一解答,那现在我们热烈的邀请老师上线时间就交给您啦。嗯嗯,直播间的朋友们大家好,欢迎大家今天参加我的直播间,那我今天的直播的主题是AI在新要发现中的作用,然后内容将包括三部分,第一部分是跟第一部分是CDD和AIDD在新药研发中的应用,然后第二部分将跟大家聊一聊AI筛选如何加速新药发现,第三部分最后是第三部分跟大家再简单的介绍一下MC的一站式药筛平台。
07:25
首先是第一部分,嗯,我将从今年发生在AI领域的一些大事件开始,然后嗯,跟大家谈一谈新药的研发流程,最后再跟大家分享一下CDD和AIDD在新药研发中的应用。那我们都知道,在即将过去的2024年,AI领域可谓是收获满满,嗯,先有阿尔法food的3的震撼来袭,再有诺贝尔物理奖以及化学奖纷纷颁给了AI领域的大佬。那左图就是诺贝尔物理奖的两位得主,以表彰他们为人工智能的发展奠定的这个基石性的作用,右图则是诺贝尔化学奖,嗯,一半儿颁给了Rose斯特的主要开发者单位的贝CK克,以表彰他为计算蛋白设计做出的贡献,让另另外一半则颁给了阿尔法佛的two的开发者丹斯哈AB比斯以及John jumper, 以表彰他们就是为蛋白结构预测做出的贡献。
08:27
那我们可以相信,在未来,AI.嗯,将为药物研发的作用将会越来越大,接下来将跟大家谈一谈新药的研发流程,那我们都知道药物发现是一个漫长且充满风险的过程,嗯,那这个过程的话可以分为两个阶段,第一阶段就是临床前,然后第二阶段是临床,那我们今天主要是跟大家聊一聊小分子的临床前的一个发展过程,那业内一般又会将这个过程分为5个阶段,那第一个阶段就是嗯,He的阶段。
09:06
那在这个阶段的话,首先我们需要呃,生物靶点的确认以及验证,然后呢,再挑选合适的化合物库,然后进行嗯,像虚拟筛选,高通量筛选,或者是比较前沿的这种de尔筛选,那通过一轮又一轮的筛选,我们会获得一系列的这种苗头分子,那我们一般会对这些苗头分子按骨架进行分类,一般情况下我们会挑选3~5类骨架比较新颖的化合物,然后进入到嗯,Hit to need的阶段,那进入到这个阶段的话,我们首先需要对靶点的结合进行研究,那我们可以通过实验的方法,比如像X射线晶体学呀,AMR, 或者是我们通过计算机来预测,那获得的相应的这个结合模式以后,我们就可以进行这个结构优化,然后以获得初步的这个SCR研究,那与此同时的话,嗯,体外的筛选方案。
10:04
像比如酶活、细胞活功能性实验也需要逐步的落实,那我们都可以理解,那就是一个药物分子的结构决定了它的性质,那它的性质决定了它的DNPK,而它的DNPK则决定了这个分子能不能走向临床。因此在这个阶段我们也需要对这个化合物的结构进就是性质进行筛选。那与此同时,为了就是加快各个骨架的推进,我们也需要对这个不同的骨架进行这个初步的合成优化,那通过一轮又一轮的迭代优化,那这个时期的话,我们需要得到一个活性,得到活性得到较大提升的这个力的分子,然后进入到need to p CC阶段,那到了这个阶段以后,我们就需要进行更深入的这个SCR研究,嗯,与此同时,我们计算模型的相关性也会更强。就打个比方,比如我们CAD设计了10个分子,那理论上应该有8个分子。
11:02
它它的活性都能够保保持或者是更强,那与此同时的话,这个时候活性已经呃不仅仅是我们需要考虑的其中一个因素,我们还需要去考虑它的这个体外ad mett的一些数据,比如它的嗯透膜性,还有它的呃溶解性,或者是它的代谢稳定性等等。对,与此同时我们也需要进行初步的体内PKPD研究,主要是小鼠和大鼠,那在这个阶段的话,我们一般也是会获得3~5个PPC的分子,然后呢,再进入到嗯,普PCD to p CC阶段,那到了这个阶段的话,我们则需要进行更深入的这个PKPD研究,比如拓展到不同的种鼠,看看有没有相关性,那同时还要做相应的预读理念研究,比如像急毒、肠毒,那为了满足以上的研究,我们还需要进行C放大生产研究以及进行研究,那这个阶段获得的PC分子将会满足更高的标准,才能够进入到下一个阶段,也就是阶段,那这个阶段的话就是要主要是要向药监局准备各种申报的资料,比如我们需要符合监MP标准的CC生产,CMC生产资料、制剂的质量控制资料,然后主要的药效学实验资料、安全药理学实验资料以及多种毒性实验资料等等。
12:28
嗯,那其实CADD和ADD的工作主要是集中在heat to p PCC阶段。接下来我将跟大家一起看一下CADD和AIDD在新药研发中的应用。首先是CADD,那CADD的话,它是一个理性的分子设计方法,它的方法可以分为SBDLBDD以及BDD,那SBD的话,它就是基于结构的药物设计,它呢是起源于1894年fisher提出的这个索要原理,那也是就是基于这个原理去解释我们的小分子跟蛋白它的一个结合机制。
13:06
但是我们小分子跟蛋白结合,它不仅仅是这个空间形状上的匹配,还需要考虑能量的匹配,比如我们的小分子跟蛋白,嗯,它会存在嗯,氢键作用、输水作用,各种微观作用力,与此同时,嗯,我们蛋白口结合,口袋的结构和配体小分子结构也会因相互作用而变化,那因此1959年KNE提出了诱导契合。理论,然后SBDT,常用的方法主要是分子对接、虚拟筛选。等,然后第二个就是LBDD,也就是基于配体的药物设计,那这个方法的话,它的核心就是分子相似性原理。那嗯,就是意思就是我们认为结构相似的分子,它理论上也是具有呃活性比较就是相似的性质,嗯,那。嗯,像一维描述符,二维描述符,三维描述符则是我们LBDD的主要因素,基于这些描述符我们可以去构建相应的Q萨模型以及呃药效团模型。接下来是FBDD,那FBDD它最大的特点就是基于小型化学片段去筛选,那虽然筛出的苗头分子它的活性不是很强,但这个片段往往是它就是具有更高的一个结合效率,因此也方便后续的呃优化。它常用的药物设计方法主要就是片段生长,片段拼接等。
14:45
接下来我将跟大家分享AIDD在药物开发中的应用,那AIDD它就是一种结合深度学习,机器学习,自然语言处理等先进技术,通过分析大量的生物数据以及化学结构,然后深构构建相应的这个AI模型,然后进而加速药物的发现。那AIDD的应用场景,嗯,我分为了四大类,第一类的话就是蛋白结构预测,那大家相信大家都比较嗯熟悉阿尔法fo的two以及阿尔法for的three,我这里再跟大家简单介绍一下,对阿尔法for two的话,它就是将深度学习和。
15:25
物理、生物等相关的领域知识结合,然后实现了这个蛋白的结构预预测,那它本质上是静态蛋白结构问题的解决,那阿尔法food的3的话则是开始进入到这个动力学阶段,即可以解决任何类型的生物分子之间的一个成对的相互作用。嗯,这里也拿一个题外话,就是嗯,阿尔法福德的开发者,也是诺贝尔化学奖的其中一位得主,也就是哈萨比斯,他在一次访谈中,嗯提到他们团队最终的梦想是能够模拟这个虚拟细胞,与此同时,像现在AI加奥米斯也是一个比较热的一个方向,所以AI未来的发展是非常值得我们期待的。第二块就是AI分子生成,那我将这个分子生成又分成了嗯四大应用场景,第一个就是me兔母盒场景,那就是如果我们需要保留母盒,我们就可以进行基于股价液签的分子生成方法。那如果我们不想。
16:25
保留母盒,我们就可以固定骨价进行分子生成,那我们如果只是想对其中的片段进行替换,那我们就可以做于电子等排或者是基于化学反应的分子生成。那第二个就是分子侧面场景,那这个的话主要就是基于相似的分子生成,像这个基于迁移学习的摩尔力B以及这个基于强化学习的event都是,嗯,实际应用中就是比较强大的分子生成工具。第三个的话就是场景,那这个的话主要是包括基于蛋白口袋的分子生成,基于药效团的分子生成,以及基于蛋白口袋的片段生成。最后一个,嗯,也是比较有意思的方向,就是基于性质的优化场景,那就是,嗯,具体它就是要有一个优化目标,比如我的这个分子。
17:11
在实际的,呃,实际的测试当中,我发现它的溶解度可能不好,那我可能就想去定向的优化它这个呃这个指标,然后我们就可以做定向的分子生成,嗯,第3个就是AI筛选,那主要的话就是基于AI打分函数来预测配体跟蛋白的亲和力,也是我们今天需要去重点跟大家分享的一个,呃主题对第4块儿也是非常重要的,就是成药性预测,就比如嗯,PK溶解度,渗透性,代谢稳定性等等。接下来,我将跟大家分享AI筛选加速药物发现。嗯,我将跟大家就是先分享一下,就是基于蛋白的AI筛选,以及基于配置的AI筛选方法,然后呢,在嗯跟大家分享两个案例,嗯,也算是抛抛砖引玉,然后大家可以想想,就是AI筛选能不能跟自己的课题结合。
18:08
对以获得就是更有创新性的这个,嗯,结果成果。嗯,首先我们都我们对这个基于分子对接的虚拟筛选应该都比较熟悉,也是我们在药物筛选中非常常用的一种方法,那它的话就是通过计算机模拟来预测我们的这个配体跟这个受体蛋白的一个结合模式,以及它的一个结合强度,那影响分子对接预测精度的两个主要因素就是一个是打分函数的精度较差,另外就是靶标的柔性对分子对接的影响无法准确的评估,因此开发就是精度更高的这种AI打分函数。是非常有必要的,接下来我将跟大家分享这个基于蛋白的AI筛选模型,也就是RTMGO,那这个模型的话,它是一个基于残疾原子距离统计式的一个蛋白配体筛选方法,那在这个方法里面我们可以看到它的小分子是以这个图的形式作为输入,然后它的这个生物大分子则是以这个基于残疾的一个三维的坐标图作为输入,也就是每一个残疾都对应着一个三维的坐标点,然后呢,通过这个图,神经网络进行特征的提取,然后再合并,然后再通过这个transformer这个神经网络。
19:39
呃,进行对这些表征进行学习,最终的话,我们就可以得到嗯,原子跟残疾的一个距离统计式,那一个配体里面所有原子跟周围残疾的一个距离统计式之和即为这个配体的一个AAI打分。嗯,这个其实是有点类似于,就是传统的基于知识的一个打分。
20:02
那与此同时,作者也将这个打分rtm score跟其他一些先进的这个打分函数做了对比,那这个的话,它是基于嗯,这个CAS2016数据集的一个基准测试。那我们可以看到这两张图的话是输入的数据集不一样,一个是含有natives,一个是不含有nativenions,然后下面的话就是测试的方法不一样,一个是forward screen, 一个是reverse screen, 那我们都可以看到r TM score, 嗯,在不同的方法以及不同的这个输入数据,它的表现都是不错的。与此同时,嗯,作者也对更大的这个数据集进行了进一步进一步的测试,那我们可以看到嗯,RTMGO, 无论是在这个打分的能力。以及它的这个筛选能力上,嗯,我们可以看到它是优于像auto dog以及glide score的,对,因此这个r TM score也是一个非常有前景的一个AI打分函数。
21:05
接下来将跟大跟大家分享这个基于配体的一个AI筛选,这个呃就是及mini more, 那这个模型的话,它是呃,上海科技大学白方课题组开发的,然后非常值得一提的是他在2023年上海国际计算生物学创新大赛获得了一等奖,那这个模型的亮点主要是分为三个。第一个它是引入了构象空间,第二个就是它的预测精度很高,那在最终确定的6个分子里面,嗯,2个有活性。不审,最终筛选出来来的分子,分子跟受体的这个活性是0.98μmol,与此同时,它的计算速度也非常快,嗯,基于1800万的这个化合物进行筛选,一个小时就可以完成筛选。那这个模型它是怎么做到精度这么高的呢?这你就不得不提到它的一个模型的研发动机,在构想和靶标的相互作用中。
22:07
构一项空间信息非常重要啊,那为什么这个空间非常重要呢?那我们可以,那在PDP数据库中,我们可以看到这个结构以3种不同的构象和4种不同的蛋白有相互作用,那我们这边也可以看到,就是这个分子,它的可旋转键越多,那它对应的低能构像也会更多。那几mini world模型就是把这种构象空间特征融入到表征学习中,能够捕捉到分子结构和构象空间的一个复杂的关联。嗯,那在正式介绍吉米尼摩尔的这个算法之前,先跟大家分享一下这个监督学习和自监督学习。那监督学习大家都嗯,应该比较了解,它呢是一种传统的机器学习方法,它呢是通过已知的标签数据进行训练,然后利用这些标签来预测新数据的,新数据中的标签。那常见的这种监督学习方法就如包括线性回归、逻辑回归,这是向量机以及决策数。那自监督学习的话,它是一个比较新的机器学习方法,那它又被称为人工智能暗物质,它是第一次让人工智能有了这种自己学习的能力,具体它就是可以不依赖人工标注的数据,而是可以从无标签的数据中挖掘出有用的信息。那常见的自监督学习算法包括呃,语言模型自编码器,那我们比较熟悉的open AI开发的chinapt正是基于这种算法。
23:47
嗯,那我们可以看到吉米摩尔,它就是一个非常典型的自监督的对比学习架构,那这个模型的话,我们可以分成四部分,第一部分的话就是它的输入是以这种成对的分子以这种图的形式作为输入,然后第二部分的话就是通过这个wlan图神经网络,然后进行特征的提取,那提取完的特征以后,就用再基于这个MLMLP,也就是一个多层感知机对这对各个节点的这个特征进行处理。
24:20
处理完了再求平均值,然后呢,再输入到这个用于对比学习的这个projection his里面,那这个projection his的作用,它就是可以对这两个分子进行一个是二五维的相似度的学习,还有基于这种三维的构像的这种对比学习,那通过对上万的数据进行学习,我们就可以得到这个预训练的模型,那这个基于这个预训练的模型,嗯,它就是可以提取出就相应的这个特征,那这个特征的话,它就包含这种二维的信息,以及这个三维的信息,因此我们可以基于这个模型在就是这个预训练模型,然后再用于下游的这个任务,比如呃,虚拟筛选Q萨这个反向找法ADMT的模型的构建。
25:11
对,这里的话也举了,我们也举了3个例子,就是几米你摩尔能够捕捉相似构象空间。嗯,第一个就是嗯,这两个分子,这两个分子它是两种雌激素受体调节剂,那我们可以看到,呃,下面这个分子相对于上面这个分子是做了一部关环的操作,然后嗯,这个的话就是这几个分子的话,它是一个HHIV蛋白酶抑制剂,那我们可以看到这个分子,这个对标的分子,它的结构是一个是相对比较复杂的,然后它是一个拟态内的分子,然后跟它对标的分子结构都相比它来说都小很多,相对小很多,对,然后第三个的话就是嗯,这三个分子是这个凝血酶抑制剂,那其实这三个分子我们就是仔细看一下,他们在二维结构上其实差异还是比较大的那。
26:05
因此就是这这些活性分子,虽然基于这种就是传统的分子指纹打分,它的相似度都是比较低的,但是呢,因为他们具有相似的这种三维的结合模式,因此它们也具有相似的,嗯,活性那几米你摩尔就是可以准确的捕捉到这种三维的相似性。对,接下来将跟大家分享两个案例,呃,第一个就是呃,我们将DELL筛选跟AI筛选结合,然后探索更广泛的这个化学空间,嗯,先简单跟大家介绍一下DELL,那DELL的话,它它是其实是一个DNA编码化合物库的一个缩写,那利用这种技术可以将DNA编码。与数十亿的这个小分子化合物信息绑定在一起,使研究人员能够快速、高通量的筛选和鉴定潜在的药物候选。
27:00
货,那它是如何做到的呢?那我们可以一起看一看它的一个建库流程,那DELL建库它最大的一个特点就是split and poor啊,我们可以看到,嗯,首先我们需要获得一个连接子,那这个连接词我们通常称为head piece.那第一步我们是先把这个head piece spted spted到这个96孔板里面,然后通过这个嗯,相应的酶点反应,然后接上这个电音tag,然后再通过嗯,DNA兼容的反应,再把这个相应的BB接上,嗯,非常值得一提的是,在我们在对这个库进行设计的时候,我们要确保每一个BB都对应着一个独一无二的D音8扣的,然后异轮反应结束以后,我们会再把样品在破的这个试管里面,然后再split,然后再进行下一轮的反应。那打个比方,嗯,我们进行三轮反应,每一轮都用100个不同的BB,那理论上我们就可以生成100万的这个分子,然后再进入到下一步的戴尔筛选,那通过de尔筛选,我们可以获得一系列的这个跟我们的靶标蛋白有亲和力的分子,那我们再通过PCR扩增以及这个DNA测序解码就可以嗯,知道这个分子的结构,然后再通过off DNA合成,然后进行这个hit的验证。
28:27
与此同时,这嗯调库的设计也是非常重要的,我们在进行调库的设计的时候,会充分考虑这个库的多样性。那那个教学空间到这里举一个例子,就是关于吲哚,那吲哚的话,它嗯,它是一个天然产物骨架,也是药物分子中经常出现的一个片段,那我们基于这个片段,嗯合成了一系列的这个嗯骨架就是基于不同的嗯DNA金容的反应合成了嗯,就是三类不同的这种股价,然后我们在对这三种股价的。
29:05
这三个库里面的分子的这个理化性质,再进一步分析,我们可以看到,嗯,这些理化性质基本上是符合内药五原则,最终我们在将我们的分子在进行一个PCA降维分析,我们可以看到,呃,我们这个library的分子跟drag bank里面的分子的化学空间重合率达到90%以上。接下来跟大家分享,嗯,我们Di筛选的一个案例,那在这个案例中我们可以看到,嗯,我们是基于这个三情类的这个library进行筛选,然后呢,获得了一系列的跟我们的靶标蛋白有亲和力的分子,那我们可以看到这几个图上每个点都对应着一个带尔分子,那这个点的颜色越深,以及这个size越大,那就意味着它的这个嗯负极度是越高的。那我们提取的就负极度最高的前两个分子在做的阿DNA合成以及验证,我们可以看到这两个分子它的活性都是在纳摩尔级别的。
30:11
与此同时,我们在一些项目里面也将我们这个DELL筛选出来的数据作为我们这个AI模型的一个训练集以及测试集,那通过嗯紧密尼摩尔进行编码,以及构建相应的这个呃线性分线性回归模型,我们可以看到嗯在一些案例里面,我们预测的数据跟这个真实的数据还是有较强的相关性,然后基于这个模型,我们就可以嗯基于嗯,我们10万的这个in stock的这个化合物库,或者是1800万的这个高通量筛选库进行进一步的筛选,然后找到股价更多样的这个苗头分子。那RA的话,目前也是一个比较火的一个研究方向,因此我们也构建通过AI筛选构建了我们的RNA文库。
31:05
嗯,那相关的数据统计表明,就是在2万的蛋白质组的蛋白质中,只有15%是可以成药,同时这仅代表转录基因组的一部分,那就意味着有大部分转录组作为治疗靶点未得到充分的开发。因此靶向RNA的小分子也为新药发现打开了新的思路。那与rana作用的小分子可以作用于这个转录组,从而产生不同的这个下游效应,比如作用于作用于RMRA影响这个MRA的稳定性,然后作于non coding RA可能会影响基因的表达,那作用这剪切位点可能影响好的剪切,或者是降低这个不好的剪切,对不对?嗯,那我们都知道就是rana的结构,就是构成rana的基本单元与构成蛋白的基本单元是不一样的,那我们就在想靶向rana的小分子是否是有哪些特征呢?我们可以先看一下靶向rana的小分子都有哪些,嗯,结构特征我们可以从这张图上首先是看相互作用,那我们可以看到靶向rana的小分子跟RNA主要是一些氢键作用,以及这个肽堆积作用,同时我们可以看到在这些靶向RNA的小分子中,嗯,我们都可以看到,比如氨基或者是这种胍基这些可以质子化的基团,还有像这种氨基糖苷也是嗯,RNA的1。
32:37
就是右边。法向RA的小分子里面的一个高频片段。与此同时,像这种。碱基的电子层排体,也是靶向RNA的一个高频片段。那也有相关的,嗯,研究团队专门为此进行了一个研究,那具体的就是他们是基于24572个内药分子,然后分别靶向27种RNA和9种DNA。
33:03
然后呢,最终通过这个s MIS mm筛选,他们获得了2188个分子,可以至少跟一种核酸有相互作用,然后基于这个数据来构建相应的这个积极学习模型以及深度学习模型,那首先是他们先是基于2003个这个RB的分子,以及2350个这个protein b的这个分子,然后构建这个嗯,机器学习分类模型,我们可以看到它的这个呃,AAOROOC的值是0.87。然后再基于2003个这个R半的数据,以及7万多个这个呃普uting班的分子,然后再构建这个MLP分类模型,我们也可以看到它的这个分类效果依然还是可以的,它的这个嗯,AUPRC的值达到0.7以上,因此受此启发,我们也构建了嗯,通过AI筛选构建我们的RN文库,具体就是嗯,我们先是从这个RBY呢,PDBMC以及RO。
34:13
BN这个数据集里面收集了大概3万的这个RNBY呢,以及proteinuting by的数据,然后接下来就是通过紧密尼摩尔进行这个基于结构的特征提取,以及同样就是生成的1700多个分子描述符,然后呢输入到13个模型里面进行训练。那我们可以看到,嗯,这13个模型,它的训练结果其实还是都不错的,嗯,那它的AOROC,嗯,都是大于0.7,以及它的这个ACC,也就是准确率也是都是大于0.7的,那我们最终挑选的这个表现最好的发音to模型,它的ARC达到了0.82,然后准确性达到了0.76,然后进用于下一步的筛选。
35:00
嗯,这个就是我们的一个筛选流程,我们基于我们8万的这个内药分子,然后通过这个模型进行筛选,获得7000个分子,然后最后再通过这个STR规则进行筛选,那这个规这个规则的话,嗯,它其实就类似于内药物原则,它是由这个公司,这是一家AI公司,然后然后专门是嗯从事RA方向,对他们基于他们的内部大的数据集,然后整理的这个规则。对,最后的话就再跟大家简单介绍一下我们的MC一站式药筛平台。嗯,MC一站式药筛平台主要是聚焦于药物发现早期,然后我们在药物筛选领域积累了丰富的经验,那我们是可可以提供各种各样的化合物库,比如生物活性库,我们可以提供200加的这个,呃,生物活性子库,以及2500两,呃,25000个具有明确生物活性的这个化合物,与此同时我们还可以提供高通量筛选库,呃,我们可以提供7万多的这个内药多样库,并且是国内现货,然后还可以提供1800万的这个现货筛选化合物,那嗯,我们除了可以提供,我们还可以就是帮助客户来代购,我们内部也是有一个自动报价的系统,里面有相应的算法,可以帮助客户更快更省的获得这个现货筛选化合物,与此同时,我们还可以提供这个虚拟化合物库,买个优以及这个21的de尔库以及Del筛选。
36:29
同时我们还可以提供非常完善且成熟的这个筛选服务,比如虚拟筛选,比如AI筛选,还有嗯,药物的实体筛选。嗯,谢谢大家啊,接下来把时间交给小M。嗯。那非常感谢我们老师的精彩分享,真是让人受益匪浅呐,接下来到我们小M的时间啦,各位小伙伴们,MC呢多年以来一直致力于生物活性分子的研究,服务于全球的生物医学研究以及药物发现领域的优质顶尖客户,其优秀的科研成果已经发表在包括CNS在内的48000篇。
37:18
呃,生物医学和新药研发科研文献中,在全球范围内呢,MC也拥有超过6000家的知名合作伙伴,包括世界知名的医药企业和顶尖的高效科研机构,那MC呢,也是深度布局多个产品线,不仅有活性小分子蛋白、大分子多肽、核酸等常规产品,也包含ADC protect等特色产品以及专业的定制服务,可以根据您的需求为您的科研提供一站式的药物筛选服务呢。听到这里,小伙伴们是不是已经抑制不住自己想要做实验的销售啦,MC将祝你一起攀登科研高峰,那评论区的小伙伴们对本次讨论也是分享讨论的热火朝天呢,那我们话不多说,先开启我们的答疑环节,并且开启最后一轮的抽奖,相信认真听讲的小伙伴已经发现了,我们直播的,嗯,直播上头的这个周围呢,已经摆满了我们的周边和实验的用品,非常的精美可爱那。
38:19
特此呢,小M为努力听讲的萌家人准备了12份精美的MC周边礼包,是拥有一个小型加湿器以及随机的盲回个,一共有12份奖品。嗯,想要参与抽奖呢?必须要在我们的评论区中提出与本次分享主题,也就是我们AI药物发现药物筛选主题相关的这个问题,如果您是无效评论,我们是会提供,我们是会取消您的中奖资格的,也记住要一定要是原创的提问哦,不要复制其他人的提问,请大家多多互动,不仅能答疑解惑,还能赢取大奖。那如果您是识频号和B站平台端的观众呢,可以扫描我们屏幕左侧的这个二维码来参与本轮抽奖,一起来获得这个周边礼包啊,那我们本次也是给大家准备了我们这个直播间的福利,那也是,嗯,带来了几款热销的虚拟筛选及现货化合物库的套餐呢。
39:19
本次限时是8折优惠,仅在本次直播间中,呃优惠如嗯,MC也是为您提供了一次性的提供了这个现货,一共有三款套餐,在1月10日内,也就是本次直播起的一个月内,如果您下单并且呃完成这个订单之后,即可以接受我们这个超值礼包,也就是我们礼品池的这六款产品,可以任选其一或者是其二其三,这是根据您订购的套餐不同可选择的这个礼品的数量也是有所不同的,如果您感兴趣的话,请添加我们左下角这个MC的直播小助理的微信,在直播期间呢,添加我们直客服的微信,然后进行预约,附上您的科研单位啊,以及您的课题组和您意向这三个套餐中哪一款套餐呢?还有就是特殊说明一下,我们这个本次的这个福利活动呢,也是不和其他的优惠福利活动同享。
40:19
那我们有意向的小伙伴可以带上我们本次直播间的暗号,也就是这几句话,MC药物筛选,要筛就选MC这个暗号,在一个月内承担解锁这个超值大礼包。那话不多说,话不多说,我们答疑环节马上开启,嗯,扫描这个二维码也是可以参与我们本轮的抽奖,那我们再次邀请我们的老师闪亮登场,和我们一起答疑。
41:00
嗯,首先第一个问题是小宝问AI筛选和虚拟筛选有什么区别呢?请老师回答一下啊,那就是嗯,其实AI筛选跟这个嗯分子对接其实是它的本质都是基于这个打分函数嗯来去评估的,那分子对接的话,它是基于立场参数,然后去模拟蛋白跟配体的一个相互作用,那AI筛选的话,它主要是嗯基于就是嗯就是基通过AI来学习,然后获得相应的这个AI打分函数,对,然后再基于这个AI打分函数去预测配体跟蛋白的一个呃结合强度这样。好的,那我们第二个问题是,嗯,有小伙伴问老师,基于蛋白的AI筛选数据的输入形式是什么样的?化合物的这个smells和对应蛋白的序列组成的CCV文件吗?嗯。
42:02
嗯,基于蛋白的AI筛选它的输入,首先蛋白是一个,嗯,三维的。结构,然后化合物的话是一个smiles的结构,嗯嗯,不是对应的蛋白的序列。好的,那下一个问题是,呃,如果有一个靶点的话,是推荐这个CADD还是ad筛选呢?哪个阳性率会更高呢?嗯,其实两种方法都可以推荐,然后阳性率更高,这个是,呃,暂时没有办法去确定,这个要在具体项目中根据你的,嗯,就是收集到的这个数据集。然后嗯,获得一个更高的,更就是精度更高的这个AI筛选函数,那它的可能就是AI筛选它的阳性率更高,那如果嗯,我们这个项目就是没有太多的这个呃数据可以供AI去学习,那可能传统的就是分子对接,它的这个阳性率可能是更高的。好的,那下一个问题是,呃,小伙伴们,目前AI筛选后的进行实验验证,预测的准确率能有多大呢?可以评估一下吗?这个其实也是不太好评估,嗯,也就是刚刚其实这个问题跟上一个问题是类似的,对,然后其实AI筛选它的精度取决于它能它获得的数据,它获得的数据越多,然后越多样,那它这个AI函数的精度也会更高,然后进而它的预测准确率也会更高,对,好的,那下一个问题是,嗯,小伙伴问AI筛选后的药物?
43:42
稳定性和平行性好不好呢?嗯,AI筛选后的药物稳定性,嗯,这个要看我们通过什么方法去筛选了,对,嗯,就是看您关注哪些指标,然后通,嗯通过相应的这个算法,呃,就比如您就是可能考虑这个我的分子希望它的这个代谢稳定性更强,那可能我们要去,嗯,找到相应的这个针对性的算法,然后去预测一下,然后它是有可能提高这个分子相应的这个稳定性。
44:14
对。嗯,我们现在是有靶向RNA的化合物库的。这个化合物库是参与了我们暖冬季的活动,对吧?嗯,是的,给大家看一下,就是这个,呃,这个小伙伴问的是针,呃针对靶向RNA的化合库,那我们的货号是HY-L917,嗯,化合物数量是在5000加左右,然后限时也是五五折优惠,您可以就是嗯截图留存这个货号,然后去咨询一下我们当地的销售代表。嗯,好的,那我们先返回这个福利页面,那继续我们的答疑环节,那我们MC的AI筛选有什么高分文章应用的案例吗?
45:00
啊啊,这个我们还需要再去查一下,暂时暂时还没有看到,对,我们要去再去确认一下。嗯,下一个问题是这个AI筛选的准确性是如何呢?嗯,呃,对,这个问题跟刚刚的问题其实类似的,对,还是取决于我们的这个数据集的一个大小,以及它的一个多样性,对。下一个下一个问题是AIDD的优势是什么呢?嗯,AIDD的优势,嗯,一个是它是显而易见的一个快。另外的话就是,嗯,怎么说呢,他可能相对于传统的这个对接打分,它的创新性嗯也更强。嗯,我们下一个问题是小伙伴问A筛选的价格如何呢?嗯,简单介绍一下我们MC的这个产这个产品的优势啊,嗯,这个嗯,AI筛选的价格,嗯,我们需要根据具体的这个就是项目评估以后再去提供相应的报价。
46:13
嗯,好的,那如果呃,感兴趣的这个客户可以也是联系我们的销售,可以先听一下我们这边的报价,以及我们这些产品的一些内容哈,那我们继续我们的答疑,下一个问题是嗯。DELL中通过NGS测定copy number的目的是什么呢?嗯嗯,这个copy number的目的是为了就是检测这个分子的一个负极度,然后负极度越高,那这个分子的亲和力可能也是越高的。嗯,好的,那下一个问题是。
47:01
因为筛选是提供技术服务,这些服务都包括哪些认内容呢?老师可以再详细再介绍一下啊,嗯,我们是可以提供,嗯,就是比如刚刚提到的基于蛋白的嗯,AI筛选,以及基于配体的AI筛选。然后嗯,具体的内容的话,就是我们会训练出一个嗯不错的模型,然后嗯,给到一个相关性,然后再基于这个训练好的模型,再对嗯更大的数据集进行筛选,然后给到您这个,呃,就是。排名靠前的这个推荐的这个分子大概是这些,嗯嗯,也有小伙伴想了解一下单纯的这个虚拟筛选是什么价格,有什么优优惠吗?哦,那这个呃,优惠以及这个价格,您可以就直接联系我们的呃,线上的技术以及或者是你们对应的这个销售,嗯嗯,也是可以直接就是呃,留下您的科研单位在我们的直播间,或者直接咨询这个我们MCE抑制剂的公众号后台留言,然后我们给您有推具体的这个销售和以及报价的情况哈,那我们继续我们的答疑,是下一个问题是刚才提到的这个核酸药物AO是你们自己设计合成的吗?哦呃,我们提到的是,其实是靶向rana的小分子,嗯呃,今天提到不,不是这个不。
48:38
So, 对,我们今天是提的就是靶向RNA的小分子,然后这些小分子的话,嗯。有是我们合成的,也有我们,呃,从一些其他的那个品牌里面,品牌品就是其他的厂家那边嗯,购买的。嗯,好的,那下一个问题是这个,嗯,这个平台和MC的药筛平台有什么区别,药筛需要自己做吗?还是给数据,那这个这个问题还是想要了解一下,我们这个药筛平台是具体会提供什么内容,对吧?哦,嗯,那个吉米内摩尔它是一个预训练的模型,我们是可以基于这个预训练的模型,然后嗯,构建相应的这个AI模型。
49:29
嗯,跟MC药筛平台,呃。嗯,怎么说它是属于MC要筛平台的AI筛选服务下面的,嗯,其中的一个,呃,预选就是其下面的一个服务项,对。不知道我有没有解释清楚,AI需要自己做吗?还是给数据,他需要筛需要,呃,可以给我们数据,然后我们帮你做。我们也是提供这个这些服务的哈,嗯,后续可以有AI筛选实例分享嘛,那老师这边也是可以后续的在呃深度了解这一方面,然后给大家在可以分享在公众号平台上,大家可以后面再关注一下,那我们后面再看一些其他问题,如何基于AI发现药物靶点呢?可以简单讲讲啊,嗯嗯,像当前就是这当前也是刚刚我提到了像AI加组学也是现在一个比较热的一个方向,就比如现在有一些基于嗯知识图谱的这个转录基因组学相关的AI模型,嗯,这个您可以去具体去嗯去看一下,对也是有这方面的研究的。
50:49
好的,那下一个问题是这个客户想了解一下我们这个AI筛选这个服务的周周期大概是多久呢?嗯,一般的话我们嗯需要具体评估一下,然后大概的话是嗯。
51:06
2周左右。嗯,好的,下一个这个这个用户猫提问是AI筛选目前最多应用于哪些领域啊,杂交流抗体筛选可以吗?嗯,不好意思,就是我是比较了解,就是基于小分子的AI筛选,那其实嗯,抗体筛选应该也是一个嗯,比较不错的一个方向,但是对这方面我还不是很了解,回头我们也可以调研一下,然后在相应的渠道给您分享,那这个呃,这个这个这个提问的这个用户也可以在我们的公众号后台留言,我们后续,呃有一些比如说发现的一些文献信息,也可以后面再联系您发给您哈,可以再联系我们的技术人员,那下一个问题是小伙伴们针对结构改造或者进行活性优化,是不是AIDD更有优势呢?嗯。
52:06
针对结,嗯这个的话,其实CADD和ADD,嗯他们是嗯就是不太好去对比对,然后嗯基于结构的改造,嗯就是CADD它比较强的就是我们可以去分析,去分析SCR构效关系,然后有针对性的去改造,就相当于是给AIDD提供一个方向,那AIDD的话,我有了这个方向以后,我就可以去,嗯进行相应的这个分子生成,然后加快这个药物分子的发现,我觉得他们是一个组合。对,各有优势。好的,那我们下一个问题是这个无名用户,嗯,提问的是AI对多次跨膜蛋白结构的准确性如何呢?对其活性位点的预测是否靠谱呢?嗯,这个需要具体问题具体分析,对,那就是嗯,其实有很多的AI模型,那可能就是怎么说呢,黑猫白猫抓到好猫的,呃,抓到不管是黑猫还还是白猫抓到脑手都是好猫,就这些模型,其实我们要去多多的尝试。
53:18
然后再结合实验验证,然后才能得出这个结论,嗯嗯,好的,下一个这个用户zilu提问说,老师您好,这个筛选模型的硬件需求是什么样的呢?哦,这个呃,这个我回头可以整理一下发给您,这会儿一时嗯没办法跟您讲对好,那您也可以,嗯这个用户可以添加我们这个直播小助理的微信哈,然后留言一下,我们这边稍后这个讲师会给您发这个您的问题的答案的哈,那下一个问题是这个MJZ用户提问的是对于小分子和大分子的药物发现应用AI筛选的成功率哪个更高呢?嗯嗯嗯,这个嗯,这个不好,这个说这个说实话,这这这个大分子小分子其实通过AI筛选都是比较火的一个方向,但是我是比较。
54:19
嗯,熟悉这个小分子大分子倒还没有去具体的了解,对,这是个很好的问题,我们回头也可以就是去调研一下,然后有结果再跟您分享。嗯,好,下一个问题是这个李明周同学提问是虚拟筛选的靶蛋白,如果没有三维结构资料,能对该蛋白进行筛选吗?嗯嗯,其实在我们日日常的这个项目里面,我们是呃,就是这个场景是可以去就这个蛋白进行筛选的,因为我们现在是可以通过阿尔法food的去预测,预测出这个蛋白,然后再找潜在的结合位点,然后再进行这个筛选。
55:00
对,嗯,好的,那其他平台的小伙伴提问是在筛选中是哪里用到了AI的算法呢?嗯。啊对,嗯,刚刚那个slide你们提到就是我们带尔带尔筛选以后会就是理论上会获得一系列的这个跟这个靶蛋白有亲和力的数据,以及它相应的这个负极度的指标,我们可以把这个呃数据作为我们AI模型的一个训练以及测试数据集,然后去训练箱的这个呃回归呃线性回归模型这样,然后嗯,当然我们要先去验证一下能不能找到相关性,那如果能找到相关性的话,就可以基于这个训练好的这个模型,然后基于更大的数据集进行这个筛选。嗯嗯,好的,那下一个问题是小伙伴们基于受体的虚拟筛选可以再讲一下吗?嗯嗯,基于受体的虚拟筛选就是嗯首先嗯我们需要知道这个蛋白的结合口袋,然后呢,再通过这个计算机模拟,也就是相应的这个嗯分子对接软件,然后嗯进行这个就是把兄子跟这个蛋白进行这个对接,对接完了以后我们再去根据打分以及它的这个配的这个POS。
56:25
就是就是这是它的结合模式,然后进一步评估。对,就是一方面是看它的对接打分,另外我们也要看一下它的MM级别C,就是嗯,结合自由能,还有它的这个什么配体,配体应变力等多个指标,然后综合的去分析这个分子跟这个蛋白的一个结合能力。嗯,好的,那我们还有两个问题,那我们马上解答完毕了,答疑环节就结束了,那下一个问题是PPT中提到这13个训练模型有什么主要的区别吗?嗯嗯,这13个训练模型其实它各有侧重点,那我们在实际项目中,我们会每个模型都会去,嗯,去训练,然后挑选结果最优的那个模型作为下一步的这个筛选模型。
57:15
好的,那我们最后一个问题是这个哦,这个AI筛选平AI筛选药物的速度和普通的CDD对比怎么样呢?是速度会更快吗?嗯,对,是的,就是是速度更快,对。啊,那看来它的优势就比较大的,就是这个速度比较快哈,那我们本次的答疑环节也是结束了,也是要恭喜各位中奖的小伙伴们,大家要记得截图及时的兑换你中奖的奖品哦。好的,那我们就呃,非常感谢老师今天的精彩分享,也感谢每一位参与直播的观众,那我们本次直播即将结束了,想要观看回放的朋友呢,可以关注我们的MCE抑制剂公众号,您可以在后台留言我们,比如说我们本次直播中没有回答到的问题呀,可以在我们的后台留言,然后想看回放呢,可以在我们的MC视频号,关注我们MC的视频号,在直播回放中观看本次直播的回放内容,以及所有以及所有直播相关的产品信息和直播回放呢,也可以在我们MC官网右上角活动中心进入的萌家学堂板块中找到,同时别忘了关注我们的小红书账户,也就是我们的MCE中国小红书账户,每个月都有精彩纷呈的福利活动等你来参与,还会随机掉落。可爱的周边。
58:41
给大家免费发放,那如果你有任何关于产品咨询,定制需求或者是售前售后的问题呢,以及相关的合作事宜,欢迎随时通过以上的联系方式来联系我们,那再次感谢大家的参与,那我们下次直播再见啦,大家再见。
59:04
嗯,太好了。
我来说两句