首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场

实验盒

专栏成员
94
文章
102050
阅读量
13
订阅数
ICLR|ESM-Effect:基于蛋白质语言模型的突变功能效应预测框架
准确预测蛋白质突变的功能效应是一项关键且具有挑战性的任务。突变的功能效应不仅涉及其是否具有致病性(如“良性”或“有害”),更需量化其对蛋白质功能的具体影响,例如酶活性或稳定性的增减。这类信息在癌症靶向治疗和蛋白质工程中尤为重要,例如某些药物的疗效依赖于突变是否导致酶活性增强。
实验盒
2025-03-24
2010
scDiffusion-X:基于多模态扩散模型的单细胞多组学数据生成与调控网络解析新工具
单细胞多组学技术通过在单个细胞层面同时测量多种分子模态(如转录组、表观基因组、染色质可及性和蛋白质组等),为揭示细胞异质性、发育轨迹和调控机制提供了前所未有的视角。然而,该技术在实际应用中面临诸多限制,包括实验成本高昂、样本制备复杂、数据噪声显著以及多模态数据的对齐与整合困难等。传统计算方法,如变分自编码器(VAE)和流模型,在生成质量和跨模态推理能力上存在明显不足。
实验盒
2025-03-24
2130
Nature重磅:“文本梯度”实现反向传播,自然语言反馈优化生成式AI
生成式人工智能(AI)在计算生物学和生物医学领域的应用日益广泛,从药物分子设计到癌症放射治疗规划,其作为“智能助手”的潜力逐渐显现。然而,传统优化方法在面对生成式AI系统时面临诸多挑战:这些系统往往包含不可微分的黑盒组件(如语言模型或分子模拟器),依赖数值梯度的反向传播难以适用,且通常需要专家手动调整参数或提示词,效率低下且难以推广。
实验盒
2025-03-21
1970
ICLR|基于LLM智能体和知识检索的基因集功能发现工具
多组学数据为揭示基因功能和疾病机制提供了前所未有的机会。然而,如何从海量数据中提取有意义的生物学见解仍是重大挑战。传统工具如基因集富集分析(GSEA)和过表达分析(ORA)在关联基因集与已知生物通路方面表现良好,但其依赖现有数据库的局限性使其难以发现未知机制。此外,这些工具通常要求用户具备一定的编程能力,并需手动整合文献信息,这增加了应用门槛。近年来,大型语言模型(LLM)因其强大的文本处理能力受到关注,但其“黑箱”特性、知识更新滞后以及与生物信息工具的割裂限制了其在科研中的直接应用。
实验盒
2025-03-20
1610
ICLR|无需参考数据库,LLM智能体实现单细胞转录组自动注释
单细胞和空间转录组学技术为解析细胞异质性提供了重要工具,但细胞类型注释作为其核心分析步骤,传统上依赖人工比对基因标记和参考数据,过程耗时且对领域知识要求较高。
实验盒
2025-03-20
1410
ADAM-1:融合多智能体与RAG的阿尔茨海默病多模态数据诊断框架
阿尔茨海默病(Alzheimer’s Disease, AD)是一种复杂的神经退行性疾病,其发病机制涉及β-淀粉样蛋白斑块、tau蛋白缠结、免疫系统失调、代谢紊乱以及肠道微生物组失衡等多重因素。近年来,研究表明肠道微生物组通过“肠脑轴”与神经炎症和AD进展密切相关。然而,传统研究多局限于单一模态数据(如基因、临床指标或影像学)的独立分析,难以全面揭示AD的多维病理特征。如何整合碎片化的实验室数据与全球科研文献,成为推动AD研究突破的关键。
实验盒
2025-03-18
1680
蛋白质结构tokenization新进展:基准评估框架与优化方法的探索
蛋白质是生命活动的基础,其功能由氨基酸序列折叠形成的三维结构决定。尽管传统实验技术(如X射线晶体学和核磁共振)能够揭示蛋白质结构的细节,但这些方法耗时长、成本高。近年来,计算生物学的发展推动了蛋白质结构分析的新方向,其中 蛋白质结构分词(Protein Structure Tokenization, PST) 作为一种新兴技术,通过将蛋白质的三维结构离散化为可计算的表示形式,为功能预测、多模态建模及药物设计开辟了新的可能性。
实验盒
2025-03-17
1320
大模型能否取代人工标注生物医学文本?最新研究解析其挑战与突破
生物医学领域每天产生海量的科学文献,仅以COVID-19疫情期间为例,相关论文数量就超过40万篇。这些文献蕴含丰富的知识,如基因功能、疾病关联和药物相互作用等,为构建生物数据库和推动医学研究提供了重要资源。然而,传统上依赖人类专家根据详细指南对文本进行标注的方式,既耗时又难以应对文献数量的快速增长。
实验盒
2025-03-17
1610
TEDDY:单细胞生物学基础模型及其在疾病分类中的实践
单细胞RNA测序(scRNA-seq)技术的快速发展为解析细胞异质性和疾病机制提供了高分辨率的数据基础。然而,如何从海量单细胞数据中提取有意义的生物学信息仍是一项挑战。
实验盒
2025-03-17
1290
GPT跨界预测癌症药物敏感性?Mayo Clinic团队推出SensitiveCancerGPT框架
在精准医学时代,药物敏感性预测(Drug Sensitivity Prediction, DSP)作为优化癌症治疗方案的关键环节,面临着肿瘤异质性、高维组学数据以及样本稀疏性等挑战。传统机器学习方法在处理这些复杂问题时往往表现有限,而生成式大语言模型(LLMs)如GPT的兴起,为DSP任务提供了全新视角。
实验盒
2025-03-17
1010
MultiMol:协作式专家智能体驱动的药物分子多目标优化
在药物研发中,分子优化是连接基础研究与临床应用的关键环节。理想的药物分子需同时具备高效活性、良好稳定性、低毒性等多重特性。然而,这些性质之间往往存在相互制约的关系,使得优化过程异常复杂。传统方法依赖专家经验和反复试错,耗时长且失败率高,而现有的人工智能(AI)技术在多目标优化场景下仍面临生成分子有效性不足和骨架保留能力有限的挑战。
实验盒
2025-03-13
1390
主动学习优化抗体-抗原结合预测:实验与计算的协同提升
抗体-抗原结合预测是抗体药物研发和免疫学研究中的核心问题。抗体通过与抗原特异性结合发挥中和病原体或标记清除的作用,其疗效高度依赖结合能力。然而,抗原的快速突变(如SARS-CoV-2病毒变体)常导致抗体失效,而传统实验方法通过“文库对文库”(library-on-library)穷举测试抗体-抗原组合,成本高昂且效率低下。此外,机器学习模型在分布外(out-of-distribution, OOD)预测中的表现不足,进一步限制了其应用。
实验盒
2025-03-12
1230
生信AI智能体遭遇滑铁卢?BixBench基准测试揭示主流LLM三大短板
大型语言模型(LLM)凭借其强大的语言理解和生成能力,被认为有潜力加速生物数据分析、实现自动化科学发现。然而,尽管这些模型在通用领域表现出色,其在生物信息学复杂任务中的实际应用能力仍需进一步验证。
实验盒
2025-03-11
1340
“一句话”挖掘队列数据,大语言模型实现全球基因组数据智能交换与分析
随着基因组学的快速发展,全球范围内积累了海量的基因组数据。这些数据蕴含人类遗传多样性的重要信息,为疾病诊断、治疗及科学研究提供了宝贵依据。然而,数据的爆炸式增长也带来了挑战:传统的数据查询方式需要用户手动编写复杂查询语句、理解专业术语,甚至依赖生物信息学专家支持,这一过程不仅耗时,还容易出错。对于许多临床医生和研究人员而言,Beacon协议虽为基因组数据共享奠定了基础,但其技术门槛依然较高。
实验盒
2025-03-10
1140
读心AI有望实现?从脑信号到自然语言,BrainLLM实现非侵入性语言生成
如何实现从非侵入性脑记录中重建自然语言?传统方法通常依赖预构建的语言候选集,通过分类任务匹配从脑记录中解码的语义表示。然而,这种方法在处理开放词汇和复杂语义时存在显著局限。
实验盒
2025-03-10
1680
LLM在生物信息学中表现如何?Bio-benchmark给出了30项任务的全面评估
随着计算生物学的进步,传统方法在解决蛋白质折叠、功能注释及新生物分子设计等问题时逐渐显露局限性,例如计算复杂度高或泛化能力不足。而大语言模型(LLMs)凭借其强大的语言理解与生成能力,为这些问题提供了新的解决方案。它们不仅能处理电子健康记录(EHR)或中医药问答等文本数据,还能分析蛋白质和RNA等生物序列,表现出比传统方法更高的准确性和适应性。
实验盒
2025-03-10
1450
MD Anderson发布DrBioRight 2.0,一句话实现癌症蛋白质组学自动分析
癌症功能蛋白质组学通过解析蛋白质表达及其翻译后修饰,为揭示肿瘤发生机制、发现生物标志物和治疗靶点提供了重要支持。尽管癌症基因组学和转录组学数据已通过项目如癌症基因组图谱(TCGA)和癌症细胞系百科全书(CCLE)积累了丰富资源,但在蛋白质功能调控层面仍存在显著空白。传统工具,如反相蛋白芯片(RPPA)数据分析平台,在蛋白质标记覆盖范围和分析灵活性上存在局限。
实验盒
2025-03-07
1850
LAMAR:基于预训练语言模型的RNA调控解析新方法
RNA作为生命活动中的核心分子,在基因表达调控和蛋白质合成中扮演关键角色。其代谢过程,包括剪接、翻译和降解等,受到多种顺式调控元件和反式因子的协同作用,表现出高度复杂性。RNA功能的多样性不仅依赖于其序列,还涉及二级结构、RNA结合蛋白(RBPs)以及细胞环境的综合影响。例如,mRNA的翻译效率常由5'非翻译区(5' UTR)调控,而稳定性则主要受3'非翻译区(3' UTR)影响;剪接过程需要精确识别剪接位点,而内部核糖体进入位点(IRES)则在应激条件下支持帽独立翻译。然而,传统计算方法通常针对单一任务设计(如剪接位点预测),缺乏统一框架来解析RNA调控的多层次规律。从海量序列中挖掘通用规则,成为RNA研究领域亟待解决的难题。
实验盒
2025-03-06
1420
MIT与微软联合发布CleaveNet:基于生成式AI的蛋白酶底物预测与从头设计
蛋白酶作为生物体内重要的催化酶,通过特异性切割肽键,参与调控多种生理和病理过程,例如伤口愈合、组织重塑及癌症转移等。设计能够被特定蛋白酶高效识别和切割的肽段底物,不仅对理解酶的特异性机制具有重要意义,还在药物开发和诊断工具设计中具有广泛应用前景。
实验盒
2025-03-06
2670
ProDMM:跨模态Transformer模型实现蛋白质与DNA互作预测与生成
蛋白质与非编码DNA(NCDS)的相互作用是调控基因表达和代谢通路的关键,但其复杂性长期制约着高效生物工程的发展。传统方法依赖实验试错,耗时耗力;而现有深度学习模型大多聚焦单一分子类型(如仅蛋白质或仅DNA),难以捕捉跨模态的协同效应。
实验盒
2025-03-04
1800
点击加载更多
活动推荐
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档