Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nat. Biotechnol. | 组织特异性蛋白互作图谱助力候选致病基因优先排序

Nat. Biotechnol. | 组织特异性蛋白互作图谱助力候选致病基因优先排序

作者头像
DrugAI
发布于 2025-05-05 06:00:59
发布于 2025-05-05 06:00:59
1120
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

尽管蛋白–蛋白相互作用图谱已取得显著进展,其在不同组织中的特异性仍研究不足。在本研究中,研究人员基于蛋白质共丰度可预测功能关联的前提,整合并分析了来自11个人体组织的7,811个蛋白质组学样本的蛋白丰度数据,构建了一个组织特异性的蛋白相互作用图谱。研究人员发现,该方法不仅能复现已知的蛋白复合物,还能揭示细胞的更大结构组织。稳定蛋白复合物的相互作用在各组织中高度保守,而细胞类型特异性的结构(如突触成分)则是组织间差异的重要驱动因素。

研究结果显示,超过25%的蛋白关联具有组织特异性,其中不到7%可归因于基因表达差异。针对脑组织,研究人员通过突触体的共分级实验、脑源拉下数据的人工整理以及AlphaFold2结构建模,对蛋白相互作用进行了验证。进一步地,研究人员还构建了与精神分裂症相关基因的脑组织相互作用网络,表明该方法可用于在与脑疾病相关的基因座中功能优先筛选候选致病基因。

蛋白–蛋白相互作用决定了细胞的物理结构和功能,其异常可能导致疾病。尽管近年来质谱技术和高通量筛选方法的进步推动了蛋白互作的研究,现有数据库多为不具上下文的全局互作信息,而实际互作在不同组织或细胞状态中具有高度特异性,且不到一半的蛋白可在所有组织中检测到。

为理解细胞类型特异功能、识别药物靶点以及构建系统级细胞模型,明确蛋白互作的组织特异性至关重要。以往研究常借助基因表达数据推测组织特异性互作,但mRNA共表达对预测蛋白互作的准确性有限。相比之下,蛋白共丰度(coabundance)被证明更能准确预测蛋白关联,因为复合物亚基往往协同表达并以特定化学计量组装,未配对亚基则倾向降解。

在本研究中,研究人员基于7,811个人体样本的蛋白质共丰度数据,构建了涵盖11种组织、约1.16亿对蛋白的组织特异性蛋白关联图谱。该图谱不仅复现了已知复合物,还揭示了功能模块间的关系,并为疾病相关基因提供了上下文关联线索。研究人员以脑组织为例,结合多种互补数据验证该图谱在组织特异性致病基因和互作优先排序中的应用价值。

研究结果

基于蛋白共丰度的全基因组蛋白关联评分

研究人员首先收集了癌症队列的蛋白质丰度数据,汇总了来自14种人体组织的50项蛋白质组学研究,包含5,726个肿瘤样本和2,085个邻近健康组织样本,并配套收集了其中2,930个肿瘤样本和722个健康样本的mRNA表达数据。利用蛋白复合物成员在转录和翻译后水平的共调控特性,研究人员计算了基于丰度数据的蛋白–蛋白关联概率。具体而言,先对数据进行对数转换和中值归一化,再在每项研究中对至少在30个样本中被共同检测的蛋白对计算皮尔逊相关系数。随后,以已知蛋白复合物亚基为正例(来自CORUM数据库),利用逻辑回归模型将相关性估计转换为蛋白关联概率。

通过与蛋白共分级和mRNA共表达等方法对比,研究人员发现蛋白共丰度在复现已知蛋白复合物上表现最佳(AUC=0.80),优于蛋白共分级(AUC=0.69)和mRNA共表达(AUC=0.70)。将mRNA与蛋白丰度联合使用并未进一步提升识别能力,且剔除基因表达后所得共丰度估计仍表现良好,提示预测能力主要源于翻译后调控而非基因表达。因此,研究人员最终仅使用蛋白共丰度来计算蛋白关联概率。

构建组织特异性蛋白关联图谱

研究人员进一步验证了同一组织的不同研究是否能反映一致的组织特征。通过聚类分析,发现相同组织的样本之间具有较高一致性。定义“组织特异性”的蛋白关联为:在某一组织中关联评分高于95百分位且在其他组织中低于0.5。使用“留一法”验证后发现,这些组织特异性关联主要由相应组织的样本所复现,说明组织来源是蛋白关联差异的关键驱动因素。

聚合相同组织的研究数据后,研究人员为11个人体组织生成了统一的蛋白关联评分。在已知蛋白互作的复现能力上,组织层级的评分优于任何单个队列,且肿瘤来源数据的表现优于健康组织。这些评分反映了肿瘤的遗传异质性及样本之间的变异。研究人员还利用健康组织得出的特异性关联,用肿瘤样本数据进行验证,结果显示一致性良好,进一步验证了该图谱的可靠性和代表性。

最终,研究人员构建了一个涵盖116,000,000对蛋白的组织特异性关联图谱,平均每个组织包含约5,600万对蛋白评分,其中约1,000万对具有较高关联性(评分>0.5),约49万对属于“高可信关联”(评分>0.8)。

组织间差异并非由基因表达驱动

尽管蛋白互作的前提是基因在组织中被表达,但仅约7%的组织间蛋白关联差异可归因于基因表达差异。因此,蛋白共丰度反映的是翻译后层级的调控,进一步强调其独立于转录水平的预测价值。

各组织特异性关联比例

在健康组织与肿瘤组织配对比较中,46.3%的“可能关联”以及90.2%的“高可信关联”可被对方组织所复现。而在不同组织间,这些比例分别下降至32.9%和54.6%。研究人员据此估计,约有25.8%的蛋白关联具有组织特异性。

各组织复现其特异性细胞组分

通过比较组织间的Jaccard相似系数发现,已知蛋白复合物等稳定互作在多个组织间保持一致,而与信号转导或时空调控相关的动态互作则更多体现组织差异。此外,特定组织(如大脑、喉部、肺、肝)中的细胞结构成分(如突触、纤毛、过氧化物酶体)表现出显著的组织特异性,说明这些结构是组织差异的重要来源。

图谱揭示细胞类型特异性互作

以神经特异的AP2适配蛋白复合物为例,研究人员发现其在大脑中的关联更强,尤其是与突触相关蛋白的互作,而非突触蛋白则在大脑中互作较弱。研究人员还识别出如血红蛋白与贫血、乳糜微粒与克罗恩病、纤维蛋白原与肝病等组织特异的疾病相关互作。

组织特异的表型与细胞结构关联

进一步,研究人员通过GO注释与OTAR数据库中GWAS基因,系统评估了表型与细胞结构之间的组织特异性关系。例如,在大脑中与强迫症(OCD)相关的15个细胞成分几乎均为神经元特异,且在剔除GWAS已关联基因后,这些成分仍富集药物靶点、小鼠模型致病基因或低置信GWAS基因,说明该方法可用于识别与疾病相关的潜在功能模块。

验证精神分裂症相关基因的脑组织互作

研究人员构建了一个脑组织中与精神分裂症(SCZ)相关基因的互作网络。将GWAS关联的369个SCZ起始基因与其组织特异性关联基因筛选组合,识别出高置信互作对。进一步使用脑组织中实验验证的拉下质谱互作数据对预测结果进行验证,显示SCZ相关互作在脑组织中显著富集。

研究人员从中筛选出205个已验证的脑组织SCZ互作对,并利用AlphaFold2预测其结合结构。其中三个14-3-3蛋白与HCN1之间的互作被高置信预测,且其结合界面位于HCN1的C末端无序区,中心位点S789已被实验证实具有磷酸化依赖性结合能力。

此外,该网络中包含15个GWAS位点下的弱置信SCZ候选基因,其与SCZ核心基因的功能互作表明其可能为更可能的致病候选者。

基于共分级的突触特异性互作组

作为蛋白关联图谱的最终应用,研究人员聚焦于突触的互作网络。为此,研究人员从大鼠脑组织中提取并纯化了突触体(synaptosome),作为验证脑组织蛋白互作的另一种手段。利用尺寸排阻色谱(SEC)将突触体分为75个组分,随后通过液相色谱-质谱联用(LC-MS/MS)进行检测,共鉴定出3,409种蛋白,包括CCT复合物等已知复合物,其组分在不同组分中表现出高度相关性(平均相关系数为0.96)。

研究人员对突触体的分级谱图进行了预处理,并计算了4,276,350对蛋白在组分中的共丰度值,以评估它们的共分级程度。为提高互作评分的置信度,研究人员整合了大鼠突触体、体内小鼠脑组织及人类胶质母细胞亚细胞分级的共分级数据,基于所有三套数据中均被检测的直系同源蛋白构建了逻辑回归模型(以CORUM数据库中的复合物为正例)来估算互作概率。

最终构建的突触互作组包含1,619种蛋白之间的1,309,771对互作概率,优于任何单独数据的预测能力。该互作组中,24%的蛋白为SynGO数据库标注的突触蛋白,49%在小鼠脑中已被报道为突触富集,56%曾在小鼠突触体的交联-MS中被鉴定。所有已知交联互作在本研究中均被检测,其关联评分显著高于其他蛋白对(0.59 vs 0.37)。此外,突触蛋白之间的互作显著强于非突触蛋白之间的互作,尤其在脑组织中更为明显。

验证脑疾病相关基因的突触互作

突触富集蛋白之间的互作在脑组织中更可能发生。基于此,研究人员构建了一个仅包含突触蛋白的互作网络,这些蛋白在SynGO数据库中被定义或在小鼠脑中被认为突触富集,同时在大脑中共丰度高、在突触体中共分级概率高。最终得到的网络包含37,318个验证过的蛋白互作,且这些互作主要为脑组织特异性,仅20%在大多数其他组织中被认为是可能互作,仅有极少数被现有蛋白数据库(STRING、HuMAP、IntAct、BioPlex)收录。

研究人员进一步筛选与脑疾病相关的突触蛋白互作。这些疾病来源于GWAS研究,相关基因在小鼠表型库(IMPC)或药物靶点数据库(ChEMBL)中有支持,且其关联在脑组织中显著高于其他组织。最终筛选出727个高置信突触互作,这些互作在突触体和脑组织中的关联评分分别为0.7和0.81。

研究人员使用AlphaFold2对这727个互作对进行结构预测,发现其预测得分(pDockQ)显著高于CORUM或HuMAP中的已知互作;其中105对具有中等置信度(ipTM > 0.5),部分互作在小鼠突触体的交联-MS中有实验支持。

优先筛选脑疾病的突触致病基因

在这些互作网络中,研究人员发现部分基因虽然在遗传位点上的证据较弱,但由于其与已知疾病基因存在验证过的突触互作,可能是更有可能的致病基因。例如:

  • ADHD:MDH1、CADPS2、PIK3C3
  • 精神分裂症(SCZ):TOM1L2、AP2B1、PSD3、MYO18A、ATP2B2、TMX2
  • 阿尔茨海默病:CLPTM1、MADD
  • 孤独症:ATP2B2、ATP2A2
  • 单相抑郁症:MADD
  • 双相障碍:ATP2A2

其中大多数基因在脑组织中的表达位居前列,支持其致病潜力。

此外,研究人员还发现某些突触互作对虽非L2G评分最高基因,但具有其他支持证据。例如,PAFAH1B1 与 RHOA 的互作在突触互作图谱中被确认,两者皆与抑郁症相关。虽然PAFAH1B1在其位点上的L2G评分不最高,但其在大脑中的表达更强、更特异,且编码突触蛋白,支持其作为潜在致病基因。

这一案例表明,结合亚细胞结构与组织特异性研究,可构建更具生理意义的蛋白互作网络,并助力组织相关疾病基因的筛选。

讨论

尽管已有大量蛋白互作图谱,但组织间的差异性仍未被全面理解。蛋白共丰度相比mRNA共表达在预测互作方面更为准确。本研究进一步证实其优于传统共分级分析结果。值得注意的是,即使去除由mRNA表达变化导致的丰度差异,也不会显著影响预测性能,说明蛋白互作更多受翻译后调控机制控制,如过量亚基的降解等。

研究人员的分析结果具有高度一致性:相同组织的不同队列具有类似的蛋白关联模式,肿瘤组织与健康组织的评分可互相验证,关键复合物在所有组织中均被高质量预测。约46%的可能关联与90%的高置信关联可在健康与肿瘤组织中重现,为组织特异性生物学研究提供可靠假设。

研究人员估算约25%的蛋白关联具有组织特异性,而其中因基因表达差异导致的比例仅占7%。细胞类型特异的结构(如突触)是造成组织间蛋白关联差异的重要因素,翻译后修饰也可能是潜在机制之一。

最后,该图谱也支持在组织水平上探索性状与细胞结构之间的关系,特别是在脑组织和突触功能方面的应用表现突出。研究人员展示了多个脑相关疾病中与已知致病基因或药物靶点富集的验证互作,并提出了一种基因优选策略,有助于候选药物靶点的识别。组织特异性的网络与AlphaFold2模型的结合为理解疾病机制和靶点筛选提供了整合性工具,且具备提高靶向治疗安全性的潜力。

整理 | WJM

参考资料

Laman Trip, D.S., van Oostrum, M., Memon, D. et al. A tissue-specific atlas of protein–protein associations enables prioritization of candidate disease genes. Nat Biotechnol (2025).

https://doi.org/10.1038/s41587-025-02659-z

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
多组学 | Cell | 人类蛋白质组分布图谱用于组织特异性血浆蛋白质组动态研究
◉ 图1. 样本和实验策略的概述 (A) 预测对血浆蛋白质组有很大影响的器官和细胞从每个器官和细胞类型至少三个个体中收集或分离。◉ (B) MS实验设计的示意图概览。组织和细胞被均质化并通过SDS-PAGE进行分馏,然后以DDA模式进行LC-MS/MS分析以构建光谱测定文库。◉ 未分馏的组织和细胞样本使用DIA-MS重新分析,生成了156个蛋白质组图谱,并利用光谱文库提取蛋白质的身份和数量(称为HATLAS)。◉ (C) 组织或细胞标签分配策略的示意图概览。◉ (D和E) HATLAS蛋白质组图谱中所有已识别蛋白质的结果UMAP图,突出显示了蛋白质-组织关联。◉ 颜色表示不同的标签分配(单一标签、多标签或常见)。对所有组织分配的蛋白质进行了功能富集分析,并显示了一部分组织的结果(E)。◉ 颜色代表不同的组织,符号大小表示观察到的成功次数,例如该注释簇中的蛋白质数量。另见图S2。
生信菜鸟团
2025/05/23
1140
多组学 | Cell | 人类蛋白质组分布图谱用于组织特异性血浆蛋白质组动态研究
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
◉ gsMap 首先使用图神经网络 (GNN) 学习嵌入表示,这些嵌入整合了基因表达水平、空间坐标,并可选地整合细胞类型注释先验信息。◉ 随后,gsMap 根据嵌入中的余弦相似性为每个位点识别同质位点,以形成一个微区域。◉ 每个位点依次被视为焦点位点,并通过将基因在微区域内的平均排名除以其在整个空间转录组 (ST) 切片中的平均排名,计算每个基因在每个焦点位点的特异性得分。◉ D,位点的微区域;F,基因表达特异性;G,位点空间图;R,排名;X,基因表达矩阵;Z,嵌入表示。◉ 然后,基于每个位点的 GSS(基因空间特异性得分)与其到转录起始位点 (TSS) 的距离以及 SNP 到基因的链接图,将这些 GSS 映射到单核苷酸多态性 (SNP),从而为每个位点生成一组独特的 SNP 注释。◉ 对于每个位点的 SNP GSS 注释,gsMap 使用分层连锁不平衡回归 (S-LDSC) 来评估具有更高 GSS 的 SNP 是否对目标性状的遗传力有显著富集。◉ LD,连锁不平衡。◉ 为了量化某个空间区域与性状关联的显著性,gsMap 使用柯西组合检验来聚合该空间区域内位点的 P 值。
生信菜鸟团
2025/05/23
2600
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
Science | 解码无序区:预测分子相互作用的新方法
蛋白质中的内在无序区(IDRs)在细胞功能中发挥着关键作用。越来越多的研究表明,IDRs 往往以不依赖氨基酸精确排列的方式与作用对象结合,而是通过化学互补性驱动相互作用,形成无序的结合复合物。然而,这类具备化学特异性的动态相互作用极难预测。
DrugAI
2025/06/07
710
Science | 解码无序区:预测分子相互作用的新方法
Nature | 深度学习驱动的蛋白-配体表面靶向策略
蛋白质之间的分子识别事件驱动着生物系统中的生命过程。然而,近年来研究发现,蛋白-蛋白相互作用受小分子调控的机制也在不断被揭示。尽管该领域取得了一定进展,但用于设计新型化学诱导的蛋白相互作用的计算工具仍然面临挑战。本研究中,研究人员提出了一种计算策略,旨在设计可靶向新表面(即由蛋白-配体复合物形成的表面)的蛋白质。该策略采用基于分子表面表示学习的几何深度学习方法,并在实验中验证了三种药物结合的蛋白复合物的结合蛋白。实验结果表明,所有结合蛋白均表现出高亲和力和精准特异性,并通过突变分析和结构表征进行了验证。值得注意的是,最初仅在蛋白质上训练的表面指纹可推广应用于由小分子诱导的新表面,这一发现展示了深度学习方法中罕见的高泛化能力。预计,这类设计的化学诱导蛋白相互作用将有助于拓展分子传感功能,并在合成生物学中推动新型药物可控细胞治疗策略的开发。
DrugAI
2025/02/06
970
Nature | 深度学习驱动的蛋白-配体表面靶向策略
Nat. Protoc. |生信工具包CellPhoneDB版本更新,助力推断细胞间通讯
今天为大家介绍的是来自英国剑桥大学Roser Vento-Tormo团队的一篇论文。细胞间通讯对组织发育、功能和再生至关重要。单细胞基因组学技术的革命性发展提供了前所未有的机会,使我们能够揭示细胞如何在其组织微环境中进行体内通讯,以及这些微环境的破坏如何导致疾病和发育异常。CellPhoneDB是一种生物信息学工具包,通过结合经过验证的配体-受体相互作用的精选库与整合这些相互作用和单细胞基因组学数据的方法,设计用于推断细胞间通讯。本文介绍了CellPhoneDB最新版本(v5)的使用方案,该版本提供了多项新功能。首先,数据库扩展了三分之一,增加了新的相互作用,包括约1,000个由非多肽配体介导的相互作用,如类固醇激素、神经递质和小G蛋白偶联受体(GPCR)结合配体。其次,作者概述了一种使用数据库的新方式,允许用户根据实验设计定制查询。第三,此更新纳入了优先考虑特定细胞间相互作用的新策略,利用来自其他模态的信息,如源自空间转录组学技术的组织微环境或源自单细胞转座酶可及染色质检测的转录因子活性。最后,作者描述了新的CellPhoneDBViz模块,用于交互式可视化和共享结果。总之,CellPhoneDB v5提高了细胞间通讯推断的精确性,为生理微环境中的组织生物学提供了新的见解。原论文需要约15分钟阅读,并且需要基本的python知识。此处受篇幅限制,仅展示部分章节内容。
DrugAI
2025/04/09
1340
Nat. Protoc. |生信工具包CellPhoneDB版本更新,助力推断细胞间通讯
癌症组织特异性基因怎么找?这是个不错的开始
组织特异性基因(Tissue-specific Genes)是指在不同类型的细胞中特异性表达的基因,其调节细胞特异的形态结构或生理功能。组织特异性基因的表达是理解生物学过程、生理环境和疾病产生的关键,对TissGenes的研究将有助于深入了解致病机制和特异性治疗靶点,同时可以促进对临床相关的突变基因的发现。
生信宝典
2018/09/21
2.2K0
癌症组织特异性基因怎么找?这是个不错的开始
Nat. Methods | scNET:跨越细胞与基因的鸿沟,用蛋白互作网络解码单细胞表达图谱
近年来,单细胞RNA测序(scRNA-seq)技术的快速发展为解析组织异质性提供了前所未有的视角。然而,仅依赖基因表达数据难以全面捕捉细胞通路和复合物的变化,这些变化在蛋白质层面更为明显。此外,scRNA-seq 数据本身存在高噪声和零膨胀等挑战。为此,研究人员提出了一种融合蛋白质互作网络的分析方法,基于图神经网络的双视图架构,联合建模基因表达与蛋白互作信息。该方法在特定生物背景下学习基因间关系,并通过注意力机制优化细胞间表示。评估结果表明,scNET在基因注释、通路表征、基因关系识别以及细胞聚类和通路分析方面表现更优,适用于多种细胞类型与生物条件。
DrugAI
2025/03/24
1300
Nat. Methods | scNET:跨越细胞与基因的鸿沟,用蛋白互作网络解码单细胞表达图谱
开源数据代码,学习如何通过单细胞多组学数据鉴定关键因子
◉ 研究设计和计算分析的示意图。3DG,三维基因组。◉ WNN 表示的单核 RNA 测序和单核 ATAC 测序数据投影到 UMAP 上,显示主要细胞类型。◉ 伴随的饼图展示了在主要协变量(性别、脑库、脑区、年龄组和细胞类型)中代表的细胞核比例。MSSM,西奈山医学院。◉ 基于最高平均表达量的前两个基因标记可视化其在主要细胞类型中的基因表达。◉ 主要细胞类型中基因表达与相应基因活性(由染色质可及性推导)之间的余弦相似度。◉ 使用方差分解方法分析协变量对基因表达(左,n = 16,661 基因)、染色质可及性(中,n = 181,432 峰值)和细胞类型组成(右,n = 10 种细胞类型)的解释方差。在每个小提琴图中,中心线表示中位数,箱子表示四分位距(IQR),而须线表示在 1.5× IQR 范围内的最高/最低值。超出第一和第三四分位数 1.5 倍 IQR 的点被视为异常值。
生信菜鸟团
2025/04/04
1140
开源数据代码,学习如何通过单细胞多组学数据鉴定关键因子
Nat. Commun. | 预测49种人体组织的基因表达异常,AbExp解释基因表达可变性
今天为大家介绍的是来自德国慕尼黑工业大学的Julien Gagneur团队发表的一篇论文。在医学研究中,基因表达异常(aberrant gene expression)经常与疾病的发生有关,但科学界一直缺乏能够预测个体异常基因表达的有效算法。为解决这一问题,研究人员收集了一个大型数据库,包含了633名个体在49种不同人体组织中的8.2百万个罕见基因变异。现有的基因致病性评分系统CADD和功能缺失预测工具LOFTEE,虽然不是专门用于预测基因表达异常,但也显示出了一定的预测能力,平均准确率在1-1.6%之间。基于这些发现,研究团队开发了新的AbExp模型。该模型考虑了组织特异性,并综合分析了基因表达的变化规律、基因变异对不同形式蛋白质(异构体)的影响,以及基因剪接异常等因素,使预测准确率提升到12%。更重要的是,当研究团队将临床上容易获取的组织样本的基因表达数据纳入分析后,预测准确率又提高了一倍。在英国生物银行的血液特征研究中,使用AbExp的连续性、组织特异性评分替代传统的LOFTEE方法后,不仅提高了发现相关基因的灵敏度,还改善了对人体特征的预测效果。
DrugAI
2025/05/06
1120
Nat. Commun. | 预测49种人体组织的基因表达异常,AbExp解释基因表达可变性
Nature Communications:主要精神和神经退行性疾病的共同机制
几种常见的精神病和神经退行性疾病具有共同的流行病学风险; 然而,它们是否具有共同的病理生理学尚不清楚,是科研工作者的研究重点。作者使用25个全基因组关联研究 (GWAS)结果和LD得分回归,发现精神疾病和神经退行性疾病之间存在八种显著的遗传相关性。作者将GWAS结果与人脑转录组 (n = 888) 和蛋白质组 (n = 722) 进行整合,以鉴定顺式和跨蛋白以及与每种疾病中的多效性或因果(致病)作用一致的蛋白质,为简洁起见称为因果蛋白(致病蛋白),并在每个疾病组中都发现了许多独特且共享的因果蛋白。值得注意的是,神经退行性疾病病因蛋白的30% (42个中的13个) 与精神疾病共享。此外,作者发现精神和神经退行性因果蛋白之间的蛋白质-蛋白质相互作用比偶然预期的多2.6倍。发现的结果共同表明,这些精神和神经退行性疾病具有共同的遗传和分子病理生理学,这对早期治疗和治疗发展具有重要影响。
悦影科技
2023/01/04
7900
Nat. Biomed. Eng. | 癌症数据深度降维,DeepProfile捕捉关键基因与特异性通路
今天为大家介绍的是来自华盛顿大学Paul G. Allen计算机科学与工程学院的Su-In Lee团队的一篇论文。在癌症基因表达的大型数据集中,临床和生物学信息可以通过无监督深度学习进行挖掘。然而,生物学可解释性和方法学稳健性方面的困难使这一应用变得不切实际。在本研究中,作者描述了一种无监督深度学习框架——DeepProfile,用于从18种人类癌症的50,211个转录组中生成低维潜在空间,在生物学可解释性方面优于传统的降维方法。在定义各癌症类型潜在空间时,普遍重要的基因控制免疫细胞的激活,而癌症类型特异性的基因和通路则定义了分子疾病亚型。通过将DeepProfile中的潜在变量与肿瘤的二级特征关联,作者发现突变负荷与细胞周期相关基因的表达密切相关,且DNA错配修复和MHC II类抗原呈递的生物通路活性与患者生存率始终相关。作者还发现,肿瘤相关巨噬细胞是与生存相关的MHC II类转录本的来源,监督学习也可以促进从基因表达数据中发现生物学见解。
DrugAI
2025/02/03
1050
Nat. Biomed. Eng. | 癌症数据深度降维,DeepProfile捕捉关键基因与特异性通路
Nat. Commun. | regX揭示多层次基因调控网络,助力疾病机制研究与药物开发
今天为大家介绍的是来自清华大学张学工教授所带领的团队发表的一篇论文。细胞调控是一个复杂的系统,涉及从单个基因的调控到多个基因之间的相互作用等多个层面。虽然目前已有一些神经网络模型可以将分子变化与细胞特征联系起来,但这些模型在设计上缺乏对调控机制的考虑,难以解释细胞状态转换等关键生命活动背后的调控机制。为解决这一问题,研究团队开发了一个名为regX(Regulatory Network)的深度神经网络。这个模型的特点是同时考虑了基因层面的调控和基因之间的相互作用机制,能够找出推动细胞状态改变的关键调控因子,并对其作用机制进行解释。研究人员将regX应用于2型糖尿病和毛囊发育的单细胞多组学数据分析中。结果表明,该模型能够准确识别出影响细胞状态变化的关键转录因子和重要的DNA调控区域。更重要的是,研究发现的一些调控因子为疾病治疗提供了新的靶点,同时也为已有药物的新用途开发和致病基因变异(单核苷酸多态性)的鉴定提供了线索。这项研究展示了如何通过设计可解释的神经网络模型,来更好地理解和揭示生物系统的运作机制。
DrugAI
2025/04/18
2130
Nat. Commun. | regX揭示多层次基因调控网络,助力疾病机制研究与药物开发
空间转录组的几个分析要点及经典文献分享
ST最适合回答三种生物问题:首先可以阐明组织的细胞类型组成;第二类问题与细胞相互作用有关;最后可以帮助阐明组织成分之间的分子相互作用。
追风少年i
2023/02/13
2.2K0
空间转录组的几个分析要点及经典文献分享
纳米颗粒系统性递送CRISPR-Cas9核糖核蛋白用于有效的组织特异性基因组编辑
CRISPR-Cas9已经成为一项依靠Cas9/sgRNA核糖核蛋白复合物(RNP)来靶向和编辑DNA的强大技术。然而,仍然缺乏能够系统性递送RNP的载体。本文报道了一种通用的方法,该方法允许设计修饰的脂质纳米颗粒,以有效地将RNPs运送到细胞中,并编辑包括肌肉、脑、肝脏和肺在内的组织。静脉注射促进了小鼠肺中六个基因的组织特异性、多重编辑。通过轻而易举地敲除多个基因,利用高载体效力在小鼠的肝脏和肺部建立了器官特异性癌症模型。所开发的载体能够携带RNPs恢复DMD小鼠抗肌萎缩蛋白的表达,并显著降低C57BL/6小鼠的血清PCSK9水平。这一可推广的策略的应用将促进针对各种疾病靶点的纳米颗粒的开发。
JoJo_Beatles
2021/02/04
1.2K0
纳米颗粒系统性递送CRISPR-Cas9核糖核蛋白用于有效的组织特异性基因组编辑
PNAS:整合抑郁症的分子、细胞和皮层神经影像特征
抑郁症产生于生物系统的复杂相互作用,跨越基因和分子到细胞、脑网络和行为。为了确定不同的神经生物学过程是如何联合起来导致抑郁症的,我们需要一种多尺度的方法,包括对大脑结构和功能的测量,以及遗传和细胞特异性的转录数据。在这里,我们研究了三个群组影像数据集中与抑郁和负性情绪相关的大脑解剖(皮层厚度)和功能(功能变异、全脑功能连接),包括:英国生物银行(UK Biobank)、大脑基因组超结构项目(Brain Genomics Superstruct Project)和Meta分析增强神经影像数据库(ENIGMA;总被试数n≥23,723)。整合的分析包括皮层基因表达、死后患者转录数据、抑郁症全基因组关联分析(GWAS)和单细胞基因转录。在这三个独立的数据集中,抑郁和负面情绪的神经影像相关物是一致的。将体外基因下调与体内神经影像联系起来,我们发现抑郁症影像表型的转录组相关物追踪了抑郁症患者死后皮层样本中的基因下调。对单细胞和Allen人脑图谱表达数据的综合分析显示,抑郁症体内影像和体外皮层基因失调的细胞相关物是生长抑素(SST)中间神经元和星形胶质细胞。GWAS驱动的抑郁症多基因风险富集在中间神经元的表达基因,而不是胶质细胞,这为我们的观察提供了一致的证据。为了强调多尺度方法的转化潜力,与抑郁症相关的大脑功能和结构的转录相关物富集于抑郁症相关的分子通路。这些发现将特定的基因、细胞类别和生物学通路与抑郁症的体内神经影像表型联系了起来。
悦影科技
2022/07/11
1K0
Science:人类神经科学中的功能基因组学和系统生物学
由于对资源建设和工具开发的强大的财政和智力支持,神经科学研究已经进入了神经基因组学领域的关键发展阶段。以前的组织异质性的挑战已经遇到了技术的应用,可以让我们研究单个细胞尺度的功能轮廓。此外,以细胞类型特异性的方式干扰基因、基因调控元件和神经元活性的能力已经与基因表达研究相结合,以在系统水平上揭示基因组的功能基础。虽然这些见解必须基于模型系统,但由于人类遗传学、大脑成像和组织收集方面的进步,我们现在有机会将这些方法应用于人类和人体组织中。我们承认,在我们将模型系统中开发的基因组工具应用于人类神经科学的程度上,可能总是有限制的;然而,正如我们在这个角度所描述的,神经科学领域现在已经为解决这一雄心勃勃的挑战奠定了最佳基础。将系统级的网络分析应用于这些数据集,将有助于对人类神经基因组学的更深入的理解,否则,这是无法从直接可观察到的现象中实现的。
悦影科技
2024/01/08
5590
一文读懂三维基因组
每个人体内都有着两米长的DNA,它是如何紧密折叠在直径 10 微米小的细胞核内。
白墨石
2021/01/12
1K0
Nat. Commun. | Meta-EA:结合进化行动的基因特异性预测框架
今天为大家介绍的是来自美国贝勒医学院的Panagiotis Katsonis与Olivier Lichtarge发表的一篇论文。在临床实践中,评估错义变异影响的计算方法面临着一个重大挑战:它们在不同基因中的表现往往不够稳定。虽然集成评分系统通过组合多种预测方法来提高可靠性,但由于训练数据中某些基因的比例过高,可能会导致预测结果出现偏差。为了解决这个关键问题,作者开发了一个创新的解决方案:基因特异性集成框架。与传统方法不同,该框架使用参考计算注释进行训练,而不是依赖临床或实验数据。基于这个框架,作者开发的Meta-EA(Meta-Ensemble Analysis)集成评分系统在各个基因集的预测性能上都能达到顶级单一预测方法的水平。通过进一步整合剪接效应和人类遗传多态性的等位基因频率信息,Meta-EA的性能得到了显著提升。在衡量预测准确度的ROC曲线分析中,无论是基因平衡还是不平衡的临床评估,都达到了0.97的高水平。这项研究充分利用了现有的变异影响预测方法,为临床解读提供了更加准确可靠的评估工具。
DrugAI
2025/02/03
1170
Nat. Commun. | Meta-EA:结合进化行动的基因特异性预测框架
人类小脑内在组织背后的基因图谱
人类小脑的功能多样性在很大程度上被认为更多地来自于其广泛的联系,而不是局限于其部分不变的结构。然而,小脑内在组织中连接的确定是否以及如何与微尺度基因表达相互作用仍不清楚。在这里,我们通过研究同时连接小脑功能异质性及其驱动因素的遗传基质,即连接因素,来解码小脑功能组织的遗传图谱。我们不仅鉴定了443个网络特异性基因,而且还发现它们的共表达模式与小脑内功能连接(FC)密切相关。其中90个基因也与皮质-小脑认知-边缘网络的FC有关。进一步发现这些基因的生物学功能,我们进行了“虚拟基因敲除”,通过观察基因之间的耦合和FC以及将基因分成两个子集,即,一个涉及小脑神经发育的阳性基因贡献指标(GCI+)和一个与神经传递有关的阴性基因集(GCI−)。一个更有趣的发现是,GCI−与小脑连接-行为关联显著相关,并与许多公认的与小脑功能异常密切相关的脑部疾病密切相关。我们的研究结果可以共同帮助重新思考小脑功能组织背后的遗传底物,并为神经精神疾病中涉及小脑的高阶功能和功能障碍提供可能的微宏观相互作用的机制解释。
悦影科技
2022/11/28
5150
曾与诺奖失之交臂的这项发现,今年还会继续陪跑么?
miRNA 的发现,与一位祖籍波兰的生物学家维克托·安博斯(Victor Ambros)的工作有关——他在线虫中发现了第一个 miRNA lin-4。
生信交流平台
2020/10/23
8240
曾与诺奖失之交臂的这项发现,今年还会继续陪跑么?
推荐阅读
多组学 | Cell | 人类蛋白质组分布图谱用于组织特异性血浆蛋白质组动态研究
1140
Nature | 西湖大学,gsMap:空间+转录组+基因组+性状联合分析,可将空间基因表达与复杂性状相关联
2600
Science | 解码无序区:预测分子相互作用的新方法
710
Nature | 深度学习驱动的蛋白-配体表面靶向策略
970
Nat. Protoc. |生信工具包CellPhoneDB版本更新,助力推断细胞间通讯
1340
癌症组织特异性基因怎么找?这是个不错的开始
2.2K0
Nat. Methods | scNET:跨越细胞与基因的鸿沟,用蛋白互作网络解码单细胞表达图谱
1300
开源数据代码,学习如何通过单细胞多组学数据鉴定关键因子
1140
Nat. Commun. | 预测49种人体组织的基因表达异常,AbExp解释基因表达可变性
1120
Nature Communications:主要精神和神经退行性疾病的共同机制
7900
Nat. Biomed. Eng. | 癌症数据深度降维,DeepProfile捕捉关键基因与特异性通路
1050
Nat. Commun. | regX揭示多层次基因调控网络,助力疾病机制研究与药物开发
2130
空间转录组的几个分析要点及经典文献分享
2.2K0
纳米颗粒系统性递送CRISPR-Cas9核糖核蛋白用于有效的组织特异性基因组编辑
1.2K0
PNAS:整合抑郁症的分子、细胞和皮层神经影像特征
1K0
Science:人类神经科学中的功能基因组学和系统生物学
5590
一文读懂三维基因组
1K0
Nat. Commun. | Meta-EA:结合进化行动的基因特异性预测框架
1170
人类小脑内在组织背后的基因图谱
5150
曾与诺奖失之交臂的这项发现,今年还会继续陪跑么?
8240
相关推荐
多组学 | Cell | 人类蛋白质组分布图谱用于组织特异性血浆蛋白质组动态研究
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档