前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >2025 UCSC 基因组浏览器 都更新了什么内容?

2025 UCSC 基因组浏览器 都更新了什么内容?

作者头像
生信菜鸟团
发布2025-03-28 13:46:57
发布2025-03-28 13:46:57
660
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

Basic Information

  • 英文标题:The UCSC Genome Browser database: 2025 update
  • 中文标题:UCSC 基因组浏览器数据库:2025年更新
  • 发表日期:26 October 2024
  • 文章类型:Database Issue
  • 所属期刊:Nucleic Acids Research
  • 文章作者:Gerardo Perez | Maximilian Haeussler
  • 文章链接:https://academic.oup.com/nar/article/53/D1/D1243/7845169

Abstract

  1. UCSC基因组浏览器(https://genome.ucsc.edu)是一个广泛使用的基于网络的工具,用于可视化和分析基因组数据,涵盖了来自不同生物体的超过4000个组装。
  2. 自2001年发布以来,它已成为基因组学和生物信息学研究的重要资源。
  3. 基因组浏览器上提供的注释数据包括内部创建和维护的轨道以及由研究社区提供的自定义轨道和轨道中心。
  4. 去年的更新包括超过25个新的注释轨道,例如人类GRCh38/hg38组装上的gnomAD 4.1轨道,新增了三个公共中心,并显著扩展了用于与各种组装交互的基因组档案系统。
  5. 我们还改进了界面,包括更新浏览器图形页面,如新增弹出对话框功能,现在可以在不离开主基因组浏览器页面的情况下显示项目详细信息。
  6. GenePred轨道已升级,增加了右键点击选项以进行缩放和精确导航,以及增强的鼠标悬停功能。
  7. 其他改进包括为轨道中心添加了新的分组功能和中心描述信息链接。
  8. UCSC基因组浏览器还新增了一个专注于临床遗传学的教程。

Introduction

Para_01
  1. 加利福尼亚大学圣克鲁兹分校(UCSC)基因组浏览器是一个交互式网页工具,允许用户可视化、检索和分析来自广泛生物的基因组数据。
  2. 该工具于2001年推出,最初仅提供一个草图基因组组装的访问权限。
  3. 多年来,它显著扩展,现在托管超过4000个组装,涵盖了众多物种的数据。
  4. 用户可以通过网关页面输入组装名称或GenBank中的GC登录号标识符来访问特定的基因组组装。
  5. 用户还可以通过使用组装请求页面搜索并请求现有数据库中可能不可用的特定组装。
Para_02
  1. UCSC基因组浏览器最常用的工具提供了一种可视化显示已经与组装序列对齐的数据集的方法;这些显示的数据集通常被称为轨道。
  2. 我们用户中最受欢迎的组装,人类GRCh38/hg38和GRCh37/hg19,提供了超过37,000个数据轨道。
  3. 我们接下来最受欢迎的组装,针对小鼠,提供了超过9,000个额外的数据轨道。
  4. 轨道被组织成几个类别:基因、调控、变异和其他,以提供一种结构化的方式来导航可用的大量数据。
  5. 为了进一步帮助用户导航这个庞大的数据集合,UCSC基因组浏览器提供了一个轨道搜索功能。
  6. 此功能允许用户输入搜索词,查询选定组装中的轨道描述、组分类和轨道名称,并返回相关数据集列表。
  7. 用户还可以通过自定义轨道或轨道中心上传自己的数据到UCSC基因组浏览器,以将这些数据与本地可用的轨道一起可视化。
  8. 除了可视化,UCSC基因组浏览器还提供基于Web和命令行的工具,拥有数百个实用程序,可以帮助用户进行数据分析。
Para_03
  1. UCSC基因组浏览器可以通过主要的UCSC网站(https://genome.ucsc.edu)访问,也可以通过我们在欧洲(https://genome-euro.ucsc.edu)和亚洲(https://genome-asia.ucsc.edu)的镜像站点访问。
  2. 这些镜像站点确保全球用户能够可靠且快速地访问UCSC基因组浏览器资源,服务于国际用户群体;每天服务超过7000名独特用户,估计年用户基数为140万。
  3. 对于那些无法访问外部托管的网络服务器的需求,例如在处理受保护或限制的数据时,我们提供替代解决方案。
  4. 云中的基因组浏览器(GBiC)安装脚本允许用户在其自己的服务器或云基础设施上设置UCSC基因组浏览器的完整镜像。
  5. 此外,盒中基因组浏览器(GBiB)提供了UCSC基因组浏览器的虚拟机版本,设计用于在笔记本电脑或台式计算机上本地运行。
  6. 这两种选择确保受保护的数据安全地保留在用户的环境中,不会传输到UCSC。
Para_04
  1. UCSC基因组浏览器不断更新以纳入新功能和数据。
  2. 软件更新每三周发布一次,附带的公告详细介绍了新功能、轨道发布和其他更新内容。
  3. 这种定期更新计划确保了该软件始终处于基因组研究工具的前沿,持续为用户提供最新的数据和功能。

New and updated annotations

新的和更新的注释

Para_05
  1. 在过去的一年中,UCSC基因组浏览器经历了重要的更新和扩展。
  2. 值得注意的是,在各种组装中新增或更新了超过25个轨道。
  3. 这包括新增的临床轨道,这些轨道提供了与医学和转化研究相关的重要信息,以及对现有基因轨道的更新,以确保它们反映最新的基因组注释和发现。
  4. 我们还引入了三个新的公共枢纽。

New clinical tracks

新的临床路径

Para_06
  1. 今年,我们的人类基因组组装中纳入了十个新的临床轨道。其中,gnomAD 4.1 轨道尤为突出;它展示了来自 807,162 个个体的变异数据,包括 730,947 个外显子组和 76,215 个基因组。
  2. 此外,我们引入了新的预测评分轨道,包括 AbSplice、BayesDel 和 Illumina SpliceAI。
  3. AbSplice 是一种预测人类组织中异常剪接的方法。其轨道显示了所有可能的单核苷酸变异的预计算 AbSplice 分数,覆盖整个基因组。
  4. BayesDel 提供了一个用于编码和非编码变异、单核苷酸变异以及小插入/缺失的有害性元评分。
  5. SpliceAI 是一个开源的深度学习剪接预测算法,可以预测由 DNA 变异引起的剪接改变。
Para_07
  1. 我们的人类基因组组装中另一个重要的补充是 DECIPHER 剂量敏感性轨道。
  2. 该轨道利用集成机器学习模型预测所有常染色体基因的剂量敏感性概率(pHaplo 和 pTriplo)。
  3. 它已经识别出 2987 个单倍不足基因和 1559 个三倍敏感基因,其中包括 648 个唯一识别为三倍敏感的基因。

Gene set updates

基因集更新

Para_08
  1. 在人类和小鼠组装中,已添加和更新了六个基因轨迹,包括 GENCODE 已知基因轨迹,现已更新至人类的第 46 版(V46)和小鼠的第 VM35 版。
  2. 此外,hg19 组装还整合了 GENCODE ‘已知基因’ v45lift37 基因轨迹,以及包含 2013 年 UCSC 基因轨迹的 GENCODE/UCSC 基因档案超级轨迹,以确保可重复性。
  3. GENCODE 已知基因轨迹是人类和小鼠组装的默认基因轨迹,其中每个基因都与元数据和其他资源中的相应记录相关联。
Para_09
  1. 已为 hg38 组装添加了 RefSeq 历史记录轨道,使用户能够搜索以前的 RefSeq 转录本版本,包括 NM_ 编号和 HGVS 搜索。
  2. 我们还包含了每年自动更新的基因轨道,例如 HGMD 和 MANE 轨道,用于人类组装。
  3. HGMD 轨道显示了来自人类基因突变数据库 (HGMD) 的带有临床变异的转录本。
  4. NCBI 和 EMBL-EBI 匹配注释 (MANE) 轨道展示了在 RefSeq (NCBI) 和 Ensembl/GENCODE (由 EMBL-EBI 领导) 之间一致注释的高置信度转录本。
Para_10
  1. 此外,搜索结果已得到增强,优先显示 MANE 转录本,现在这些转录本作为顶级结果展示(图 1A)。
  2. MANE 转录本的颜色也已更新,以便与其它转录本区分开来(图 1B)。

图片说明

◉ 图1. (A)MANE 转录本作为顶级结果展示。 (B)基因组浏览器显示的肿瘤抑制基因‘BRCA1’的 MANE 转录本颜色。

Other new tracks

其他新赛道

Para_11
  1. 此外,我们为脊椎动物组装添加和更新了10个新轨道。
  2. 其中,端粒到端粒组装(hs1人类)的CRISPR靶点轨道确定了可以使用来自S. pyogenes的Cas9酶(PAM:NGG)靶向的DNA序列。
  3. VISTA增强子轨道已整合到人类和小鼠组装中,显示了在转基因小鼠中实验验证的潜在增强子。
Para_12
  1. 我们还添加了EVA SNP第6版发布,涵盖了37个组装中的单核苷酸变异和小插入缺失(indels)的映射。
  2. 此外,关注变异体轨道已更新,包括最新的世界卫生组织指定的关注变异体(VOC),突出了SARS-CoV-2变异体中在2021年12月定义的氨基酸和核苷酸突变。

New hubs

新的枢纽

Para_13
  1. 我们接受提交的数据集或组装,以‘公共中心’的形式展示。这些轨道中心在添加到公共中心页面时会进行公告。今年,我们引入了三个新的公共中心。
Para_14
  1. 第一个新的公共枢纽是 ImpactHub,它利用 Impact 机器学习模型为 707 对转录因子 (TFs) 和细胞类型提供调控元件活性预测。
  2. 第二个是 Predominant PAS 枢纽,它显示了近 16,000 个蛋白质编码基因的主要多聚腺苷酸化位点和主要多聚腺苷酸化六聚体的位置。
  3. 第三个枢纽是一个以向日葵海星 (Pycnopodia helianthoides) 为特色的组装枢纽。
  4. 这些枢纽由各自的作者维护。

Genome Archive (GenArk)

基因组档案(GenArk)

Para_15
  1. 我们继续扩展我们的GenArk中心库,新增了超过1000个新的GenArk组装,每个都配备了基因组浏览器注释和BLAT支持。
  2. 此次扩展包括将端粒到端粒(T2T)灵长类和小鼠组装添加到GenArk中。
  3. 此外,我们已整合从GenArk索引页面到IGV的外部链接,以增强可用性和数据访问性。
Para_16
  1. 最近,我们发表了一篇新论文,题目为‘GenArk:迈向百万 UCSC 基因组浏览器’,详细介绍了我们的基因组档案(GenArk)系统及其持续开发。

New genome browser software

新的基因组浏览器软件

Para_17
  1. 我们已经更新了软件,特别是增强了页面的可视化效果。
  2. 浏览器图形页面进行了多项修改,旨在改善用户体验。

Browser graphic page

浏览器图形页面

Para_18
  1. 浏览器图形页面显示参考基因组的数据注释,这些注释被称为轨道。用户可以缩放、拖动和配置这些显示注释。
  2. 浏览器图形页面经过多次更新,包括在自定义轨道旁边添加垃圾图标以快速删除,增强了宽屏上更多轨道列的显示,增加了对话框的字体大小,并减少了页面上的文本量。

图片说明

◉ 图2. (A)以前的浏览器图形页面。(B)当前的浏览器图形页面在自定义轨道旁边显示垃圾图标,在更宽的屏幕上显示更多的轨道列,对话框的字体大小增加,以及页面上的文本减少。

Para_19
  1. 我们引入了新的项目详情功能,通过弹出对话框显示跟踪项目详情,简化了用户体验。这一功能使得信息可以在不离开当前页面的情况下查看。

图片说明

◉ 图3. 显示 hg38 GENCODE ‘KnownGene’ 轨道项目详细信息的新弹出对话框。

Para_20
  1. 像 GENCODE 和 NCBI RefSeq 这样的基因预测轨道已经经历了多次更新。
  2. 通过右键单击基因预测轨道,用户现在可以选择缩放、输入外显子位置或输入密码子,以便在浏览器图形中更快导航(图4A)。
  3. 基因预测轨道中的鼠标悬停功能也得到了增强,可以显示第一个和最后一个密码子的相位。
  4. 此外,它现在还指示外显子是否同框或异框(图4B)。

图片说明

◉ 图4. (A)基因预测轨迹的右键选项。(B)基因预测轨迹的外显子鼠标悬停显示。

Para_21
  1. 浏览器图形显示中的搜索框允许用户输入位置查询或查找与轨迹数据、轨迹描述、帮助文档和公共枢纽轨迹描述匹配的术语。
  2. 我们已更新了搜索框,现在会显示最近的五个搜索词。
  3. 在浏览器的图形显示中搜索的任何基因或从搜索结果页面选择的术语都将显示在搜索框下方(图5)。

图片说明

◉ 图5. 搜索框显示最近五次的搜索词。

New hub features

新枢纽功能

Para_22
  1. 我们引入了一种新的轨道中心分组功能,该功能允许将轨道结构化地组织成不同的组(图6)。
  2. 这可以通过将轨道整合到分组中心来减少对多个中心的需求,每个中心需要单独的文件,每个组在一个中心内进行管理。
  3. 此功能可以应用于 UCSC 基因组、GenArk 组装或组装中心。
  4. 这些轨道中心组与其他轨道中心和原生 UCSC 基因组浏览器轨道组保持分离,从而提供更大的组织灵活性。
  5. 例如,你可以添加一个‘基因’组而不会引起冲突或混淆。

图片说明

◉ 图6. 浏览器图形页面上的轨道中心分组。

Para_23
  1. 此外,我们已在轨道中心的蓝色栏名称中添加了一个信息链接,引导用户到中心描述页面查看有关轨道中心的详细信息。
  2. 我们还实现了使用"视图"菜单下的"扩展 DNA 大小写/颜色选项"来突出显示由轨道中心覆盖的基因组 DNA(图 7)。
  3. 突出显示选项包括大小写更改、下划线、粗体、斜体或颜色。

图片说明

◉ 图7. 轨道中心扩展的 DNA 病例/颜色选项。

New and updated tools

新的和更新的工具

Para_24
  1. 我们提供了一个 REST API,该接口允许查询来自任何 UCSC 基因组组装或中心的注释和序列数据。
  2. 今年,我们将 API 支持扩展到包括 bigChain、bigMaf 和 bigDbSnp 轨道类型。
  3. 此外,我们引入了一个新的 API 功能 revComp,它用于获取给定序列的反向互补序列。

Tutorial

教程

Para_25
  1. 我们之前为新用户提供了交互式入门教程,现在又添加了一个专门针对 UCSC 基因组浏览器中临床遗传学的新教程。
  2. 这个临床教程指导用户使用 HGVS 术语、基因组坐标、基因符号和特定的注释 ID(如 NM 标识符和 rsID)搜索变异和其他相关查询。
  3. 它还解释了如何找到推荐的轨道集,以帮助配置带有相关注释的显示,用于变异解读。
  4. 其中包括选择轨道集的示例,例如临床 SNVs 和临床 CNVs 轨道集。
  5. 教程还突出了其他可能有助于变异解读的功能。

Email support

电子邮件支持

Para_26
  1. 我们继续通过公共和保密的邮件列表提供电子邮件支持,UCSC 基因组浏览器工作人员解答有关工具或数据的问题。
  2. 关于我们的邮件列表的更多详情可以在 https://genome.ucsc.edu/contacts.html 查看,包括公共列表的链接,该列表存档了之前已回答的问题。

Future plans

未来计划

Para_27
  1. 一个主要目标是实现用户账户,提供10 GB的专用存储空间,用于上传注释文件并将其作为轨道中心附加。
  2. 随着存储成本的降低,我们预计未来的存储阵列升级将提供更大的容量,而成本与当前系统相同。
  3. 此外,我们计划提供一个枢纽制造界面工具,用于上传到用户存储空间的文件,便于创建基本枢纽。
  4. 我们继续在Liftover on the Fly功能上取得进展,该功能可以自动将注释提升到未注释的基因组,而无需手动提升轨道。
  5. 此外,我们正在开发更多适合初学者的教程,包括网关页面、UCSC基因组浏览器图形显示和表格浏览器的指南。

Data availability

Para_28
  1. 所有用户可以自由使用 UCSC 基因组浏览器(https://genome.ucsc.edu/),但 Blat 工具、liftOver 工具和其他工具的源代码除外,这些工具免费提供给非营利性学术研究和个人使用。商业使用这些工具或源代码需要许可证。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Information
  • Abstract
  • Introduction
    • New and updated annotations
    • New clinical tracks
    • Gene set updates
    • Other new tracks
    • New hubs
    • Genome Archive (GenArk)
    • New genome browser software
    • Browser graphic page
    • New hub features
    • New and updated tools
    • Tutorial
    • Email support
    • Future plans
  • Data availability
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档