首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >最佳Galaxy生信云平台教程:从入门到精通(图文版)

最佳Galaxy生信云平台教程:从入门到精通(图文版)

作者头像
简说基因
发布2025-09-02 10:14:26
发布2025-09-02 10:14:26
16000
代码可运行
举报
文章被收录于专栏:简说基因简说基因
运行总次数:0
代码可运行

特别提示:本文较长,如果你要此文的 PDF/Word/Markdown 版本,请加微信 usegalaxy 邀请你入群领取。

我们将于 2025 年 10 月 18 日开展一期《RNA-seq 数据分析实战研讨班》,内容包括上游表达量矩阵的获得和下游发表级别的统计图表制作,感兴趣的朋友可以报名参加。

Galaxy 简介

Galaxy 是一个开源的,基于网页的生物医药大数据分析平台,其核心优势包括:

  • • 零编程门槛:图形化操作界面,易于使用;
  • • 全流程自动化:数据上传之后,可以一键完成质控、比对到可视化操作;
  • • 结果可重复:自动记录分析步骤与参数,支持历史记录共享;
  • • 云端算力支持:超大免费存储空间,轻松处理海量数据。

项目网站:https://galaxyproject.org

强大的开源社区

用户使用一个平台最担心的是什么?毫无疑问,是不稳定、随时跑路。担心花大力气学会,用不了多久平台就下线了,又得学习别的平台,从而造成时间金钱的浪费。

而 Galaxy 平台完全开源,其所有代码托管在 GitHub 网站上:https://github.com/galaxyproject/galaxy,任何人都可以贡献代码和安装部署。

项目至今吸引了全世界 357 位贡献者(截止 2025-08-18),这使得平台可以博采众长,社区保持旺盛的生命力。平台诞生至今已 20 周年,正在向下一个 20 周年进发。

捐助 James P. Taylor 开放科学基金

https://jxtxfoundation.org/

遍布世界的 UseGalaxy.*

由于 Galaxy 开源的特点,其子站点遍布世界各地,以下列举一些主要站点。

美国站 UseGalaxy.org
欧洲站 UseGalaxy.eu
中国站 UseGalaxy.cn
其他站点

世界上还有许多其他国家、高校和研究机构管理的 Galaxy 站点。

  • • 澳洲站 UseGalaxy.org.au
  • • 法国站 UseGalaxy.fr
  • • 加拿大站 UseGalaxy.ca
站点选择建议

世界上主要的 UseGalaxy.* 站点所安装的工具和流程都差不多,使用方式也一样,相当于是克隆站。它们之间最大的区别在于所处的地域。也就是说,用户的使用体验,更多是由地域决定的。

用户通常应该选择离自己最近的 Galaxy 站点,这主要是因为离站点物理距离近,上传数据比较快。

具体来说,选择哪个站点,跟你的数据量和数据来源有关:

  • • 如果需要分析的数据量不大,可以无视地域限制,以下 3 个站点任选其一即可:
    • • UseGalaxy.org
    • • UseGalaxy.eu
    • • UseGalaxy.cn
  • • 如果需要从公共数据库下载大量 SRA 等数据进行分析,可以选择:
    • • UseGalaxy.org
    • • UseGalaxy.eu
  • • 如果需要从本地电脑上传比较大的数据,国内用户可以优先选择:
    • • UseGalaxy.cn

最流行的生信云平台

20 年的开源社区发展,遍布世界各地的子站点,数十万全球用户,Galaxy 已经成为当之无愧的最流行的生信云平台。

持续为用户提供稳定的服务,不担心跑路。从投入回报的角度来说,Galaxy 可能是一个最值得学习使用的生信云平台。

Galaxy 初识

注册登录

  1. 1. 打开浏览器(推荐 Chrome)
  2. 2. 输入网址:usegalaxy.cn
  3. 3. 点击“登录或注册”
  4. 4. 点击“这里注册”
  5. 5. 输入邮箱账号、密码以及账号名称
  1. 6. 点击“创建”
  2. 7. 激活账号。登录注册邮箱,根据收到的邮件提示激活账号

强烈建议激活账户,否则平台的使用会受到许多限制,如磁盘空间、并行任务数量等。

界面外观

Galaxy 主页从左到右分成 4 个面板:

  • • 活动栏:在这里你可以浏览 Galaxy 的资源(工具、流程、历史等)
  • • 当前激活的“活动面板”:默认情况下,会显示工具面板
  • • 观察面板:分析上下文的主要区域
  • • 历史面板:显示当前的历史,分析产生的新文件都会存储在这里

磁盘配额

每个 Galaxy 实例都有一定的磁盘配额。以 UseGalaxy.cn 为例,注册用户共有 200G 磁盘存储空间,其中 100G 长期存储,100G 短期存储(7 天)。

如果默认存储满足不了项目需求,可以向平台申请增加配额。

并行任务

所有注册用户和非注册用户都有一个默认并行任务配额。UseGalaxy.cn 平台:

  • • 注册用户:2 个
  • • 非注册用户:1 个

需要说明的是,默认并行任务配额并非一成不变,平台会根据计算资源情况适时调整。

管理员可以调整每位注册用户并行的任务数,如果你的任务较多,可以向管理员申请增加并行任务配额。

Galaxy 关键操作

操作历史

用户在平台的数据分析结果,都会呈现在右侧历史面板中。我们可以对历史进行各种操作,比如:

  1. 1. 重命名历史
    1. 1. 点击历史的名称
代码语言:javascript
代码运行次数:0
运行
复制
2. 输入新的名称,比如:Meet Galaxy,回车即可
  1. 2. 创建一个新的历史

命名为:Next Analysis

  1. 3. 切换历史

上传文件

  1. 1. 在活动栏的顶部,点击“上传”按钮

会弹出一个界面。在常规数据上传选项中,可以上传本地文件,也可以选择远程文件,或者直接粘贴/ 获取数据。

  1. 2. 点击“粘贴/ 获取数据”
  2. 3. 粘贴内容到文本框中
  3. 4. 点击“开始”
  4. 5. 点击“关闭”

这里再解释一下:

  • • 如果粘贴的内容是网址,则会自动从网址下载文件
  • • 如果粘贴的内容不是网址,则内容会保存到一个文件当中,就如本例中一样

通过以上操作,你将会在右侧历史中看到第一个元素,Galaxy 中习惯称为:数据集。数据集会经过 3 个状态:灰色(准备/ 排队)、黄色(运行中),最后变为绿色(成功)。

下载文件

  1. 1. 点击文件名称

这会展开文件的信息(默认情况下所有数据集都是折叠的)

  1. 2. 点击下载按钮

这时会弹出对话框,根据需要选择下载文件保存的路径即可。

查看文件

  1. 1. 点击数据集名称后面的眼睛图标

随后在中间的主面板中会显示文件的相关信息。

  1. 2. 点击“预览”,可以查看文件内容(默认行为)
  2. 3. 点击“可视化”,可以为该文件选择可视化工具
  3. 4. 点击“详情”,可以查看该文件生成相关的详细信息
  4. 5. 点击“编辑”,可以编辑文件信息,如文件名,文件类型等

复制文件

可以方便地在历史之间复制文件,只需要拖动鼠标就可以了。

  1. 1. 点击左侧活动栏中的“历史多视图”按钮
  2. 2. 从一个历史拖动数据集到另一个历史,即完成复制

删除文件

  1. 1. 可以在历史中,简单地点击垃圾桶按钮删除文件。
  1. 2. 恢复文件
    1. 1. 点击上方的垃圾桶按钮,查看已删除的文件
    2. 2. 再点击下方的垃圾桶按钮,恢复已删除的文件

从上面可以看到,删除的文件,只是移动到了回收站,是可以恢复的。删除的文件依然占据磁盘空间,如果要释放磁盘空间,则需要永久删除文件。

  1. 3. 永久删除文件
    1. 1. 点击“选择项目”按钮
    2. 2. 选择要删除的文件
    3. 3. 点击下拉菜单
    4. 4. 点击“删除(永久)”菜单项

这样,所选文件就彻底从磁盘中删除了,释放了磁盘空间,文件不可再恢复。

运行工具

Galaxy 的工具,简单理解就是各种软件的界面打包版本。比如我们想简单统计一下文件的信息:有多少行、单词、字符等。

  1. 1. 在工具面板上方的搜索框中,输入:line
  2. 2. 在搜索结果中找到:Line/Word/Character count of a dataset,点击
  3. 3. 输入参数:
    1. 1. 文本文件:刚才通过粘贴上传的文件,此时已经自动选择好
    2. 2. 包含输出的标题:No
  4. 4. 点击“运行工具”

提示任务提交成功:

右侧历史面板中,结果文件会经历前面提到的 3 个阶段:灰色(准备/ 排队)、黄色(正在运行)、绿色(成功)。

当结果文件变成绿色后,可以点击眼睛图标查看内容:

重新运行

有些时候我们需要重新运行工具,比如需要调整某个分析参数,或者调整输出图片的大小。这时候所有设置参数都要重新设置一遍吗?在 Galaxy 平台,不需要的。

比如我们刚才运行的工具,我们想改变参数,只统计行数:

  1. 1. 点击历史中输出文件的名称
  2. 2. 点击重新运行任务图标

这时会弹出工具运行界面,此前运行工具设置的参数都自动填充好了,只需要修改特定参数就可以重新运行。

  1. 3. 修改参数
  2. 4. 点击“运行工具”按钮

运行流程

我们可以把多个 Galaxy 工具组合成流程,这样可以一键完成许多分析。流程的运行跟工具差不多,都是给定输入数据,设置参数,点击运行即可。

  1. 1. 点击左侧激活栏的“流程”
  2. 2. 点击“公共流程”标签
  3. 3. 找到想要运行的流程,点击“运行按钮”

这会弹出流程设置界面:

  1. 4. 设置参数
  2. 5. 点击“运行流程”

这样流程就运行起来了。通过监控界面,可以实时看到流程运行的情况:

以上操作使用了流程的许多默认参数设置,如果需要对特定参数进行修改:

  1. 1. 点击“流程运行设置”
  2. 2. 点击“Expanded workflow form”

这样会弹出流程详细参数的设置界面,根据需要进行修改就可以了。


推荐阅读

我们有一门Galaxy经典课程,感兴趣的朋友可以报名参加:

Galaxy经典课程:RNA-seq数据分析实战

平台简介

中国银河生信云平台(UseGalaxy.cn)以“让生信分析更简单”为使命,致力于为科研工作者、医疗机构和生物产业技术人员提供全栈式生物信息学分析解决方案。为了加强交流,我们建立了“Galaxy生信云平台”讨论群,添加小编微信usegalaxy邀请你入群,请备注“单位-姓名-专业-职称/年级”。

转录组分析流程和工具大全(最强总结)

自己整理的ChIP seq分析步骤,有需要可以参考(持续更新)

WES变异检测流程上线:GATK最佳实践 & DeepVariant

一文详解细菌耐药性生信分析:从下机数据到耐药基因鉴定

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 简说基因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Galaxy 简介
    • 强大的开源社区
    • 遍布世界的 UseGalaxy.*
    • 最流行的生信云平台
  • Galaxy 初识
    • 注册登录
    • 界面外观
    • 磁盘配额
    • 并行任务
  • Galaxy 关键操作
    • 操作历史
    • 上传文件
    • 下载文件
    • 查看文件
    • 复制文件
    • 删除文件
    • 运行工具
    • 重新运行
    • 运行流程
  • 推荐阅读
  • 平台简介
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档