特别提示:本文较长,如果你要此文的 PDF/Word/Markdown 版本,请加微信 usegalaxy 邀请你入群领取。
我们将于 2025 年 10 月 18 日开展一期《RNA-seq 数据分析实战研讨班》,内容包括上游表达量矩阵的获得和下游发表级别的统计图表制作,感兴趣的朋友可以报名参加。
Galaxy 是一个开源的,基于网页的生物医药大数据分析平台,其核心优势包括:
项目网站:https://galaxyproject.org
用户使用一个平台最担心的是什么?毫无疑问,是不稳定、随时跑路。担心花大力气学会,用不了多久平台就下线了,又得学习别的平台,从而造成时间金钱的浪费。
而 Galaxy 平台完全开源,其所有代码托管在 GitHub 网站上:https://github.com/galaxyproject/galaxy,任何人都可以贡献代码和安装部署。
项目至今吸引了全世界 357 位贡献者(截止 2025-08-18),这使得平台可以博采众长,社区保持旺盛的生命力。平台诞生至今已 20 周年,正在向下一个 20 周年进发。
捐助 James P. Taylor 开放科学基金
https://jxtxfoundation.org/
由于 Galaxy 开源的特点,其子站点遍布世界各地,以下列举一些主要站点。
世界上还有许多其他国家、高校和研究机构管理的 Galaxy 站点。
世界上主要的 UseGalaxy.* 站点所安装的工具和流程都差不多,使用方式也一样,相当于是克隆站。它们之间最大的区别在于所处的地域。也就是说,用户的使用体验,更多是由地域决定的。
用户通常应该选择离自己最近的 Galaxy 站点,这主要是因为离站点物理距离近,上传数据比较快。
具体来说,选择哪个站点,跟你的数据量和数据来源有关:
20 年的开源社区发展,遍布世界各地的子站点,数十万全球用户,Galaxy 已经成为当之无愧的最流行的生信云平台。
持续为用户提供稳定的服务,不担心跑路。从投入回报的角度来说,Galaxy 可能是一个最值得学习使用的生信云平台。
强烈建议激活账户,否则平台的使用会受到许多限制,如磁盘空间、并行任务数量等。
Galaxy 主页从左到右分成 4 个面板:
每个 Galaxy 实例都有一定的磁盘配额。以 UseGalaxy.cn 为例,注册用户共有 200G 磁盘存储空间,其中 100G 长期存储,100G 短期存储(7 天)。
如果默认存储满足不了项目需求,可以向平台申请增加配额。
所有注册用户和非注册用户都有一个默认并行任务配额。UseGalaxy.cn 平台:
需要说明的是,默认并行任务配额并非一成不变,平台会根据计算资源情况适时调整。
管理员可以调整每位注册用户并行的任务数,如果你的任务较多,可以向管理员申请增加并行任务配额。
用户在平台的数据分析结果,都会呈现在右侧历史面板中。我们可以对历史进行各种操作,比如:
2. 输入新的名称,比如:Meet Galaxy,回车即可
命名为:Next Analysis
会弹出一个界面。在常规数据上传选项中,可以上传本地文件,也可以选择远程文件,或者直接粘贴/ 获取数据。
这里再解释一下:
通过以上操作,你将会在右侧历史中看到第一个元素,Galaxy 中习惯称为:数据集。数据集会经过 3 个状态:灰色(准备/ 排队)、黄色(运行中),最后变为绿色(成功)。
这会展开文件的信息(默认情况下所有数据集都是折叠的)
这时会弹出对话框,根据需要选择下载文件保存的路径即可。
随后在中间的主面板中会显示文件的相关信息。
可以方便地在历史之间复制文件,只需要拖动鼠标就可以了。
从上面可以看到,删除的文件,只是移动到了回收站,是可以恢复的。删除的文件依然占据磁盘空间,如果要释放磁盘空间,则需要永久删除文件。
这样,所选文件就彻底从磁盘中删除了,释放了磁盘空间,文件不可再恢复。
Galaxy 的工具,简单理解就是各种软件的界面打包版本。比如我们想简单统计一下文件的信息:有多少行、单词、字符等。
提示任务提交成功:
右侧历史面板中,结果文件会经历前面提到的 3 个阶段:灰色(准备/ 排队)、黄色(正在运行)、绿色(成功)。
当结果文件变成绿色后,可以点击眼睛图标查看内容:
有些时候我们需要重新运行工具,比如需要调整某个分析参数,或者调整输出图片的大小。这时候所有设置参数都要重新设置一遍吗?在 Galaxy 平台,不需要的。
比如我们刚才运行的工具,我们想改变参数,只统计行数:
这时会弹出工具运行界面,此前运行工具设置的参数都自动填充好了,只需要修改特定参数就可以重新运行。
我们可以把多个 Galaxy 工具组合成流程,这样可以一键完成许多分析。流程的运行跟工具差不多,都是给定输入数据,设置参数,点击运行即可。
这会弹出流程设置界面:
这样流程就运行起来了。通过监控界面,可以实时看到流程运行的情况:
以上操作使用了流程的许多默认参数设置,如果需要对特定参数进行修改:
这样会弹出流程详细参数的设置界面,根据需要进行修改就可以了。
我们有一门Galaxy经典课程,感兴趣的朋友可以报名参加:
中国银河生信云平台(UseGalaxy.cn)以“让生信分析更简单”为使命,致力于为科研工作者、医疗机构和生物产业技术人员提供全栈式生物信息学分析解决方案。为了加强交流,我们建立了“Galaxy生信云平台”讨论群,添加小编微信usegalaxy邀请你入群,请备注“单位-姓名-专业-职称/年级”。
自己整理的ChIP seq分析步骤,有需要可以参考(持续更新)