首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >读《Docker实战》

读《Docker实战》

作者头像
生信菜鸟团
发布2025-11-19 19:32:04
发布2025-11-19 19:32:04
660
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

跟着运来兄搭建自己的生物信息小书房。趁年轻,读几本硬书,到老了慢慢反刍。

《Docker实战》是咱们生信书房推荐的第69本书。在做了一段时间生物信息分析工作之后,大约是2018年左右,开始看到一些项目开始用Docker部署分析流程的环境,当时便觉得这个可能会改变生物信息软件的部署方式。

然后是零星地接触和了解这个工具,但是从来不系统。不知道Docker这个单词的本意是指在船只停靠港口之后,将商品移进或移出的港口码头工人。箱子和物品的大小、形状各异,而有经验的码头工人能以合算的方式,手工将商品装入船只,因而他们备受青睐。

在生物信息分析过程中,我们经常需要安装一个又一个软件、部署流程。当有不同的软件流程时,安装失败、版本冲突、环境杂乱可能会用掉大量的时间。明明人家软件写得很好,奈何用不了。可以说,准备环境是一件高成本、费时、需要手工操作且十分不优雅的事情(天知道会出现什么样的意外,明明有十年生物信息经验,照样会束手无策,囧)。

那么,Docker解决的就是这个环境部署的问题,它像一个承包商,只要告诉他,需要构建单细胞测序平台,他会把上下游需要的仪器和试剂都配置齐全。或者,当我们在一个服务器上构建好流程之后,需要迁移到另一个服务器上,如果从头部署,那很头大。

这样看来,是有必要了解一下Docker的工作方式了。2020年这本《Docker实战》一上市,就买了这个纸质版。这里面没有一句是关于生物信息的,没有基因组、转录组、蛋白组、表观组学,有着Docker使用的114个技巧。从编写一个Dockerfile,到从镜像中提取文件。内容的组织上,符合做中学的基本逻辑,既可以按需去读相应的内容,也可以从头到尾循序渐进地阅读。

不敢说这是学习Docker最好的一本书,但却是一本有一定提高,又能有所收获的书。面对一个新的技术,很多时候我们需要的也不是最好的材料,而是有个相对系统的材料。因为我们面对的是一个新的领域,有就是好,不去找最新的、最全的,而是拿起一份可以用的。

学习Docker的一个难点是,在自己的服务器上部署一个Docker。吊诡的是,Docker专业用语环境部署,但是要部署Docker本身却需要更多的权限。换句话说,阅读这本书是有一定的门槛的。虽然说是:技多不压身,但是每个人的时间也很有限,所以还是值得翻看一下的^_^。

如今年十月的一篇文章:ShortCake: An integrated platform for efficient and reproducible single-cell analysis,就是用Docker封装了单细胞数据分析的主要工具,让单细胞数据分析更加的高效和可重复(单细胞数据分析重复不出来是不是很难受?)。

你像单细胞数据分析中比较难配置的velocyto分析,只需要一行代码就行了。

代码语言:javascript
复制
docker run --rm rnakato/shortcake \
velocyto run10x -m repeat_msk.gtf mypath/genes.gtf

想不想试一试?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档