导语
GUIDE ╲
背景介绍
假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。
目前,在NCBI中下载SRA数据主要有三种方式:
小编的个人经验:第一种Aspera工具在批量下载时偶尔会出错。第二种SRA Toolkit的prefetch命令下载,只能将数据下载到home目录下。关于前两种方法网上有很多详细的介绍,感兴趣的朋友们可以自行搜索,我们今天主要来介绍第三种wget命令的方式,这种方法的关键是找到SRA数据对应的ftp地址。
获取ftp地址
进入NCBI网页后,按如下步骤操作:
wget命令
接下来呢,用wget命令下载SRA数据,有两种方式:
下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载:
wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run-4/ERR635048/ERR635048.1
若想批量下载这个样本的四个SRA数据,可以将这四个ftp地址整合到一个文件中(如文件名为list.txt)。
利用wget函数,-i 参数给出文件的名字
wget -c 50 -i list.txt
小编总结
如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?get了这个技能,你就可以原地休息啦!
END