在经历了第一次做·RNA-seq的摸爬滚打之后,我大概对RNA-seq的流程和要使用的软件有了一些了解,并知道了它们的用法,于是便做了第二次的RNA-seq,然后想做一个总结笔记 1.原始数据下载软件Aspera Aspera用于下载sra原始数据 将Aspera connect安装在Linux上 代码如下
wget https://download.asperasoft.com/download/sw/connect/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz
tar -zvxf aspera-connect-3.6.2.117442-linux-64.tar.gz
sh aspera-connect-3.6.2.117442-linux-64.sh
~/.aspera/connect/bin/ascp -h
2.sra文件解压软件SRA-toolkit在Linux的安装
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-ubuntu64.tar.gz
tar -zvxf sratoolkit.2.9.2-ubuntu64.tar.gz
echo 'export PATH=~/sratoolkit.2.9.2-ubuntu64/bin:$PATH'>>~/.bashrc
source ~/.bashrc
prefetch -h
3.序列比对软件hisat2的下载
wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip
unzip hisat2-2.1.0-Linux_x86_64.zip
echo 'export PATH=~/hisat2:$PATH'>>~/.bashrc
source ~/.bashrc
4.基因表达量计算软件htseq-count htseq-count是一个python包,所以我们需要先下载一个Anaconda来配置python环境
wget https://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh
sudo sh Anaconda3-5.2.0-Linux-x86_64.sh
echo'export PATH=~/anaconda3/bin:$PATH'>>~/.bashrc
source ~/.bashrc
conda --version
Anaconda配置python环境
conda create --name python27 python=2.7 -y
conda create --name python34 python=3.4 -y
conda info -e
下载htseq-count
conda install htseq-count
全文结束,欢迎在评论区讨论~