生信技能树学习笔记
数据质量评估
FastQC软件可以对fastq格式的原始数据进行质量统计,评估测序结果,为下一步修剪过滤提供参考。
FastQC主页:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
fastqc的常用参数
1.参数大小写敏感
2.参数两种形式
• 长参数
• 短参数
不是所有参数都有长参数和短参数。
fastqc运行
目标:使用fastqc对原始数据进行质量评估
# 激活conda环境
conda activate rna
# 连接数据到自己的文件夹
# 如果上面做习题的时候已经链接过来,无需再次链接
cd $HOME/project/Human-16-Asthma-Trans/data/rawdata
ln -s /home/t_rna/data/airway/fastq_raw25000/*gz ./
# 使用FastQC软件对单个fastq文件进行质量评估,结果输出到qc/文件夹下
nohup fastqc -t 6 -o ./ SRR*.fastq.gz >qc.log &
#-t指同时处理6个文件,-o指输出到当前文件夹 *是通配符 • nohup:no hang up(不挂起),退出终端不会影响程序的运行 • &:后台运行
# 使用MultiQc整合FastQC结果
multiqc *.zip -o ./
下载数据查看结果