环境部署——数据下载——查看数据(非质控)——数据质控
使用ascp(Aspera Connect)来下载数据,它是 NCBI 的另一个官方工具。
首先先找到ascp的私钥路径:
find ~/ -name "asperaweb_id_dsa.openssh"
ascp -QT -l 300m -P33001 -i /home/data/t020527/anaconda3/envs/rna/pkgs/aspera-cli-3.9.6-h5e1937b_0/etc/asperaweb_id_dsa.openssh -r era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR238/062/SRR23881762 ./rawdata
conda activate rna_x86_64
三种方式:
# 方式一:直接运行
# -t 6:表示使用 6 个线程来运行 fastqc,可以加快处理速度。数字可以根据机器的 CPU 核心数调整。
# -o ./:指定输出目录。这里 ./ 表示当前目录,生成的质量控制结果会保存在当前目录下。
# SRR*.fastq.gz:这是输入文件名,SRR*.fastq.gz 使用了通配符 *,表示选择所有以 SRR 开头,扩展名为 .fastq.gz 的文件。这通常是一些测序数据文件的格式。
fastqc -t 6 -o ./SRR*.fastq.gz
# 方式二:在命令前后加上nohup &
# nohup:表示“no hang up”,即使关闭终端窗口,命令也会继续在后台运行。
# fastqc -t 6 -o ./ SRR*.fastq.gz:和方式一相同的命令,指定使用 fastqc 进行质量控制。
# > qc.log:将命令的输出重定向到一个日志文件 qc.log 中,这样就不会在终端输出,而是记录在文件里,可以查看日志了解进度和错误信息。
# &:表示将命令放入后台运行,这样可以在同一个终端执行其他命令而无需等待命令执行完成。
nohup fastqc -t 6 -o ./ SRR*.fastq.gz > qc.log &
# 方式三:将命令写入sh脚本,使用nohup & 运行sh脚本
# qc.sh 文件:
#!/bin/bash:这是一行 shebang,告诉系统用 /bin/bash 解释这个脚本文件。
# fastqc -t 6 -o ./ SRR*.fastq.gz:和方式一相同的 fastqc 命令,用于处理测序数据。
# nohup:即使关闭终端窗口,脚本依然继续运行。
# bash qc.sh:运行脚本 qc.sh。
# > qc.log:将运行输出记录在日志文件 qc.log 中。
# &:将脚本放入后台运行。
nohup bash qc.sh > qc.log &
尝试一下第三种:
# cd到文件夹(建议这样,因为bash文件中数据保存路径都是基于这个路径做延伸)
cd ./Desktop/RNA/Human-3-NPC-Tra
# 进入编辑器
nano qc.sh
把下边代码复制进去
#!/bin/bash
# 这是一个批处理脚本,用于运行 fastqc 质量控制
# 设置线程数、输入目录和输出目录
THREADS=6
INPUT_DIR="./rawData"
OUTPUT_DIR="./qc"
# 创建输出目录(如果不存在)
mkdir -p $OUTPUT_DIR
# 运行 fastqc 命令,处理 rawData 目录中的所有 SRR*.fastq.gz 文件
# .gz与否自己判断哈!!
fastqc -t $THREADS -o $OUTPUT_DIR $INPUT_DIR/SRR*.fastq
# 打印完成信息
echo "质量控制完成!结果保存在 $OUTPUT_DIR 目录下。"
# 保存文件
# 屏幕底部会出现提示 File Name to Write: <qc.sh>。按 Enter 确认保存。
Ctrl+O
# 退出nano,这样就会退出编辑器。
Ctrl+X
# 运行一下
nohub bash qc.sh > qc.log &
# check数据
tail -f qc.log
# 退出
Ctrl + C
点击任一一个html文件
GC含量分布图:横轴为平均GC含量;纵轴为每个GC含量对应的序列数量。蓝线为理论分析,红线为测量值,二者越接近越好。
高频序列可能有多种来源:
一次性把每个质控整合在一起,方便浏览
multiqc ./qc/*.zip -o ./qc/
multiQC结果解读跟上述的结果解读是差不多的哦~
致谢:感谢曾老师/新叶老师以及生信技能树团队全体成员。
注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟
- END -
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。