本文为Nanopore碱基识别及质控简明教程,正文将使用到如下软硬件:
纳米孔是一个纳米级的小孔,在其设备中,Oxford Nanopore 使离子电流通过纳米孔,并测量当生物分子通过或靠近纳米孔时的电流变化。由于纳米孔的直径非常细小,仅允许单个核酸聚合物通过,而ATCG单个碱基的带电性质不一样,因此不同碱基通过蛋白纳米孔时对电流产生的干扰不同,通过实时监测并解码这些电流信号便可确定碱基序列,从而实现测序。
图片来源:Oxford Nanopore Technologies官网
1. 底层模块检查:
rpm -qa | grep -i dkms
rpm -qa | grep kernel-devel
rpm -qa | grep gcc
如未能找到,则参考如下命令安装:
yum install -y dkms
yum install -y kernel-devel
yum install -y gcc
#或yum install -y dkms kernel-devel gcc
2. 下载驱动:
wget https://us.download.nvidia.com/tesla/510.47.03/NVIDIA-Linux-x86\_64-510.47.03.run
细节可参考:https://cloud.tencent.com/document/product/560/8048
3. 安装驱动:
chmod +x NVIDIA-Linux-x86_64-418.126.02.runsh NVIDIA-Linux-x86_64-418.126.02.run
4. 验证:
nvidia-smi
#监控GPU使用情况
如返回信息类似下图中的 GPU 信息,则说明驱动安装成功。
1. 框架下载
wget https://developer.download.nvidia.com/compute/cuda/11.6.2/local_installers/cuda-repo-rhel7-11-6-local-11.6.2_510.47.03-1.x86_64.rpm
细节可参考:https://cloud.tencent.com/document/product/560/8064
2. 安装框架
rpm -i cuda-repo-rhel7-11-6-local-11.6.2_510.47.03-1.x86_64.rpm
yum clean all
yum -y install nvidia-driver-latest-dkms cuda
yum -y install cuda-drivers
1. Guppy下载
wget https://mirror.oxfordnanoportal.com/software/analysis/ont-guppy_6.0.1_linux64.tar.gz
2. Guppy解压及配置
tar xf ont-guppy\_6.0.1\_linux64.tar.gz
#可直接配置到工作环境环境中~/.bashrc
#本示例解压在/home目录下,可自行替换实际软件路径
#export PATH="/home/ont-guppy/bin:$PATH"
1. 前置R及R包部署
yum install R
Rscript -e "install.packages(c('ggplot2','viridis','plyr','reshape2','readr','yaml','scales','futile.logger','data.table','optparse'), repos='https://mirrors.tuna.tsinghua.edu.cn/CRAN/')"
2. 下载R脚本
wget https://raw.githubusercontent.com/roblanf/minion_qc/master/MinIONQC.R -O MinIONQC.R
本次的测试数据来源于NCBI的PRJNA812612项目的开放数据集,github上有作者的model JSON文件及分析脚本,感兴趣的可以自行前往(https://github.com/DamLabResources/HIV-Quasipore-basecallers)。
1. 下载地址:
2. 数据下载
wget https://sra-pub-src-2.s3.amazonaws.com/SRR18215551/JLat_106_MinION_R941.fast5.tar.gz.2
#AWS直接下载的速度较快
腾讯云的下载速度也比较给力,如下图
3. 数据解压
tar xf JLat_106_MinION_R941.fast5.tar.gz.2
参数 | 说明 | 本次所用值 |
---|---|---|
-i | Path to input fast5 files. | /home/nanopore/data/r9.4.1/ |
-s | Path to save fastq files. | /home/nanopore/normal/r9.4.1 |
-c | Config file to use. | dna_r9.4.1_450bps_hac.cfg |
-x | Specify basecalling device: 'auto', or 'cuda:<device_id>'. | cuda:0 |
关于config参数,大家可以通过如下命令(列出Guppy支持的试剂盒和芯片清单),增加理解。
guppy_basecaller --print_workflows
guppy_basecaller -s /home/nanopore/normal/r9.4.1 -i /home/nanopore/data/r9.4.1/ -x cuda:0 -c dna_r9.4.1_450bps_hac.cfg
感兴趣的可以查看GPU效能,这里可以看到用了8G的显存,显存核心利用率为100%,具体参数可以参考网上博客说明,如https://www.jianshu.com/p/ceb3c020e06b?msclkid=4dc4c38ac2c311ec99ef9b6bf6e3371a
本次Basecalling总共用了近58分钟,T4的速度比V100慢3~4倍,如果是V100,这个速度一般在20分钟以内。
本次生成70个fastq文件,大家在使用时候可以直接合并成一个文件。
cat *.fastq > AllinOne.fastq
参数 | 说明 | 本次所用值 |
---|---|---|
-i | Input file or directory (required) | /home/nanopore/normal/r9.4.1 |
-q | The cutoff value for the mean Q score of a read (default 7) | 12 |
-o | Output directory (optional, default is the same as the input directory). | /home/nanopore/normal/r9.4.1/qc |
-p | Number of processors to use for the anlaysis (default 1) | 20 |
Rscript MinIONQC.R -i /home/nanopore/normal/r9.4.1 -q 12 -o /home/nanopore/normal/r9.4.1/qc -p 20
QC完成后,将生成一些质控图及统计文件,感兴趣的小伙伴可以到github上(https://github.com/roblanf/minion_qc
)看详细的解释说明,这里就不展开说明了。
后续的工作,大家可以根据各自需求调整或进行下游二三级分析。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。