前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >转录组数据分析定量featureCounts-8

转录组数据分析定量featureCounts-8

作者头像
生信菜鸟团
发布2024-07-10 16:53:58
1380
发布2024-07-10 16:53:58
举报
文章被收录于专栏:生信菜鸟团

生信技能树学习笔记

官网:http://bioinf.wehi.edu.au/featureCounts/

featureCounts 需要两个输入文件:

1.比对产生的BAM/ SAM文件

2.区间注释文件(GTF格式,SAF格式)

使用featureCounts对bam文件进行定量具体流程

cd $HOME/project/Human-16-Asthma-Trans/Expression/featureCounts ## 定义输入输出文件夹gtf=/home/t_rna/database/GRCh38.104/Homo_sapiens.GRCh38.104.chr.gtf.gzinputdir=$HOME/project/Human-16-Asthma-Trans/Mapping/Hisat2/ # featureCounts对bam文件进行计数featureCounts -T 6 -p -t exon -g gene_id -a $gtf -o all.id.txt $inputdir/*.sorted.bam # 对定量结果质控multiqc all.id.txt.summary # 得到表达矩阵# 处理表头,/home/rna/要换成自己的路径less -S all.id.txt |grep -v '#' |cut -f 1,7- |sed 's#/home/rna/project/Human-16-Asthma-Trans/Mapping/Hisat2//##g' |sed 's#.Hisat_aln.sorted.bam##g' >raw_counts.txt sed s///sed s###sed s%%% # 列对齐显示head raw_counts.txt |column -t

featureCounts的结果解析

另一个定量软件——salmon

官网:http://combine-lab.github.io/salmon/

salmon:alignment-free的定量

Salmon可以快速从fastq快速得到基因表达

Salmon参考文档:https://salmon.readthedocs.io/en/latest/

# 构建salmon索引

salmon index -t Homo_sapiens.GRCh38.cdna.all.fa -i salmon_index

-t:参考基因组fasta文件,可以接受压缩格式

-i:存储索引的文件夹名

分析流程

##----构建索引## 后续索引可直接使用服务器上已经构建好的进行练习cd $HOME/database/GRCh38.105nohup salmon index -t Homo_sapiens.GRCh38.cdna.all.fa -i salmon_index >salmon-index.log &cd $HOME/project/Human-16-Asthma-Trans/Expression/Salmon ##----运行# 编写脚本,使用salmon批量对目录下所有fastq文件进行定量# vim salmon.shindex=/home/t_rna/database/GRCh38.104/salmon_indexinput=$HOME/project/Human-16-Asthma-Trans/data/cleandata/trim_galoreoutdir=$HOME/project/Human-16-Asthma-Trans/Expression/Salmoncat ../../data/cleandata/trim_galore/ID |while read iddo salmon quant -i ${index} -l A -1 ${input}/${id}_1_val_1.fq.gz -2 ${input}/${id}_2_val_2.fq.gz -p 5 -o ${outdir}/${id}.quantdone ##----合并表达矩阵# 原始count值矩阵# --quants:ls -d *quant |tr '\n' ',' |sed 's/,$//' |awk '{print "{" $0 "}" }'# --quants:ls -d *quant |sed ':a;N;s/\n/,/;t a;'|awk '{print "{"$0"}"}'# --quants:ls -d *quant |xargs |tr ' ' ',' |awk '{print "{"$0"}"}'# --names:ls -d *quant |tr '\n' ',' |sed 's/,$//' |awk '{print "{"$0"}"}' |sed 's/.quant//g' ## 完整版:ls -d *quant |tr '\n' ',' |sed 's/,$//' |awk '{print "{"$0"}"}' | perl -ne 'chomp;$a=$_;$a=~s/\.quant//g;print"salmon quantmerge --quants $_ --names $a --column numreads --output raw_count.txt \n";' salmon quantmerge --quants {SRR1039510.quant,SRR1039511.quant,SRR1039512.quant} --names {SRR1039510,SRR1039511,SRR1039512} --column numreads --output raw_count.txt # tpm矩阵salmon quantmerge --quants {SRR1039510.quant,SRR1039511.quant,SRR1039512.quant} --names {SRR1039510,SRR1039511,SRR1039512} --column tpm --output tpm.txt # 后台运行脚本nohup sh salmon.sh >salmon.log &

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档