首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏叶子的数据科技专栏

    SRA-Toolkit工具下载SRA数据

    引言 高通量的原始数据通常情况下会上传到NCBI的SRA(Sequence Read Archive)数据库。 常见的下载方法有^5^: aspera 工具下载 wget, curl命令直接下载 NCBI官方的 SRA Toolkit 进行下载 aspera 工具配置麻烦, 直接下载容易出错, 所以使用SRA-Toolkit 过程 使用 SRA-Toolkit 工具进行下载 下载 SRA-Toolkit 工具并安装 主要流程来源于官方教程及网络^1-2^. 官方教程链接: 02. Installing SRA Toolkit · ncbi/sra-tools Wiki · GitHub https://github.com/ncbi/sra-tools/wiki/02. SRA数据转化为fastq文件 使用SRA-Toolkit中的fastq-dump工具将SRA数据转化为fastq文件。 转换之前需要知道我们拿到的数据是单端还是双端数据^3^。

    2.6K00编辑于 2023-05-24
  • 来自专栏生信菜鸟团

    SRA数据库官方工具—SRA Toolkit

    工欲善其事必先利其器 SRA Toolkit SRA Toolkit 是由美国国家生物技术信息中心(NCBI)提供的一组工具,专门用于处理 Sequence Read Archive(SRA)中存储的高通量测序数据 这个工具包包含了一系列命令行工具,用于检索、转换、处理和分析来自 SRA 的数据。 SRA 中检索数据,提供强大的查询和过滤功能 数据处理与压缩:支持对 SRA 数据进行基本的处理、压缩和格式转换,以满足用户需求 质量控制与分析:提供了一些工具和选项,用于质量控制、测序数据的初步分析和统计 其中的数据则是通过压缩后以.sra文件格式来保存的。 所以整个转换过程,大概需要sra文件的17倍左右的空间。

    3.6K11编辑于 2023-12-06
  • 来自专栏单细胞

    sra转fastq

    因为恰好遇到了PRJNA752099这个数据集,他上传的fastq文件被合并成了一个,所以我需要下载SRA文件重新拆分。正好作为上游最后一块的补充内容。 下载sratoolkitwget --output-document sratoolkit.tar.gz https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current sratoolkit.tar.gzexport PATH=$PATH:$PWD/sratoolkit.3.1.1-ubuntu64/binfaster-dump --help我事先下载了PRJNA752099的4个SRA

    46711编辑于 2024-07-12
  • 来自专栏生物信息学_troubleshooting

    Submit fastq files to SRA

    原始数据需要上传到SRA, 有processed data的可以上传到GEO。否则就需要上传到SRA dataset。 Troubleshooting了3-4h,终于搞清楚了。 Mac OS terminal:(There is standard introduction in the SRA submission page to guide users how to upload

    31200编辑于 2024-06-29
  • 来自专栏生物信息学、python、R、linux

    SRA toolkit下载数据

    1.sra toolkit 的安装 wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.10.8/sratoolkit.2.10.8-ubuntu64.tar.gz SraAccList.txt looks like this: SRR11192680 SRR11192681 SRR11192682 SRR11192683 SRR11192684 4.SRA format to fastq fasterq-dump --split-files SRR11180057.sra fasterq-dump --split-files SRR11180057 #直接下载原始的 fastq prefetch --type fastq SRR11180057 参考:https://www.ncbi.nlm.nih.gov/sra/docs/sradownload/

    1.4K20发布于 2020-09-16
  • 来自专栏HUBU生信

    Aspera下载SRA文件

    -k 1 -l 200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR620/SRR6208854 /SRR6208854.sra ~/Seqs/ 二、 Aspera批量下载SRA文件 很多时候需要同时下载多个SRA文件,ascp命令提供参数--file-list,用于批量下载SRA文件。

    Step 1:建立SRA文件路径列表文件sra_list.txt

    nano ~/Seqs/sra_list.txt 输入以下两行文本: /sra/sra-instant/reads/ByRun /sra/SRR/SRR623/SRR6232298/SRR6232298.sra /sra/sra-instant/reads/ByRun/sra/SRR/SRR623/SRR6232299/SRR6232299 .sra 按Ctrl+O,Ctrl+X保存退出

    Step 2:批量下载sra_list.txt列表中的文件

    ascp -T -i /home/xiaoming/.aspera/connect

    2.6K20发布于 2018-12-27
  • 来自专栏生物信息学_troubleshooting

    Download fastq from SRA

    cpus-per-task=24 --time=35:59:00 module load sratoolkit #download the SRR_Acc_List.txt (sample list) from SRA website cd /data/$userID/ITP mkdir sra nohup cat SRR_Acc_List.txt | while read id; do fasterq-dump - /sra/; done & #-t ./ will save the tmp downloading files, and will be deleted when the download is finished #-O save the output (fastq files, not sra files) in the sra folder.

    17700编辑于 2024-11-20
  • 来自专栏生物信息学

    下载NCBI SRA数据的最佳方法

    高通量的原始数据通常情况下会上传到NCBI的SRA(Sequence Read Archive)数据库。当我们需要用到这些数据的时候,就需要合适的方法来下载。 所以,最稳定最安心的方法是使用SRA Toolkit中的 prefect来下载。 ? 下载安装SRA Toolkit: https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software ? 如果你有其他的更好的下载方法,欢迎留言或者私信后台交流~ 参考: https://github.com/ncbi/sra-tools https://github.com/ncbi/sra-tools /wiki/HowTo:-Access-SRA-Data

    2.5K20发布于 2020-04-14
  • 来自专栏生信情报站

    详解Linux 下 Aspera 获取 SRA 数据

    使用 3.1 下载地址 NCBI的FTP下载链接:ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR507/SRR5077625 /SRR5077625.sra EBI的aspera下载链接era-fasp@fasp.sra.ebi.ac.uk:/vol1/ERA012/ERA012008/sff/library08_GJ6U61T06 .sff NCBI的aspera下载链接:anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR507 /sra-instant/reads/ByRun/sra/SRR/SRR507/SRR5077625/SRR5077625.sra . /sra-instant/reads/ByRun/sra/SRR/SRR507/SRR5077625/SRR5077625.sra 下载路径 .

    3K20发布于 2021-01-13
  • 国内高速下载测序SRA数据

    虽然NCBI的SRA(Sequence Read Archive)数据库提供了大量的测序数据,但由于网络访问速度的限制,特别是从国内访问时,下载速度可能受到严重影响。 EBI的ENA数据库与NCBI的SRA数据库类似,存储了大量的测序数据,并且提供了多种下载方式。其中,enaBrowserTools结合Aspera的方式因其高效和便捷性而受到推荐。 This flag is ignored for fastq and sra format options. This flag is ignored for fastq and sra format options. /sra# /disk/share/toolkits/enaBrowserTools-1.6/python3/enaDataGet -f sra SRR212430 -d .

    61500编辑于 2024-06-12
  • 来自专栏HUBU生信

    prefetch命令下载SRA文件

    除了利用ascp命令从NCBI下载SRA文件外,SRAtoolkit也提供了prefetch命令用于下载SRA文件。 prefetch命令用法如下: Usage: prefetch [options] <SRA accession | kart file> [...] Download SRA or dbGaP files and their dependencies prefetch [options] <SRA file> [...] 而SRA文件会默认下载在~/ncbi/public/sra 目录下 prefetch命令下载多个SRA文件: 1. 详细说明参见官方Documentation: https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?

    5.2K10发布于 2018-12-27
  • 来自专栏yw的数据分析

    NCBI下载sra数据(新)

      今天要上NCBI下载sra数据发现没有下载的链接,网上查发现都是老的方法,NCBI页面已经变更,于是看了NCBI的help,并且记录下来新版的sra数据下载方法,要用NCBI的工具SRA Toolkit 方法1 NCBI告知的方法(中断不能继续下载) 下载SRA Tookit https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? 下载后直接解压到某个指定位置 搜索SRA并获取accesion list 在NCBI sra页面(https://www.ncbi.nlm.nih.gov/sra)输入登陆号( accession number 更详情的请查看prefetch 帮助:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? /reads/ByRun/sra/SRR/SRR548/SRR5483090/ 可见ftp构成: ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun

    2.9K90发布于 2018-04-28
  • 来自专栏Y大宽

    3:数据处理:sra转成fq文件

    生信技能树已经很贴心地把sra格式数据全部下载。共5.3个T。 查看共多少样本 (base) pc@pc-System-Product-Name:/data/fudan_TNBC$ ls -l |grep "^-"|wc -l 727 把/data/fudan_TNBC/下的sra for id in `seq 8223 8454`; do nohup sudo fastq-dump --gzip --split-3 /data/fudan_TNBC/SRR851${id}.sra done nohup for id in `seq 854 999`; do sudo fastq-dump --gzip --split-3 /data/fudan_TNBC/SRR8517{id}.sra -O .; done & for ((i=854;i<=999;i++));do sudo fastq-dump --gzip --split-3 -A SRR35899$i.sra -O .

    1.4K50发布于 2019-05-29
  • 来自专栏小汪Waud

    SRA数据几种常用的下载方法

    除原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。 SRA Toolkit[1]可以直接下载NCBI中的SRA数据文件和参考序列并转换为fastq格式。 /sra-instant/reads/ByRun/sra/SRR/SRR159/SRR15927225/SRR15927225.sra ./ 如果要换成NCBI上的其他SRA数据,只需要修改【SRR159 SRA-Explorer[6]是一个为了让SRA更易检索、更易下载的网页端应用。 参考资料 [1] SRA Toolkit Documentation: https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? list [6] SRA-Explorer: https://sra-explorer.info/

    7.9K50编辑于 2023-02-16
  • 来自专栏生信菜鸟团

    SRA高效数据传输—ASCP

    下载accession list,把SRA编号,通过vim写到SRA.list里 使用ascp下载需要密匙asperaweb_id_dsa.openssh,位置在: #我的环境名称是chip,文件路径需要自行探索 :/vol1/fastq/$x/$id/${id}.fastq.gz ./ done #双端测序: cat SRA.list|while read id do x=$(echo $id | cut -b1 :/vol1/fastq/$x/$id/${id}_1.fastq.gz \ era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/$x/$id/${id}_2.fastq.gz ./ done 若SRR后为七位数 #单端测序: cat SRA.list|while read id do x=$(echo $id | cut -b1-6) y=$(echo $id | cut :/vol1/fastq/$x/00$y/$id/${id}_1.fastq.gz \ era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/$x/00$y/$id/${id}

    2K10编辑于 2023-12-06
  • 来自专栏作图丫

    如何在NCBI中下载SRA数据?

    导语 GUIDE ╲ 背景介绍 假设我们现在有一个样本号“IRIS_313-11156”,想下载该样本的所有SRA数据(注意:一个样本的SRA数据可能分不同次run上机)。 目前,在NCBI中下载SRA数据主要有三种方式: 利用Aspera工具下载。 利用SRA Toolkit下载。 利用wget命令直接下载。 wget命令 接下来呢,用wget命令下载SRA数据,有两种方式: 下载单次run的sra数据,可以直接用命令,默认下载到当前目录下。 其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载: wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run 利用wget函数,-i 参数给出文件的名字 wget -c 50 -i list.txt 小编总结 如何获取SRA的ftp地址,以及如何批量下载SRA数据你学会了吗?

    3.1K32编辑于 2022-03-29
  • 来自专栏生信情报站

    生信软件 | Sratools (操作SRA文件)

    使用 3.1 下载SRA 3.2 抽取fastq文件 1. 介绍 Sratools是NCBI官方提供,用于操作SRA (reads and reference alignments) 数据的工具集合 一般常用于下载SRA文件,从SRA文件中提取fastq,sam 文件,查看SRA文件信息等 2. 使用 官方文档:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? view=toolkit_doc 3.1 下载SRA https://github.com/ncbi/sra-tools/wiki/HowTo:-Access-SRA-Data 下载单个文件

    7.1K20发布于 2021-01-13
  • 来自专栏生信技能树

    SRA数据库的数据并不一定要在SRA数据库下载

    肯定得搜索呀 经过搜索我就知道了,嘿嘿,原来我们用prefech下载的数据都在https://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun /sra/可以找到,但是我发现这里面的数据是没有我要下载的SRR,此时想起了,jimmy老师说的“敲命令不是随便乱敲的,它存在我们才写”,其实下载数据同样如此,你下载的数据的地方要有你的数据你才可以下载 5 继续探索 然后我也搜索了一下,这两个应该也是存放数据的地方类似于SRA, 找到地址了,接下来肯定是下载起来啦(大神一句话,菜鸟跑半年,这句话还是有道理的) 有链接地址,还想啥,wget啊,但是看到下面的网速可能你会崩溃

    1.8K30发布于 2019-10-25
  • 工具:iSeq下载公开SRA数据科研利器

    因此,本质上还是从SRA数据库中下载测序数据。 iseq -i SRR1178105 -q该参数只有在accession来自于SRA/ENA/DDBJ/GEO数据库,并且下载的文件为SRA文件时才有效。 -d, --database指定下载SRA文件的数据库,支持ena和sra两种数据库。 但是,有些SRA文件可能在ENA数据库中下载速度较慢,此时可以通过-d sra强制指定从SRA数据库下载数据。[! NOTE]注意:如果在ENA数据库中没有找到对应的SRA文件,即使指定了-d ena参数,iSeq依旧会自动切换到SRA数据库进行下载。8.

    75410编辑于 2025-03-12
  • 来自专栏生信菜鸟团

    WGS分析实战-01:从SRA数据下载到构建GenomicsDatabase

    sratoolkits fastp samtools bwa GATK、picard (1)原始测序数据 & 参考基因组下载 & 索引构建 首先根据文章的Bioproject编号(PRJDB5412),找到SRA Experiments这一栏 文章中用于分析的样本有16个,下载对应样本的SRA编号即可: # mkdir 00.raw_data && mkdir 00.ref prefetch --option-file arab_ref.fa.amb # arab_ref.fa.ann # arab_ref.fa.bwt # arab_ref.fa.pac # arab_ref.fa.sa (2)SRA 数据格式转换 # 工作目录:00.raw_data # 存放到一个文件夹下 mkdir sra_file for id in `ls -d D*`;do mv ${id}/${id}.sra sra_file ;done # 格式转换 ls sra_file/* > sra_id.txt for id in `cat sra_id.txt`;do echo "fastq-dump --split-3 --gzip

    2.6K31编辑于 2022-04-08
领券