首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    FASTA序列格式介绍

    之前介绍很多基于序列分析的数据库的时候,都会提到FASTA序列。之后也会遇到很多基于序列分析的数据库。所以今天就把基因序列的格式单独拎出来说一下。...GATGGGATTGGGGTTTTCCCCTCCCATGTGCTCAAGACTGGCGCTAAAAGTTTTGAGCTTCTCAAAAGTC TAGAGCCACCGTCCAGGGAGCAGGTAGCTGCTGGGCTCCGGGGACACTTTGCGTTCGGGCTGGGAGCGTG 只是看...也就有了fasta序列格式。 在 fasta 文件当中,每一个序列由两部分组成。 序列的特征性 ID,例如:基因名,[[Gene Id二三事]] 等等。 具体的基因序列。...下载到的序列文件基本上都是以"fa", "faa"等格式结尾的。这样的格式的文件,如果想要查看的话,只需要利用文本文档打开即可。例如,下面就是 TP53 蛋白序列的 fa 文件。...TP53蛋白序列fa文件 了解了 fa 的具体格式。也就可以自己制作自己想要的 fa 序列。

    2.8K10

    fasta格式文件介绍与处理

    今天的部分是fasta格式文件介绍与处理。...一、fasta 文件格式 FASTA 文件主要用于存储生物的序列文件,例如基因组,基因的核酸序列以及氨基酸等,是最常见的生物序列格式,一般以扩展名 fa,fasta,fna 等。...1.1 fasta 文件格式介绍 fasta 文件中,第一行是由大于号">"开头的任意文字说明,用于序列标记,为了保证后续分析软件能够区分每条序列,单个序列的标识必须是唯一的,序列 ID 部分可以包含注释信息...文件格式处理案例 # fasta 文件格式处理案例 #案例一:统计 seqkit stats kmer45.scafSeq #分别统计每一条序列长度 seqkit fx2tab kmer45.scafSeq...|awk '{print $1"\t"length($2)}' #案例二:格式化 seqtk seq -l 0 kmer45.scafSeq #每行显示 50 个碱基 seqtk seq -l 50

    3.7K20

    fasta序列按指定格式输出

    前言:有时在处理fasta文件时,我们需要序列按照规定的格式排列。 很多人应该遇到过需要将序列排列到一行上,或者每行按照规定的bp数显示。...我也经常遇到像60bp,70bp的不等长fasta序列共存于同一个fasta文件中的情况,为了避免不同长度对后面的处理造成影响,一般最好将格式统一。...fasta file format: 虽然是个小问题,但是却有很多不同的方法来实现这些操作,那接下来还是以举例说明,讲解一些方法来实现上面讲到的两种格式排列。...")#原始fasta文件describe.add_argument("optf",help="Output fasta")#修改格式后的输出文件args=describe.parse_args() ##...writer = FastaWriter(output_fasta,wrap=args.nwrap)#设置写出格式writer.write_file(SeqIO.parse(args.orgf,"fasta

    1.5K40

    从linux源码看epoll

    从linux源码看epoll 前言 在linux的高性能网络编程中,绕不开的就是epoll。...本文就是笔者在探究epoll源码过程中,对kernel将就绪描述符添加到epoll并唤醒对应进程的一次源码分析(基于linux-2.6.32内核版本)。...(注:由于是tcp socket,所以这边sock->ops=inet_stream_ops,这个初始化的过程在我的另一篇博客linux源码看socket的阻塞和非阻塞>>中,博客地址如下: https...注:上图来自PLKA(Linux内核架构>>) step2: 紧接着跟踪next_rx_action next_rx_action |-process_backlog .........总结 epoll作为linux下非常优秀的事件触发机制得到了广泛的运用。其源码还是比较复杂的,本文只是阐述了epoll读写事件的触发机制,探究linux kernel源码的过程非常快乐^_^。

    5.2K41

    从linux源码看epoll

    前言 在linux的高性能网络编程中,绕不开的就是epoll。和select、poll等系统调用相比,epoll在需要监视大量文件描述符并且其中只有少数活跃的时候,表现出无可比拟的优势。...本文就是笔者在探究epoll源码过程中,对kernel将就绪描述符添加到epoll并唤醒对应进程的一次源码分析(基于linux-2.6.32内核版本)。...源码看socket的阻塞和非阻塞>>中,博客地址如下: https://my.oschina.net/alchemystar/blog/1791017) 既然知道了tfile->f_op->poll的实现...的软中断机制调用net_rx_action,如下图所示: 注:上图来自PLKA(Linux内核架构>>) step2: 紧接着跟踪next_rx_action next_rx_action...总结 epoll作为linux下非常优秀的事件触发机制得到了广泛的运用。其源码还是比较复杂的,本文只是阐述了epoll读写事件的触发机制,探究linux kernel源码的过程非常快乐_。

    2.3K20

    生信菜鸟团博客2周年精选文章集(6)三个最基础生信软件教程

    fasta文件,可以随便找两个fa文件做测试 三:运行命令 1,建库,用makeblastdb,标准是 makeblastdb -in db.fasta -dbtype prot -parse_seqids...-out dbname 具体参数看help里面的,但是我们一般用这几个就够了的 ?...-outfmt:输出文件格式,总共有12种格式,6是tabular格式对应BLAST的m8格式 -evalue:设置输出结果的e-value值 -num_descriptions:tabular格式输出结果的条数...fastqc软件的使用 一:下载安装该软件 具体搜索其地址下载,fastqc是一个java软件,下载后可以直接使用,但是需要自行配置好java环境,具体配置方法,见linux下java配置。 ?...这个图其实很容易看,就是100bp长度reads上的1-100的坐标在这四千万条reads里面的测序质量的箱线图,看那个红线均值就可以了,超过Q30就蛮好了,超过Q20也是合格的 3,碱基(A,T,C,

    1.2K110

    linux 文件编码格式转换

    问题描述–(linux 下经常遇到的编码问题) ---- 师兄在 windows 下写的一段程序 (C/C++ 编写), 传给我在 Linux 下面运行, 编译和运行的时候输出的时候中文乱码了 ?...原因解析 ---- 如果你需要在 Linux 中操作 windows 下的文件, 那么你可能会经常遇到文件编码转换的问题....Windows 中默认的文件格式是 cp936(通常被视为等同 GBK), 而 Linux 一般都是 UTF-8 3. 背景知识 (什么是编码?)...方法二:在 Vim 中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式 ?...如果你只是想查看其它编码格式的文件或者想解决用 Vim 查看文件乱码的问题,那么你可以在 ~/.vimrc 文件中添加以下内容: set encoding=utf-8 fileencodings=ucs-bom

    7K30

    Linux磁盘-格式化&挂载

    Linux磁盘涉及到的命令不是很多,但是在实际运维中的作用却很大,因为Linux系统及业务都会承载到硬盘上。如果磁盘使用和配置不合理,可能会引起系统无法启动或者业务系统无法提供预期的服务。...而在Linux系统里面目前用得最多的系统是ext4和xfs,这里我们有2块盘分别用不同的方式进行格式化。 小知识:在ext4前面当然还有ext3,ext2。...当然在其他类型的Linux里面也还有更多的文件系统。...1.格式化ext4 [root@localhost ~]# mkfs.ext4 /dev/sdc1 mke2fs 1.42.9 (28-Dec-2013) 文件系统标签= OS type: Linux...这里就需要知道在Linux里面有下面这个一个文件,你的磁盘是否自动挂载都写到这里。 在刚刚挂载的时候,我们用的是直接用的是输入的设备地址,而下面配置文件写的是一串UUID,他们之间有什么区别呢?

    20500
    领券