首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    k-mer分析:你的基因组有没有被污染?

    其中Kmergenie常用于预测de novo组装中最优组装k-mer大小,根据reads分割k-mers并绘制k-mer深度分布曲线。...现在所有的测序reads均产生测序k-mers,由于测序深度较高,k-mers出现的频次也即k-mer深度较大,在去除错误率影响的前提下,可以认为其中完全不同的k-mer数目即是genomic k-mer...数目,使完全不同的k-mer的数目最大的k值就是最佳k-mer大小。...hash的二进制文件结果给出,需要统计出k-mer总数(Total),特异的k-mer数目(Distinct),只出现过一次的k-mer数(Unique),频数最高的k-mer数目(Max_count)...等信息,以stats命令来运行,如下所示: jellyfish stats -o mer_counts_stats.txt mer_counts.jf 对k-mer的计数结果有个直观的认识,则需要统计出现了

    3.3K40

    关于k-mer与基因组(组装)的那些事

    在这个过程中,我们经常会遇到k-mer这个名词,然而这个抽象的名词是什么意思呢?它又有什么用呢?接下来,就随着小编一起去探究这k-mer背后的含义吧! k-mer是什么?...通过将reads切割成以k为单位的k-mer,由于测序错误具有随机性,这些由于测序错误生成的k-mer绝大多数都是原测序物种中不存在的k-mer,因此都只出现了1次,要是将这些k-mer去掉,那么就会较大的可能除去测序错误...我们用k-mer做什么? 在了解了k-mer是什么以及通过去掉低频率的k-mer能够使得组装结果更加准确以后,k-mer就没有别的用途了吗?当然不是!...下图是在k-mer=15、17、19时分别作的k-mer深度分布曲线。...说了那么多使用k-mer分析的优点,好像忘了一个重要的点:k-mer怎么好像只有奇数呢? 是的,k-mer只能是奇数,就是为了防止通过k-mer组装时,正反链混淆。

    10.8K85

    R软件基于k-mer 的DNA分子序列比较研究及其应用

    基于k-mer的DNA分子序列比较研究是序列比较的一种,该方法以进化论作为依据,从序列的相似性出发探究同源的可能性。...关于相似度的计算,首先将生物序列转化为k-mer的词频向量,然后利用距离公式求得生物序列的距离矩阵作为相似度的量化。...(2)k-mer的读取。利用R编程软件,给定不同的k值计算基因序列的k-mer出现的频率,将每个物种不同k-mer出现的频率写成4k维频率向量,再将多个物种向量合并成矩阵形式。(3)计算熵权。...熵权代表了指标的重要性,根据熵权法的定义,在获得归一化的评价指标的判断矩阵后,根据熵权计算公式用判断矩阵计算出全部4k个k-mer的熵权。(4)量化相似度。...故结果表明基于k-mer思想,利用熵权来研究DNA序列非比对方法精确度更好,是有效的。

    28800

    测序数据组装的常用工具

    K-mer设置过大可能造成拼接结果较少,这是因为每个reads产生的k-mer数会随着k-mer size增大而减少,尤其是质控后的reads末端低质量碱基被切除,长度减小。...可以查看不同k-mer size下的组装结果,如果随着k-mer增大组装结果减少过多可以调整最大k-mer的数值,以确保获取更多的组装结果(尤其是对于宏基因组组装来说)。...SOAPdenovo安装后得到2个可执行文件,即最大kmer为63的SOAPdenovo-63mer和最大kmer为127的SOAPdenovo-127mer。...-127mer scaff -g graph_prefix -F 1>scaff.log 2>scaff.err #可以一步完成所有过程,如下所示: SOAPdenovo-127mer all -s config_file...他从小的k-mer开始到大的的k-mer进行迭代计算,设定阈值,短的和低深度的contigs被删掉,这样来完成低深度和高深度的拼接。

    2.9K20

    miRNA 靶向预测软件targetscan

    01 Targetscan靶向预测思想 TargetScan 基于序列互补原则,找到比对到靶 3'UTR 的保守性 8 mer、7 mer 或 6 mer 位点(seed match 序列),进一步根据热力学稳定性筛选得到...seed 序列配对主要考虑三种类型:7 mer-1a(miRNA 的第 2-7nt 与靶基因互补配对, 而且 UTR 上与 miRNA 1nt 互补配对的位置是 A);7 mer-m8 (miRNA 2...-8nt 与靶基因完全配对);8 mer (miRNA 2-8nt 与靶基因完 全配对,而且 UTR 上与miRNA 1nt 互补配对的位置是 A)。...主要包括如下几部分: Site Type 8 mer > 7 mer-m8 > 7 mer-1a; 3' pairing contribution:除了与 miRNA seed 区域配对,与 miRNA12...其中标题各列的含义如下: Gene ID:基于 ID Species ID:物种 ID Mirbase ID:miRbase 中 miRNA 的 ID Site Type:配对类型(8mer、7 mer-m8

    6.2K20

    bioinfo08-算法04-复制起点你在哪?

    如果有两段我们认为应该是相同的k-mer,p,q,对应碱基位置有p1 … pk 及 q1 … qk,但如果pi ≠ qi,则说明i 位置发生了错配。...3 输出全部的小于容忍数值大小的对应k-mer 的位置,比如输入3,则输出的对应位置的pattern 和比较的pattern 的Hamming distance 都是小于3 的。...2.2-重置重复序列查找函数 回顾一下之前[[04-算法01-频繁出现的秘密]] 中的函数: $ python3 02-k_mer_pattern.py ....加上参数d,计算所有匹配的片段以及它们的mismatch,输出加上mismatch 后,计数最大的那个k-mer。...这里按照我的理解,所谓的包含一定容忍的k,比如指定d 的大小,指的是,先找到一些合适的k-mer,再从这些k-mer 池里,计算每个k-mer 及其容忍的k,最终合并容忍k 的总数记为各个k-mer 的计数

    51420

    jellyfish:快速计算kmer分布

    默认情况下会生成名为mer_counts.jf的文件,该文件是一个二进制文件,可以通过其他命令来查看该文件中的内容。 2....生成kmer 统计表 dump子命令可以将上述步骤生成的二进制文件转换成纯文本的文件,用法如下 jellyfish dump mer_counts.jf > kmer_count.fasta kmer_count.fasta...查询某个kmer出现的次数 query 子命令可以快速查询某个kmer的频数,用法如下 jellyfish query mer_counts.jf GCTACCATGATAGCCAAGGAAATCCCACAAA...统计kmer基本信息 stats子命令会给出kmer的基本统计信息,用法如下 jellyfish stats mer_counts.jf 会在命令行输出如下统计结果 Unique: 130512636...统计kmer频数分布 histo子命令可以给出kmer的频数分布,用法如下 jellyfish histo mer_counts.jf > kmer_hist.tsv 输出内容如下 1 130512636

    2.4K41

    AAAI | 联合建模医学命名实体识别和标准化的神经多任务学习框架

    使层次化任务(MER和MAN)在保持任务间相互支持的同时,转化为并行多任务模式成为可能。 在本文中,作者将MER和MEN看做两个并行的任务。MER和MEN采用相同的输入但具有不同的输出。...因此,可以将MEN视为具有与MER相同的输入的序列标记任务。...和MEN任务的反馈进行的改进,证明了反馈策略都能提高这两个任务的性能,其中对MER效果尤为明显;最后一部分展示了将Bi-LSTM、多任务学习(MTL)和MER,MEN的反馈策略联合起来的模型效果,最终证明了文章提出的模型效果是最优的...最后作者还分析了普通模型和本文模型的边界不一致误差,实验结果表明MTL可以显著的缓解MER和MEN边界不一致问题,从而提高模型性能。...为了更先进、更智能地利用两者之间的关系,文章提出了一种新的具有两种显式反馈策略的深层神经多任务学习框架来联合建模MER和MEN。

    92160
    领券