河南农大姚文与中科院北京基因组所章张课题组合作发布真核生物长链反向重复序列数据库
近日,河南农业大学生命科学学院姚文教授(校聘)课题组联合中国科学院北京基因组研究所章张研究员在国际知名期刊《Nucleic Acids Research》在线发表了题为《LIRBase: acomprehensive database of long inverted repeats in eukaryotic genomes》的研究论文。该研究系统鉴定了424个真核生物基因组中的长链反向重复序列(long invertedrepeat,LIR),并构建了数据库LIRBase。LIRBase不仅提供了数据检索与下载等功能,还提供了多个在线分析LIR的功能模块,包括LIR序列的鉴定、LIR表达量分析、LIR二级结构预测、BLAST分析、高通量小RNA测序数据比对LIR序列、小RNA靶标基因预测等。
小干扰RNA(small interfering RNA,siRNA)是一类在真核生物中广泛存在、长度为18~25个碱基的非编码调控序列。siRNA通过调节基因的表达水平,参与了真核生物的生长发育、肿瘤发生、性别分化、环境适应等众多生命过程。研究发现,LIR可转录形成长的发卡结构RNA(long hairpinRNA, hpRNA),经进一步加工可形成长度为21~22个碱基的siRNA。鉴于LIR的重要生物学功能,课题组系统鉴定了424个真核生物基因组中的6,619,473条LIR序列,并构建了LIRBase数据库。其中,在77个后生动物基因组中鉴定了297,317条LIR序列;在139个植物基因组鉴定了1,731,978条LIR序列;在208个脊椎动物基因组中鉴定了4,590,178条LIR序列。作为一站式数据库,LIRBase将有助于推动真核生物LIR以及由LIR形成的siRNA的功能及进化机制研究。
实验室前期研究中报道了一个水稻F2群体的小RNA测序数据,通过对小RNA表达量的遗传分析,发现OsDCL2b、OsDCL2a、OsRDR2等基因的自然变异调控了大量小RNA在不同材料之间的表达量变异(Wang and Yao et al. eLife, 2015; Yao et al. ComputStruct Biotechnol J, 2020)。然而,前期研究同时发现仍有大量小RNA的表达量变异和DCL、RDR、AGO等小RNA生物合成过程的关键基因没有关系。本研究利用LIRBase数据库重新分析了这套小RNA测序数据,发现大量小RNA是由LIR形成的,LIR在F2群体两个亲本之间的序列变异是大量小RNA在不同F2材料之间表达量变异的形成原因。
使用LIRBase分析另外一套水稻小RNA测序数据,本研究筛选到一条LIR,在水稻受白叶枯病菌侵染之后迅速高量表达。LIRbase数据库预测显示,这条LIR编码的siRNA靶向8号染色体上串联排列的多个编码类萌芽素蛋白的基因。这些基因位于前期研究中报道的一个水稻广谱抗白叶枯病的主效QTL位点内。目前,实验室正在围绕这一通路开展后续实验。
河南农业大学博士生贾利华和李阳副教授(校聘)为该论文共同第一作者,姚文教授(校聘)和章张研究员为该论文共同通讯作者。该研究得到了国家重点研发计划(2017YFC0907502)、国家自然科学基金(31900451,31871328,32030021)、河南农业大学拔尖人才科研启动基金(30500581)、中国科学院战略性先导科技专项(XDA19050302)等项目的资助。
全文链接:
https://academic.oup.com/nar/advancearticle/doi/10.1093/nar/gkab912/6395344?searchresult=1
文字:李阳
审核:姚文