首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >BioCode - 代码数据库【国家生物信息中心】

BioCode - 代码数据库【国家生物信息中心】

作者头像
生信菜鸟团
发布2025-11-19 19:24:38
发布2025-11-19 19:24:38
230
举报
文章被收录于专栏:生信菜鸟团生信菜鸟团

BioCode(https://ngdc.cncb.ac.cn/biocode)是一个专注于归档生物信息学工具代码的开放式集中仓库,收录了多种用于数据分析的生物信息学工具,并为每个工具提供详细元数据,包括名称、描述、类别、相关项目、发表论文、引用次数、开发者联系方式及所属机构。截至2024年8月,BioCode已收录7,310款工具,来源包括用户提交和对主流生物信息学期刊的自动文献筛选。BioCode支持用户自主提交工具,方便开发者托管代码、软件包和文档,提升工具的公开性和可检索性,为开发者和用户提供高效的工具存档、传播和获取服务。

今天我们从使用层面聊一聊此数据库吧。

查看工具

和多数数据库一样,Biocode 支持根据需求进行搜索,自己不想写或者不会写代码的都可以从数据库中寻找是否有自己需要钱的软件或代码,这次我以这个主页推荐的高下载软件 'LGC' 为例来展示一下查看和使用。

工具详情

点击寻找的工具即可以进入工具到详情页,最左边的选项卡可以跳转到其他页面,主页面有很多板块,记录了不同的信息。

  1. 简介(Introduction):此工具是分析 ORF 开放阅读框长度与 GC 含量的关系来表征和识别 lncRNA。
  2. 基本信息(Basic Information):主要信息就是应用平台,可以看到此工具是在 Linux 上通过 python 实现的。
  3. 评价(Community Ratings):和 APP 软件一样,好用请给好评。
  4. 出版物(Publications)
  5. 致谢(Credits)
  6. 资助方(Grants)

使用手册

这一部分就是代码的使用说明了,包含以下几个内容:

  1. 简介(Introduction)
  2. 安装指南(Installation)
  3. LGC 运行成功提示(Successful run of LGC will print as following)
  4. 输入(Input)
  5. 输出(Output)

代码下载地址

这个就是包下载地址,一会教你怎么用。

代码下载统计

代码使用(新手友好版)

对于老手来说,根据工具操作手册完全可以完全运行了,可以跳过这部份了,这次我就出一个新手友好版的使用手册吧,

查看使用平台

假如我们要使用一个代码或者软件,首先我们就得看一下应该选择什么运行平台,在工具详情页面可以看到此工具使用的是 Linux 平台的 Java 或者 Python3.

安装软件

在使用手册部份有安装说明,我们就可以根据说明一步步安装啦。

下载 Python3

目前来说,基本所有配置好的平台都有安装配置好的 Pythion3,没有安装的可以使用 conda 进行安装,安装好的可以查看一下。

代码语言:javascript
复制
$ python3 --version
Python 3.11.13
下载 LGC
  • 在下载页面点击下载,并吧这个代码包放在 Linux 平台中。
代码语言:javascript
复制
$ ls
LGC-2.0.tar.gz
  • 解压包
代码语言:javascript
复制
$ tar zxf LGC-2.0.tar.gz
$ ls
LGC-2.0.py  LGC-2.0.tar.gz  ORFfinder

准备输入文件

根据说明输入文件是一个 FASTA 格式文件。我从 NCBI 下载了一段 TP53 基因的序列作为示范。

下载后找找到这个文件,放到 Linux 平台文件夹中。

运行代码

代码语言:javascript
复制
$ ls
LGC-2.0.py  LGC-2.0.tar.gz  ORFfinder  gene.fna

$ python LGC-2.0.py gene.fna output.txt 
Input: gene.fna
Output: output.txt
Scan ORF ...
ORFfinder analysis completed.
Done
Computation time 0.029686689376831055 senconds

查看运行结果

上面的运行代码中我们指定结果输出到名为 outpt.txt 的文件中,可以打开查看其内容。因为输入文件是有两条 fasta 序列的,所以输出也是两个。

  • 序列名称(Sequence name):转录本序列标识
  • 开放阅读框起始点 (ORF Start):最长开放阅读框的起始位置
  • 开放阅读框终止点 (ORF End):最长开放阅读框的终止位置
  • 开放阅读框长度 (ORF Length):最长开放阅读框的长度
  • GC 含量 (GC Content):最长开放阅读框的 GC 含量
  • 编码潜能评分 (Coding Potential Score):转录本的编码潜能评分,大于 0 表示编码 RNA,小于 0 表示非编码 RNA(ncRNA)
  • 编码标签 (Coding Label):"Coding"代表 mRNA,"Noncoding"代表长链非编码 RNA(lncRNA)
  • pc :编码序列中开放阅读框(ORF)存在的概率
  • pnc :非编码序列中开放阅读框(ORF)存在的概率
  • fc : 编码序列的终止密码子概率
  • fnc : 编码序列中的终止密码子概率
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信菜鸟团 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 查看工具
    • 工具详情
    • 使用手册
    • 代码下载地址
    • 代码下载统计
  • 代码使用(新手友好版)
    • 查看使用平台
    • 安装软件
      • 下载 Python3
      • 下载 LGC
    • 准备输入文件
    • 运行代码
    • 查看运行结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档