前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >图出不来主要是数据问题,不怕!提前效验~~

图出不来主要是数据问题,不怕!提前效验~~

作者头像
生信宝典
发布2024-07-31 12:13:10
780
发布2024-07-31 12:13:10
举报
文章被收录于专栏:生信宝典

我们正在做 ImageGP3 (https://www.bic.ac.cn/BIC/#/)的升级工作,如果你有兴趣,欢迎添加页尾二维码标识的微信与我们联系,为 ImageGP3 的功能升级、教程写作、宣传推广一起努力! 每个人各尽其力,或一起写代码,或一起写教程,或一起推广,或提出自己的建议,一定是要具体可以落在实处的。 作为 ImageGP 的合作作者,集思广益,更好的让 ImageGP 为社群做好服务。

今天一早收到一个报错反馈:

Starting… Error in sp_volcano_plot(data = data, geneL = geneL, log2fc_var = log2fc_var, : Must specify log2 transformed fold change column for Fold change column. Execution halted

一看就是数据问题,指定的列包含非数字信息,这通常是 Excel 中处理处理数据带来的问题:

找到原因了,反馈给用户。后来想,还是要加一个这样的效验。于是有了,碘酒 Check Data 后下面的提示:

ImageGP 还有很多数据效验,比如效验数据是否完成的行或列、是否存在重复的列名等。

在我们的文档中也有详细介绍,见下:

数据格式效验主要包括几个内容:

  1. 数据矩阵的列分割符是否为单个TAB键。
  2. 数据矩阵的每一行列数是否相等。 这也是常见问题。
  3. 矩阵的列名字是否有特殊字符。
  4. 两个数据矩阵的信息是否匹配。
  5. 宽矩阵是否第一列有无重复值、除了第一行和第一列其它元素是否都为数字。

检测不通过的都会给出提示,弹出提示不要惊慌。请仔细阅读提示信息,改正数据后再提交。如果描述不清楚,请到群里提问。

Error: The column delimiter of XXXX should be one TAB. 错误:XXXX中的数据列分隔符应该是TAB。 XXXX 代表某个输入框

如果文件的列分隔符不是TAB键,则会弹出这个提示。

Error: No duplicate names are allowed in the first column of the data in XXXX. 错误:XXXX中的数据第一列不允许有重复值。’

数据的第一列不允许有重复值。对于宽矩阵会有这个限制。

Error: For data in XXXX/em>, column names should not contain characters other than Numbers, Letters, or Underscores (_), Numbers should not present as the first character of column names, and column name not be repeated’ 错误: XXXX 中的数据列名不能有数字,字母或下划线以外的字符,不能以数字开头,且不能重复。

这是一个常见问题,列名字通常用来索引列的信息。为了避免后面程序出错,这里要求严格了一些。

Error: All value in XXXX should be numbers except for the first row and the first column when Matrix format is Wide. Column {self.column_name} contains non-numerical values. 错误:类型错误,当Matrix format是 Wide时,XXXX中的数据除第一行第一列外都是数值 类型,列{self.column_name}包含非数字信息。

提前判断数据中是否有非数值信息。

Error: Line {self.line_index} of your data in {self.argument} does not contain the same number of contents as the other lines (header line is the first line). 错误:{self.argument}中的数据的第 {self.line_index} 行的列数与其他行不同 (标题行记为第一行)。

判断矩阵中某一行是不是有缺失的列或者列的分隔符不对。

Error: These rows in the data matrix in {self.argument} contain illegal characters like {illegal_character}: \n Please check these rows: {self.illegal_row} 错误: 输入框{self.argument} 中的数据存在来自 Excel 的非法字符如 {illegal_character}: \n 具体存在非法字符的行是:{self.illegal_row}

判断数据中是否有 Excel 引入的非法字符如#NAME?等.

用了这个参数的箱线图看着很不一样

你做的多组散点图是不是丢失信息了!?

ImageGP 颜色设置大更新:新增支持顶级杂志配色,离散颜色更多,可复制色号,共享颜色

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-07-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信宝典 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据格式效验主要包括几个内容:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档