今天分析CITE-seq数据的时候遇到了一个error:“Invalid class "LogMap" object: Duplicate rownames not allowed”。Google之后并没有发现很好的解决方案。
以上是我咨询ChatGPT的结果,可是我发现Expression这个object的rownames没有重复的,怎么都想不通为啥会报错提示duplicate rownames。
Invalid class "LogMap" object: Duplicate rownames not allowed
然后我就检查了一下colnames有没有重复的。结果发现我的colnames居然有duplicates。这个colnames就是一个个细胞的barcode。我建库的时候用了不同的sample_Tag,然后不同的Sample_Tag之间竟然有几个overlap,即: 使用了相同的barcode。很奇怪的是不同的Sample_Tag包含的Cell_Index居然有duplicates。 以下是我个人的猜测:
Q1-难道不同的Sample Tag会使用部分重复的barcode么?
Q2-还是测序仪不同批次之间有污染?
Solution: 暴力解决的方法:
既然已经知道了哪些细胞来自哪个sample,那么我就可以manually edit these Cell_index。即我可以认为的修改这些Cell_index,可以从小到大排序。从10000开始计数。避免产生duplicated colnames.
当我认为的修改完这些Cell Index之后,再run CreateSeuratObject() function之后就没有报错了。
总结:
1. 明明是colnames存在duplicate, 报错却提示duplicate rownames。为何会出现这样的报错尚待解决。
2. Different Sample_Tag (BD company) may exist same cell_index. When combine different samples to one .csv file, need to make clear whether there are duplicate value.
3. 只要是run code, 就没有轻松的时刻。。。总是会报错,勤于Google或者chatgpt,可以解决大部分的问题。同时也要善于记录,不然相同的问题再次出现,又会去花时间搜索。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。