开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

单细胞水平的差异分析是不是就会合理的产出这样的火山图呢

生信技能树

发布于 2024-07-05 14:48:25

发布于 2024-07-05 14:48:25

3790

举报

文章被收录于专栏：生信技能树生信技能树

看到了一个新鲜出炉的单细胞数据挖掘文章，标题是：《Single-cell analysis of tumor microenvironment and cell adhesion reveals that interleukin-1 beta promotes cancer cell proliferation in breast cancer》，研究者重新处理了GSE176078这个数据集，里面是26个乳腺癌患者的单细胞表达量矩阵 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 。

很简单的降维聚类分群后，可以看到是如下所示是的主要单细胞亚群：

6500 CAF cells (markers: COL1A1, COL3A1, and DCN),
7600 endothelial cells (markers: CLDN5 and CDH5),
28200 epithelial cells (markers: EPCAM, KRT8, and KRT18),
9500 myeloid cells (markers: CD68, CD163, CD14, and LYZ),
3200 B cells (markers: CD79A, CD19, and MS4A1),
3500 plasmablast cells (markers: CD79A, MZB1, CD38, and IGHG1),
35200 T cells (markers: CD3D, CD3E, and CD8A)

这个是比较容易的：

第一层次降维聚类分群

而且很明显，第一层次降维聚类分群其实是没办法区分 28200 epithelial cells (markers: EPCAM, KRT8, and KRT18), 里面的恶性与否的上皮细胞，这个时候需要走inferCNV等流程对上皮细胞进行恶性程度的判断。

然后，作者找出来了这26个乳腺癌患者的单细胞表达量矩阵里面的恶性的上皮细胞后，根据病人的临床分组 (five HER2+, 12 ER+/PR+, and nine TNBC samples) 做差异分析，居然得到了如下所示的一个看起来有点奇怪的火山图：

看起来有点奇怪的火山图

如果是这个火山图是基于bulk表达量矩阵，无论是表达量芯片还是转录组测序，的差异分析后的可视化，很明显就有问题的。一般来说log2FC绝大部分都是5以内，大于10的都很少很少了。但是上面的差异分析结果来源于恶性上皮细胞的单细胞表达量矩阵分组，所以有可能是合理的，仅仅是火山图的展示方式不太好了。

学徒作业

重新重新处理了GSE176078这个数据集，里面是26个乳腺癌患者的单细胞表达量矩阵，然后对它进行严格的质量控制后，做出来第一层次降维聚类分群后，提取里面的上皮细胞进行细分亚群后，鉴定里面的恶性情况，然后取里面的恶性上皮细胞根据tnbc与否进行二分组然后进行差异分析哈！

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-06-27，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自生信技能树微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

目录

学徒作业