我们先从理论开始。我不会深入讲解太多细节,因为如果你想了解 PCA 的工作原理,有很多很好的资源^2^3。重要的是要知道 PCA 是一种降维算法。这意味着它用于...
很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。
二分类性状的logistics可以使用plink软件进行分析。这里介绍一下数据的整理和命令的应用。
#我们下载的GEO的芯片差异分析数据大多情况下已经取过log,如果没去过,要记得计算log(否则会导致logFC值过大)
在单细胞PCA降维结果理解以及细胞聚类分群及其可视化中,除了有PCA以及聚类分群结果的可视化以外,都展示了一下UMAP图
在上一期推文单细胞数据标准化及高变基因鉴定里面有整理单细胞下游分析基本流程及使用到的函数
我们可以看到有几个样本很明显散在椭圆之外,我们现在通过第一次pca分析的结果将其删除,看是否会对后续的分析有影响。
上面的结果通常是ensembl数据库的id,需要转换为人类可以看得懂的symbol名字。
英文标题:Comprehensive analysis of macrophage-related genes in prostate cancer by in...
高维数据集是指包含大量变量的数据集,也称为 "维度诅咒",通常给计算带来挑战。尽管大功率计算在某种程度上可以处理高维数据,但在许多应用中,仍有必要降低原始数据的...
主成分分析(Principal Component Analysis,PCA)是一种常用的降维技术,它通过线性变换将原始数据映射到一个新的坐标系中,使得数据在新...
这篇推文的目的是探索一些重要参数对后续分群UMAP可视化的影响。参数主要考虑:高变基因个数;pca维数;UMAP中的n_neighbors,min_dist和d...
类似于bulk RNA-seq,single-cell RNA-seq 的原始count数据也是需要进行标准化的。
锐化功能应用平移锐化算法,将一幅图像(如大地遥感卫星多波段图像)的光谱细节与另一幅图像(如大地遥感卫星全色波段)的空间细节相结合。全色锐化算法在结合空间和光谱细...
降维意味着我们在不丢失太多信息的情况下减少数据集中的特征数量,降维算法属于无监督学习的范畴,用未标记的数据训练算法。
这些技术通常不是孤立存在的,而是相互交叉和融合的,以解决更复杂的问题。在实际应用中,根据具体的问题和数据特点选择合适的模式识别技术是至关重要的。
(1)安装机器学习必要库,如NumPy、Pandas、Scikit-learn等;
https://doi.org/10.1038/s41588-023-01571-z