Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >图解 | 怎么解读一个树状图

图解 | 怎么解读一个树状图

作者头像
医学数据库百科
发布于 2022-04-01 01:02:08
发布于 2022-04-01 01:02:08
3.4K0
举报

使用范围

树状图主要是用来展示不同的对象之间的相似度大小(习惯上称之为距离关系远近)的一个图形。一般最常用到的是对层次聚类结果的可视化。但是不仅限于此,我们只要是可以衡量不同对象之间的相似度,都可以通过树状图来进行可视化。

比如,在高通量测序的各个样本当中,利用层次聚类➕ 树状图来比较各个样本之间的整体表达关系的远近。

例如:下面就展示了六个观测对象,在散点图上的距离关系(👈图)以及在树状图的具体呈现(👉图)。

基本概念

在了解树状图之前,对于树的一些基本概念就需要解释一下。 既然叫做树状图,那么这个图就和树类似的,我们可以把图形的顶端看作是树的根,这样的,往下走到了岔路的时候就是树枝了,所以这个地方就叫做进化枝(clade),再往下到了末端的时候,就是树叶了,所以这个地方就叫做进化叶(leaf)

图形解读

在整个树状图当中,进化枝的排列可以看出哪些叶子彼此之间相近 。另外,每个叶子的高度也代表了不同叶子之间差异/相似程度。高度越高,两个叶子区别越大

这里我们使用5样本的表达谱芯片的数据进行层次聚类然后构建了树状图。来观察这个样本之间的表达的相似程度。

对于树状图的解读是自下而上进行的。首先我们可以看到。Sample 2 和Sample 3两个是最相近的。

再往上可以看到Sample 4和Sample 2/3是在第二个进化枝上,这三个样本相似度次之,进而是和Sample 1相似。最后才是和Sample 5的具体相似度

通过树状图的高度可以看出,Sample 5和Sample 2/3差异是最大的。整体来看,Sample 5和其他四个样本都有一定程度的差异。

另外,对于一个树状图而言,其高度是有意义的,对于每一个对象的左右的距离就没有什么意义了。这个基本上就是怎么排列好看怎么来了的。

其他扩展图形

以上就是树状图的基本图形解读,同样的其实我们在研究物种进化的时候使用的进化树其实也算是树状图。解读起来也是一样的。

关于进化树的构建,我们之前出过一个简单版本的介绍:[[进化树的构建基本过程]]

同样的,在对表达数据进行热图展示的时候,一般的绘图工具,对热图的行和列也都是进行了聚类分析之后然后基于聚类的结果进行树状图的排列的。

进一步,如果对传统的树的结果觉得太单调,那也可以把树弯曲变成一个⭕️ 。

当然,如果每个样本还有其他的特征性的信息,也可以继续添加进行展示。同样的可以是线性的也可以是⭕️ 的。

以上就是关于树状图的基本内容了,至于做图工具的话,还是看自己能掌握什么工具。如果也是用R语言进行做图的话,推荐使用ggtree呀。一个专门绘制树的工具。这里附上ggtree大佬的公众号,欢迎关注。

参考资料

  1. https://www.displayr.com/what-is-dendrogram/
  2. https://wheatoncollege.edu/wp-content/uploads/2012/08/How-to-Read-a-Dendrogram-Web-Ready.pdf
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库百科 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R语言ggtree画圆形的树状图展示聚类分析的结果
那么圆形的树状图如何实现呢?我查找了一下相关资料。R语言包dendextend这个包可以实现,利用help(package="dendextend")查看帮助文档,能够看到其中的一个小例子
用户7010445
2020/11/13
3.7K0
R语言ggtree画圆形的树状图展示聚类分析的结果
批次效应到底是个什么东东?
简单翻译一下的话,就是: 批次效应是在进行实验的时候附带产生了和实验结果没有关系的数据偏差。例如, 1. 一组实验在星期一进行一次而另一组在星期二进行, 2. 两名技术人员进行相同的实验, 3. 实验当中使用了两种不同批次的试剂、芯片或仪器 以上这些都有可能产生批次效应则可能会出现批次效应。
医学数据库百科
2022/04/01
2K0
批次效应到底是个什么东东?
局部整体(六)利用python绘制树状图
由一个根节点组成,根节点产生多个通过分支连接的子节点。常用于表示层次结构或显示聚类算法的结果。树状图既可以看明白数据的层次结构,也能明白指标间的「对比」。
HsuHeinrich
2024/11/23
3860
局部整体(六)利用python绘制树状图
ggtree-给你的进化树盛世美颜
ggtree是ggplot2的拓展包,可以应用于进化树的绘制,还能对进化树丰富的注释分析。
作图丫
2022/03/29
12.5K0
ggtree-给你的进化树盛世美颜
通透!十大聚类算法全总结!!
这些聚类算法各有优缺点,适用于不同类型的数据和不同的应用场景。选择合适的聚类算法通常取决于具体的需求、数据的特性和计算资源。
Python编程爱好者
2023/11/28
6.5K0
通透!十大聚类算法全总结!!
Nature Methods | TooManyCells:单细胞聚类和可视化方法
2020年3月2日宾夕法尼亚大学的Gregory W. Schwartz等研究人员在nature methods上发表了题为TooManyCells identifies and visualizes relationships of single-cell clades的文章,该工作提出了TooManyCells方法,用于有效和无偏地识别和可视化单细胞,为细胞状态分层、探索和检测稀有集群提供灵活的平台。
DrugAI
2021/02/01
8920
Nature Methods | TooManyCells:单细胞聚类和可视化方法
一文学会从测序数据到构建系统发育树:超全面的详细步骤与软件指南
在科研工作里,构建与美化进化树是必须掌握的技能之一。这篇文章汇总和整理了之前的相关内容,依照文章中的脉络,基本上能够在大多数情形下满足构建进化树的需求。本文将从测序数据到构建系统发育树需要经过这4个步骤进行阐述:①数据收集与预处理②多序列比对③选择适合的建树方法④系统发育树的评估与美化。
简说基因
2025/01/22
8280
一文学会从测序数据到构建系统发育树:超全面的详细步骤与软件指南
使用Y叔神包ggtree进行基因家族基因进化树构建
大家好,我是技能树的老朋友啦,三年前在群主的第一波RNA-seq入门8步活动中因为表现优异获得群主青睐成为技能树VIP一员,也开启了自己的学习经验分享人生!
生信技能树
2019/08/02
9.1K1
使用Y叔神包ggtree进行基因家族基因进化树构建
小案例(七):口碑分析(python)
案件回顾 商业街口碑分析 顾客在网络上会发表对商品或商店的留言信息 对留言进行分析,可以对商业街进行口碑分析 在论坛中整理了300条留言,并进行分词处理,整理出了不同性别不同年龄段在留言中,使用单词的频数(问题:不同年龄或性别对商业街的印象是否一致?) 聚类分析 将数据存储为csv格式,导入python,查看前10行数据。 import pandas as pd reviewsdata = pd.read_csv('reviewsdata.csv',index_col=0)#index_col=0第一列
三猫
2018/04/10
1.2K0
小案例(七):口碑分析(python)
【生物信息学】层次聚类过程
  层次聚类是一种基于树状结构的聚类方法,它试图通过在不同层次上逐步合并或分裂数据集来构建聚类结构。这个树状结构通常被称为“树状图”(dendrogram),其中每个节点代表一个数据点或一组数据点,而连接节点的分支表示聚类的形成过程。   下面是层次聚类的一般原理:
Qomolangma
2024/07/30
1540
用机器学习来计算工作技能的匹配度
此项目的成员包括Brett Amdur,Christopher Redino和Amy (Yujing) Ma。他们毕业与今年1月11日至4月1日举办的为期十二周的纽约数据科学全职训练营。这篇文章基于他们的终期项目 —— 顶点项目(Capstone Project)而完成。点击此处可见原文。 I. 概述 此项目的主要内容是应用机器学习方法来判断简历中工作技能的匹配程度。一家机构向纽约数据科学研究院的学生陈述了此项目,他们希望找到合适的学生来完成项目。本文的三个作者接受了这个项目,他们当时都是研究院的全日制学生
用户1737318
2018/06/06
1.3K0
生信代码:层次聚类和K均值聚类
层次聚类 (hierarchical clustering)是一种对高维数据进行可视化的常见方法。
科研菌
2021/01/25
2.3K0
构建系统发育树
构建系统发育树属于群体遗传学分析范畴,随着时间和地理位置的变化,新冠病毒经过多次迭代,在基因组上会累积不同的突变,已经与祖先产生明显的不同。通过对多个序列进行系统发育分析,不仅可以厘清不同物种之间的亲缘关系,而且可以重塑新冠病毒的演化过程,具有重要的现实意义。例如某地新发疫情,可以对样本快速测序,构建全基因组序列,然后对其进行系统发育分析,快速定位到系统发育树中,可以快速鉴定新发菌株的亲缘关系,对于疫情防控溯源具有重要的指导作用。
生信喵实验柴
2022/04/07
3.9K1
构建系统发育树
【机器学习】无监督学习携凝聚型层次聚类登场。无需预设标签,仅凭数据内在特质,逐步归拢聚合,挖掘隐藏群组,为复杂数据剖析开启智能、高效的新思路。
层次聚类是一种通过递归合并(凝聚型)或递归分裂(分裂型)数据点的方式,逐步构建出一个层次结构的聚类方法。层次聚类的结果通常通过**树状图(Dendrogram)**表示,它可以直观地显示数据点之间的相似性或距离关系。
逆向-落叶
2025/01/20
2020
【机器学习】无监督学习携凝聚型层次聚类登场。无需预设标签,仅凭数据内在特质,逐步归拢聚合,挖掘隐藏群组,为复杂数据剖析开启智能、高效的新思路。
R语言ggtree按照指定的节点旋转树
http://yulab-smu.top/treedata-book/index.html
用户7010445
2021/01/20
1.9K0
R语言ggtree按照指定的节点旋转树
聚类方法的区别解读:各种聚类分析呀呀呀
k 均值聚类法 快速高效,特别是大量数据时,准确性高一些,但是需要你自己指定聚类的类别数量 系统聚类法则是系统自己根据数据之间的距离来自动列出类别,所以通过系统聚类法 得出一个树状图,至于聚类的类别 需要自己根据树状图以及经验来确定
学到老
2019/02/13
1.9K0
一文读懂层次聚类(Python代码)
本篇想和大家介绍下层次聚类,先通过一个简单的例子介绍它的基本理论,然后再用一个实战案例Python代码实现聚类效果。
算法进阶
2022/06/02
3.2K0
一文读懂层次聚类(Python代码)
原理+代码|详解层次聚类及Python实现
聚类分析是研究分类问题的分析方法,是洞察用户偏好和做用户画像的利器之一。聚类分析的方法非常多,能够理解经典又最基础的聚类方法 —— 层次聚类法(系统聚类) 的基本原理并将代码用于实际的业务案例是本文的目标,同时这也会为理解后续与聚类相关的推文如 K-Means 等打下基础是。
刘早起
2020/12/07
5.1K0
R语言绘制圈图、环形热图可视化基因组实战:展示基因数据比较
heatmap()的输入应该是一个矩阵(或者一个将被转换为单列矩阵的向量)。如果矩阵被分割成组,必须用split参数指定一个分类变量。注意spilt的值应该是一个字符向量或一个因子。如果它是一个数字向量,它将被转换为字符。
拓端
2021/09/29
5.4K0
详细介绍了Python聚类分析的各种算法和评价指标
较为详细介绍了聚类分析的各种算法和评价指标,本文将简单介绍如何用python里的库实现它们。
润森
2022/08/18
2.6K0
详细介绍了Python聚类分析的各种算法和评价指标
推荐阅读
相关推荐
R语言ggtree画圆形的树状图展示聚类分析的结果
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档