00:01
哎,好了啊,时间差不多了,我来,我们来上我们的第18课。关于空间转录组的hot spot.我不知道大家有没有接触过这个方法。这个hot spot呀,最开始出现的时候,哎,并不是为了空间而准备的。是为了什么呢?为了单细胞的分析而准备的。大家在做这个单细胞分析的时候啊,哎,尤其是涉及到定义的时候。嗯,比如说像T细胞分了很多亚群,对吧,要对亚群进行定义。像T细胞还好啊,有一些。哎,有一些marker呢,可以供参考,把它定义成T效应,T08,哎GT等等等等。但是像这个组织类细胞,如果进行一个定义就非常的麻烦了。你像组织类细胞分了5个亚群,哎,怎么定义呢?这个时候呢,很多的这种marker啊,已经不起作用了。
01:04
哎,所以呢,人们就在这个,哎,他们表达的一个层面做了更多的一个研究。其中大家常见的那个像单细胞的那个NMF分析。哎,就是为了这个。组织类细胞这种非常难定义的细胞亚群而准备的。那么像NMF这种方法呢,它在这个定义的过程中啊,有一个就是说转入程序的问题。也就是说,比如说都是组织细胞,都是上皮细胞,它分了几个亚群,它们之间必然存在着一定的差异,那个差异有什么体现呢?哎,就是由这个他们的表达特征来体现。NMF的方法呢,就是在他们分亚群的一个基础之上。寻找每个亚群它的基因表达的一个特征啊,从而辅助我们对细胞亚群的生物学功能进行一个识别。但是NMF啊,有一个缺陷。
02:03
哎,什么缺陷呢?就是说他需要我们有先验的一个知识。比如说我们做了这个组织细胞,分了5个亚群之后,对吧。哎,我在用NMNMF寻找这个program的时候啊。嗯,需要先验,就是说需要告诉他。有几个程序?哎,比如说人为设定有5个程序,有6个程序等等。但很多时候啊,我们这个先验的知识,先乐的这个能力啊,往往是没有的。就像单细胞区裂一样,哎,我们不能一开始就告诉这个。那方法说我有几种细胞类型,你给我分几个群就好了。呃,没有这种鲜艳的能力,所以说呢,在NMF在分析这个program的时候啊。应用范围不是那么的广。啊,那么在NMF这个基础之上呢,有一些新的方法,比如说像这个hot spot.哎,他的这个NMF,它和那个NMF的目的是一样的。
03:00
也是为了找寻,哎,最初最初的目的也是为了找寻每个亚军,他的一个。哎,表达程序的一个特异性。只不过呢,它比NMM更加先进的一个程度就在于。它可以不人为指定,而通过机器聚类,聚成一些哎,核心的模块,用来表征这个亚群的一个表达特征。哎,随着慢慢发展呢,慢慢发展,哎,这个方法呢,根据它的一个底层逻辑,慢慢应用到我们的空间上面来寻找到我们空间转录组的一个hot spot.哎,这个软件本身呢,就发了一个很高的文章啊,这里面已经给大家。哎,放在这儿,哎,Hold sport识别这个基因模块,这就是这个软件分析的一个最最哎,最原始的目的就是拿到这个基因表达矩阵之后。哎,分析它的一个网络,这个网络如果只有单细胞数据是这个。相似性矩阵那个KN网络。
04:02
哎,如果有空间数据的话,就是它的坐标网络。哎,拿到这个坐标网络之后呢,开始识别,呃,具有相似的,就是连接非常紧密的这些细胞啊,它们共同表达的一个特征。形成这个相似的graph。对,相似的graph,哎,由此来形成这个不同的一个经营模块。所以说这个方法在定义这个,哎,定义这个细胞亚群,哎,那时候非常有效啊,也就是大家常见的这个组织细胞分了5群,哎,每个群行使不同的功能。哎,这个时候呢,借助how胞的这种方法,哎,可以辅助识别这5个细胞类型,它到底在行使怎样的一个生物学功能。嗯。右边这个呢,就是对这个软件的一个简单的一个总结。第一个呢,它就是基于图的程序来识别基因信息和基因模块。哎,主要就是这个基因models。
05:00
注意啊,它这个地方基于图的程序。哎,这个图的程序是可以变的。像单细胞,如果没有空间数据,这个图程序就是KNN网络。K网络是怎么计算的呢?就是根据它相似哎,细胞之间的相似性构建的这样一个模拟的。超平面的一个空间网络。啊,如果我们有空间的一个坐标的话,那就是本身的它的一个空间的一个坐标网络。啊,这个就是图的程序,图的程序就是要获取它的一个,哎,距离的远近的一个网络。其中呢,来自相似的细胞信息,哎,就像这样的。它如果表达非常相似,哎,相似的细胞形进形成这样一个临近的网络之后呢。哎,他们的信息是共享的,就是说我表达的,你也应该有表达才对。这样的话基因就会,哎,基因就会共享。从而啊,提高这种稀疏性,哎,提高这种稀疏矩阵的灵敏度啊。也就是说,大多数细胞表达的基因,在少部分不表达的细胞中,他也应该表达。
06:02
这样的话会对稀疏性啊进行一个插补的一个效果。哎,接下来呢,就分析单细胞数据的时候,出现2个基因,基本目标是以信息的方式确切确定哪些基因的变化,也就是说哪些基因存在这种。哎,同时存在表达或者同时高表达这样的一个基因模块,这个模块哎,就像刚才提到的那样,对于识别细胞亚群非常有效啊。我分了5个亚群。之后每个亚群内部。必然有一些他们共享的基因,共享表达的基因,这些基因就成为了摩一种哎细胞类型的一个特征。哎,确定,然后形成这个模块,如果说我们的空间数据呢。哎,空间数据如果构建这个网络。哎,形成的模块就是它的一个空间的hot spot, 也就是说在空间层面这些基因存在这个空间层面上,哎,存在着一个很强的一个。
07:03
共同出现的一个线索。哎。它直接对给定的细胞相似度啊进行操作,以识别细胞之间的转入变异的主要值,哎,也就是他们主要程序的一个变化啊这哎再强调一遍,就是它原本的目的是来哎辅助分析这个细胞的一个亚群的。官方教程呢,我放在这儿了,大家可以简单看一下啊。就是这个地方哎。原本啊识别诶单细胞,但是现在呢,扩展到了空间,哎,像空间呢,它对于这个空间单细胞及数据啊,也是对于这个精度是有要求的。哎,可以定义这个相似度。
08:39
哎,不好意思啊,我们继续。哎,他在识别这个空间的hot spot的时候啊,刚才讲到了这个方法呢。对这个空间精度是有要求的,哎,一般它在用在这个s select这个上面比较好啊。给到的这个例子也是special,诶,Data也是s select seek s select这个数据有什么特点呢?
09:01
它的精度相比于相比于这个vim,哎是要高的,大概每个点还有不到2个细胞。哎,前面提到过,我们在结卷积的时候,如果采用这种接近单细胞肌,或者说哎,像斯莱的是一个这种最多两个细胞这样一个精度的时候啊。哎,推荐用RCTD这种节卷机方法进行一个哎分析。哎呀,解出来啊,每个点都有一个单细胞模式和双细胞模式,这样的话对空间数据进行一个定义。哎,同时呢,我们可以采用这种,哎,他提到的这个hot sport这个方法。哎,根据空间的一个网络,细胞网络,哎,这里面提到了一个空间的细胞网络,然后计算哎核心的一个程序,这个程序的网络是基于空间坐标的啊,计算出来的一个内容呢,就是基于空间坐标,会识别出一定的一个核心程序,这个程序呢,会随着空间位置的,哎,还会。
10:05
和这个空间位置有关。哎,然后呢,就会形成这样一个结果。哎,某些程序呢,都会在这种。哎,固定位置出现。哎,形成我们的所谓的hot spot.啊,接下来呢,它还有一些其他的数据啊,大家可以看看啊,可以看看,不过这个啊不是我们今天的重点啊,我们今天的重点更多的是要把它放到这个空间的一个层面。前面提到了我们这个hot spot呀,它根据这个图,哎,图形图神经啊,图的这样一个网络来识别这个具有哎。高度表达的一个基,呃基因模块对吧。大家要注意啊,这个基因模块还是停留在什么啊,基因层面。哎,停留在基因层面,也就是说我们识别到这个具有。哎,基因表达具有这个高度,这个模式化的这样一个基因,基因哎,被称为基因模块,它在这个单细胞层面和空间层面表征的是基因的一个特征。
11:12
2。随着这个认识的发展呢,慢慢的呀。把这个网络呀,和细胞类型给它放在一起了。那么形成这样一种细胞之间,诶共同诶。强的这种,这时候我表达就不是这个基因表达的高低了,而是细胞含量的多少。哎,这个时候如果很多种细胞,比如三四种细胞,他们能形成一个基因模块的话,哎,就会形成一个hot sport, 这样的话,类似于之前提到的那个昵称那种方法,只不过这种方法在分析这个hot sport, 呃,在分析这个细胞类型的hotport方面,诶很有优势啊。哎,下面这张图也是一样的,哎,从这个基因模块的一个分析,慢慢的推导推导,推导到这个空间细胞类型的一个hotport的一个分析啊。
12:01
右边这张图呢,呃,右边这段话呢,简单的是一个总结啊。就是说hot sport的过程,哎,三个圆柱是可视化,一个就是诶单细胞级的数据,第二个呢,就是空间坐标,第三个呢,推断的一个graph就是鬼,就是他们的一个。相似性矩阵,通过相似性矩阵呢,分出来很多一个相似性模块,哎,这个模块呢,就会从单细胞角度来讲,就是为了识别。细胞牙区,尤其是组织细胞的牙区。哎,从空间角度来讲,就是为了识别细胞的一个哎,相同细胞类型组成的一个哎核心区域。哎,这就是他的一个分析的一个基础的一个理论啊。哎,这是houseport的简单的一个,哎,过程的一个总结啊,总结首先呢,我们要选择这个不同的一个图表进行一个基因模块分析啊,对于我们空间来讲。
13:01
对于我们空间来讲,哎,我们就要我们定义相似细胞,细胞的一个相似性啊,不能基于单细胞那种KN网络。而是基于它的一个空间坐标2D或者3D啊,基于这样一个坐标,哎来分析hot sport, 哎本质上如果我们基于基因层面,哎是识别一些一堆。空间协同变化的基因,哎,这是基因层面啊,空间协同变化的基因,那么对于细胞层面,就是共同存在的一些细胞的一个集合。哎,这些点被称为hold sport的点。啊,对于线性模型的话,基本上就是说。哎呀,和和轨迹发育有关,就是我们单细胞拿到了这个细胞发育的一个曲线。哎,对发育的曲线呢,同一种细胞类型,比如T细胞,慢慢的发挥成哎效应T细胞。整个的过程过程中啊,对吧,他经历了各个阶段。那么这个各个阶段通过这种hot sport这种方法寻找这个基因模块。
14:05
哎,寻找这个原因模块就可以知道他在发育的过程中经历了哪些程序的转变。唉呀,就和这张右边这张哎热图一样,如果说模块1是起始点,模块6是终止点。哎,我们就可以知道他在发育的过程中。转入的一个程序,就是基因的程序,到底在经历一些,哎,怎样的一种改变。然后我就问为什么肝癌的那个。然后这个hot可以被识别成这个。还able patterns啊,我进行一个express,哎,就是刚才提到那个模块的一个变化啊。然后是。Transcriptional啊,这个结果呢,是维度下降的一个程序。可以被用在哎,创建这个相似性矩阵。通过这个模块呢,哎,Hot sport可以识别为G因模块,Very local correlation就是相关性高的一个基因啊,哎,形成了一个基因模块。
15:06
从我们分析的角度来看啊,单细胞通常使用的哎和空间通常使用的就是哎空间这个模式。只不过这个模式啊,我们在输入这个。哎,Graph的时候。单细胞用kn graph来空间,就用空间坐标形成的这样一个模式,哎把它给哎把它分析出来,形成我们的这个基因模块。哎,经营模块投到我们空间上看,就是下面这种这种情况。每个经营模块呢,跟随它的空间坐标会产生一些,哎,固定的一个位置。哎,这些模块呢,就表达了一些固定的特征。这就是哎,这个软件最原始,也是最开始的一个内容啊。那么这个方法分析方法有没有高分文章引用呢?哎,是有的啊是有的。哎,简单的我们再看一下这个空间经营模块呢,哎。
16:04
大家可以看啊,空间基因模块以及诶summary就是总结每个8扣的。嗯,模块分数进行可视化。在模块得分的每个图像具有最高空间字相关的基因表达可视化以进行比较。这里面最重要的就是这个。哎,就是这个。基因与空间字相关。可能在空间的层面啊,很多时候我们会分析那个空间高变机对吧。哎,空间高变基因呢,会找到一些很多的基因和空间相关,但是并没有把它进行模块化。哎,Hot sport在这个空间多变基因的基础上,哎,进行了这个模块化的一个分析,用的这个图表就是空间坐标。进行文化化分析之后啊。哎,就开始对空间的位不同的位置和它的区域的一个基因表达特征进行一个比较。
17:01
哎,右边这张图呢,就是每个经营模块展现的一个状态啊,展现的一个状态。哎,这个模块,哎,分布状态,包括模块内的一些关键基因的一个表达的一个情况。哎,这就是hotport。呃,关于hotport的应用呢,在单细胞层面有一些诶高分文章在应用像这个层面。哎呀,像这个这个文章。他在接,他在分析这个细胞亚群的时候啊,就用到了这个,就用到了这个hotport。其中呢,Hot sport刚才提到了,哎,有用人来识别这个细胞的这个亚群的,就像这个地方一样。哎,我分析了亚群之后,分析了3个亚群对吧?哎,每个亚群如果说它是组织细胞的话,纯纯依赖这个马克定义。哎,也是非常难的。这个时候呢,我们就需要借助一些其他的力量。哎,比如说我们识别这个正常的上皮细胞。识别正常的上皮细胞分了3类。基因功能上肯定是有差异的,但是marker已经不,哎marker定义已经很难起到作用,这个时候呢,就借助hot spot的方法进行基因程序,哎,就是这一里的模块的一个分析,哎,对他每个群啊的模块进行一个分析之后。
18:14
来表征。哎,每个群他在基因表达上到底有哪些一个异同?你像这个地方,哎,分析了三个模块之后,在每个群里面,对于每个模块的表达,哎,都有一些或多或少的差异。比如说这是上皮细胞分了三个群,它在基因模块层面哎,Model层面哎,就会相关性上就会存在一定的差异。这样的话,从这个生物学的角度,就是转入程序的一个角度,哎,帮助我们识,帮助我们来识别细胞亚群的一个变化。哎,下面下面这个呢,就是对它一个简单的一个解释啊,其实就是为了帮助我们来识别细胞亚群之间它的生物学功能的变化。其中呢,有的时候啊,会更加延伸一步。
19:00
延伸到哪儿呢?就是Hot sport呀,有的时候比如说大家分析这个肿瘤细胞CV的时候,哎,肿瘤细胞的时候,如果说单靠mark也是很难分析的啊,比如说肿瘤细胞分了5个群。哎,5个群,当然每个群有的群有清晰性高,有的群清晰性低,对吧。这样的话,如果纯靠马可定义是完全无法实现的。哎,这个时候呢,就有了这个CV分析嘛。通过CV分析来确定肿瘤细胞的内部一致性。而这篇文章呢,对于这个CV的一个矩阵啊。哎,也借助hotport的这个方法。哎,CNV矩阵哪来的,就是大家应付CNV那个分析得到的那个矩阵,我们在special CV里面讲过啊,那个CV矩阵通过hotport这样一种,哎基因模块类似的一个分析呢,也会得到,哎肿瘤细胞的亚克隆。哎,这个它在这个基呃方法的基础之上呢,进行了一个延伸啊,进行了一个延伸。
20:06
哎,每一个这个哎,每一个这个哎,平行的8啊,代表了一个染色体,哎呀,并且它们密度和颜色代表了这个CV事件,也就是说它在这个SCN矩阵上套用了这个hot细胞的方法,这个是在单细胞的应用啊,这篇文章呢,大家可以看一下,发表在20222022年啊。这是hot的最。哎。比较经典的用法。哎,那么来到我们空间上呢。哎,空间上就又和单细胞层面不太一样了。哎,我们都知道我们的空间啊,细胞的坐标是固定的。对吧,无论是高低精度低精度,拿到这种空间注释的一个结果之后呢,细胞的坐标其实是已经固定的,哎,固定在空间,呃,空间上的固定位置上。这个时候我们的网络啊,通常不会来计算细胞之间的相似性的一个网络。
21:01
而是根据它坐标原始的一个坐标网络,哎,往下分析对吧,其中最常见的呀,比如说我们的癌细胞。癌细胞的空间组织呢?与微环境当然有千丝万缕的一个联系。但是大家都听说过我们的肿瘤啊,通常分为两类。啊,一类是热肿瘤,一类是冷肿瘤,对吧,冷肿瘤是冷肿瘤和热肿瘤,他们在这个转入程序表达以及微环境层面都有非常大的一个不同。对吧,那么在这种分析不同的时候啊,就需要分析得到它的一个。哎,微环境去分析它的微环境,那么在分析微环境的时候呢,哎,这个hot sport的定义就开始有些不同。哎,我们的这边呢,大家可以简单看一下。哎,我们某一个点如果定义成它的一个肿瘤细胞,哎,我们需要分析它周围6个点,当然这是以微为例啊,分析6个点的一个直接接触的一个port的一个特征,然后呢,去增加这个。
22:05
哎,Neighborhood就是说既要分析自身的程序,自身的表达,又要分析它微环境的一个表达。哎,两者信息进行结合之后呢,来判断出诶哪些是细胞的hot sport.以这个肿瘤细胞为例的话,就是说我们通过它自身程序的表达,哎,包括它周围环境的表达判断,哎,哪些肿瘤侵袭性高,侵袭性高的一个空间分布在哪,哎,侵袭性低的空间分布在哪等等等等,哎,从而划分出这个。肿瘤细胞的这个hot sport, 其中啊,关于细胞的一个score,就是打分。哎,主要来源于它的一个微环境,这个微环境啊,可以是基因特征,哎也可以是细胞含量,就是前面那节课讲,哎,上节课讲到的这个分子领域和细胞领域啊,就是说拿到这个细胞领域矩阵之后,哎要配合它自身表达的一个情况,以及他周围微环境的情况。
23:08
综合来判断这个肿瘤细胞侵袭性高还是低,如果我们分析侵袭性高的,哎,那么它的hotport周围有怎样的一个特征?比如说自身表达程序是什么样的,周围的环境又是什么样的,这些呃,这些综合的作用啊,这些综合的一个层面作用,促进它形成了这样一个清晰性高的一个hot spot.哎,最后呢,把它进行一个归属,形成类似于基因模块的一个细胞模块啊。请问hotport和special Python有什么区别呢?还是说special勾面机有什么,还是和?还有和special高电机有什么区别?Special pattern的话,哎呀这个分析很少啊,Special pattern应该基于那种类似于基于那种NMF找的那个基因模块吧,对吧。
24:02
但是hot sport会更进一步啊,前面提到了,Hot sport在找基因模块的同时,也在找细胞模块啊。空间高变基因,哎,空间高变基因是大家拿到这个空那个公司标准版结果里面常用的一个分析。但是那个空间高变性啊,只会告诉你哪个基因空间高变性强。并不会在对它进行一个模块化分析,哎,所以我们需要在空间高面积的基础上进行更进一步的模块化分析啊。当然这里面还是在。哎,成都的还是在这个。基因,呃,就是基因的层面。哎,对于我们空间来讲,更多的要综合到细胞的层面啊。哎,这个就是简单的一个流程化示意图了啊,拿到我们的空间,哎,微任务数据。选择区域,哎,这个区域呢,哎如是聚类也可以是这个聚类也可以是这个人为划区也可以,哎划分这个肿瘤,像这个呢,就是典型的划分这个肿瘤区域啊。
25:13
不用。哎,划分的这个肿瘤区,然后呢,进行hotport的识别,就是刚才上面这个方法。既考虑本身的程序,也要考虑周围环境表达的一个情况。哎,从而识别这个hot sport, 形成这个热肿瘤冷肿瘤这样一种现象。然后呢,进行更多的一个文集,包括这个neighbor负极啊,呃,South passs啊,就是说它的一个哎微环境啊,哎,包括这个敏感性啊。包括基因相关性模块啊等等等等,哎,接下来会有一堆,哎,非常这个个性化的分析啊。哎,衡量各情况分析。哎,那么对于我们从细胞层面来分析这个hotsport呀,哎,这里面做了一个简单的定义啊,当然这个定义是我自己下的,不见得具有这个广泛性,哎,但是这个意识已经表达到了。
26:04
就是说我们找这个hot sport呀,就是特定细胞。哎,密集居住或者自定义基因及特征的一个区域。哎,注意这个地方涉及到了两个层面,一个是特定细胞密集居住。对,也就是说热肿瘤的话。呃,以最常见的热肿瘤是什么?热肿瘤就是哎,肿瘤细胞,成纤维细胞和巨噬细胞这三种细胞密集居住的一个区域,哎,从而促进了肿瘤细胞具有很高的侵袭性,那么他们密集居住的区域我们定义为这个hot spot.或者由自定义基因集,哎,标记的一个区域热点,这个自定义基因集啊。在前面讲这个单细胞这个hotport的时候啊,它会自它会自己分析出来一个基因基,形成一个固定的模块。对吧,但是我们在很多时候分析啊,有一有一些基因级是固定的。比如说这个EMT。
27:01
比如说这个缺氧,再比如说哎血管生成这些基因集啊,是公认的,是大家,哎公认的这样一种基因集,哎具有特定的生物学功能,那么这些特定基因集,哎所在的一个区域。包括它周围环境表达的一个特征呢,哎,也会成为我们的一个热点,叫hot sport.啊,这是两个层面。让我记一下。但其实刚才我耳机。哎,至于下面说细胞类型或者基因特征耗尽的区域,其实也是一样的道理啊,都是从两个层面来描述我们的这个hot sport和cold sport啊。然后统计哎这些区域和其他预定的哎hot sport或者hot sport的接近程度,这就是前面提到的一个neighbor分析。就是hot它。哎,定义完之后呢,首先要进行一个。哎,首先要进行一个哎附这个领域分析,就是周围的环境有哪些细胞类型,或者基因表达的一个程,哎,一个情况分析到这个,哎热点程序呢,就会分析哎热点的一个距离分析,对吧,最近的距离,或者其他的一些简单的包括基因相关性表达的一些分析啊。
28:22
哎,此外使用热点方法啊,就是刚才的hot spot方法检测到的空间关系,哎,与仅观察到的单个点的临近区域内观察到的空间关系进行了比较。哎,评估这些变量之间的关系变化啊,其实还是在这个hotport的基础之上啊。来评估,哎,整体的一个分布的一个特点。比如说这个地方,哎,如果识别它俩都是hot sport, 对吧,那hot sport之间呢,它也会有一定的差异,他们之间的微环境呢,必然也是有差异的,那么他们这样一个聚集的方式,哎体现了怎样的一个一致性?这也是下游分析的一个特点,比如说这地方,比如这两个都是肿瘤细胞,对吧,以它的为例,都是肿瘤细胞,但是肿瘤细胞它们的一个特征是不一样的。
29:09
比如这两个特征是红色对吧,哎,这个特征就是绿色。说明它诶是冷肿瘤和热肿瘤的一个区别。那么这两种肿瘤的一个区别呢?一方面是自身程序有哎表达上有一些变化,另一方面就是环境的变化,他们在呃和一些细胞的距离保持呃距离关系上,和这个基因这个特征上,就是环微环境的基因特征上啊,都有一些差异啊,这些差异有助于我们认识肿瘤的一个形成,发展和发育,以及他们抑制性的一个变化啊。哎,当然了,随着这个哎方法的演进呢,Hotport有时候不止指大小周围的一个sport的变化,哎,有的时候还会有细胞通路有关啊。哎,这个就是hot sport常见的一些分析啊,我都列在这里了。
30:02
呃,淋域分析呢,这个前面已经讲过了啊,用于在检查单个空间转录组学细胞的及其临近状态的细胞状态,细胞类型或。哎,过程中的相关性啊。领域分析呢,哎,上节课讲过啊,当然再强调一遍,就是领域矩阵啊,无论是分子领域矩阵还是细胞领域矩阵,哎,不要过度解读啊,只计算差异分析即可啊。对于我们的hot sport呢,就是要揭示统计意义上的这个hot sport, 或者叫code sport.Hot sport就代表了刚才提到了,呃,细胞类型或者基因特征高度集中的区域。哎,这个区域呢,它们待在一起,比如说像肿瘤细胞呈纤维巨噬,三者待在一起,形成了这种高侵蚀侵袭性的一个区域。哎,就叫hot sport, 或者说高度特基因特征高度集中的区域,哎,就是基因层面来分析这个hot sport.表明这种聚集啊,不太可能是偶然的。
31:04
哎,相反,冷肿瘤表示了这个目标区域,哎,目标细胞或特征稀少的区域,哎也超出了随机分布的预期,哎,冷肿瘤呢,其实是哎热肿瘤的一个反面,哎,反面当然只有在定义肿瘤细胞的时候啊,才会呈现这种热肿瘤冷肿瘤这样一个hot sport和cold sport.啊,对于我们常见的一种hot spot分析,一般只分析它的一个热点,热点区域啊,然后就是距离度量了,这种距离度量呢。哎,目前还没有讲到,等到我们讲空间轨迹的课程的时候啊,我给大家详细的讲这个空间轨迹是如何度量细胞之间的距离,距离关系。最后一个呢,是敏感性分析。哎,敏感性分析呢,其实和这个。哎,淋浴和。哎,淋浴和这个感兴趣的port的这个区域有关啊。
32:02
这里面呢,简单的介绍了这个敏感分析的一个,哎,基础的一个内容啊,就是通过改变领域或感兴趣的sport的区域大小,系统的评估细胞,细胞关系之间如何在组织内进化的能力。这个地方啊,有一个大家要注意。改变领域或感兴趣的hot spot的区域大小,注意。这个改变领域是什么意思呢?就是相同的肿瘤细胞,比如都是肿瘤细胞,但是领域不一样的区域,两者进行之间进行一个比较,对它的微环境进行一个比较。哎,来判断它的一个敏感性是否高低。啊。当然了,今天的分析是要基于上节课的矩阵的啊,上节课矩阵拿不到,这节课也分析不了啊,然后是感兴趣的hot sport的区域大小,比如说这些hot sport啊,有一些hot sport呢,是我们分析出来的,具有。显著的,哎,统计意义上显著的好的port的区域,对这些区域呢,对它的微环境进行一个。
33:02
呃,区域的一个判,呃区域的划分,划分之后呢,来评估细胞,细胞之间的关系。哎,这些关系是越来越好还是越来越差,这样一种能力是具有屏障作用,还是具有这个侵袭能力?等等等等啊。哎,01负极也可以通过改变中心点,这个哎已经讲过了啊。在讲这个供定位的时候呢,讲过,哎,我们要考虑周围6个点,要考虑更远的位置等等等等啊。哎,这个就是简单的示意图了啊,这个就是简单的示意图了。从基因层面来讲,哎,从基因层面来讲,我们如果想探索这个肿瘤基转的细胞环境。哎,种类细胞环境核心指标这里列了2个,就是血氧和血管生成。那么这样两种这个指标呢,就可以判断出肿瘤进展,诶,它的一个情况初步判断啊,当然还有一些其他的基因特征,哎,第二个呢,就要了解这种关系在组织内是如何在空间上进行发展的。
34:05
哎,这个就和这个刚才提到的这个hot sport识别有关了啊。诶和它的微环境有关了啊,然后呢,我们进行这个hot sport识别,注意这个hot spot识别,这里面列举了EMT,这是一个基因级的hot spot.也就是说em MT啊em MT如果大家了解的话,它主要是哎,促制肿瘤发生发展的一种,哎,这个微环境,哎,通过识别这种肿瘤发生发展的微环境的这个hotport呢,哎。识别出Li了hot细胞之后,就要分析它的空间基因特征,无论是细胞的特征还是基因的特征呢,哎,主要是体现他们之间,哎以肿瘤来说,就是冷肿瘤和热肿瘤的一个差异性嘛。主要是他们微环境的差异。哎,右边这张数字图大家可以看一下。当我们识别了这个EMT,诶,Hot sport的呃内容之后呢。
35:02
哎,同时也要分析和其他细胞之间的一个距离关系。你像这里面他分析完之后,哎。分析完之后。那你和T细胞的度量是2是吧,和B细胞的度量是2对吧,都是一样的一个距离。哎,通过这种哎hot sport和其他细胞距离度量的一个分析呢,来诶,进一步判断它微环境随着距离的一个变化,距离的一个变化性。啊,右边这张图呢,也是一样的道理,这里面大家可以看到是看到什么呢?它的一个相互作用啊,其实是相互的。大家有没有发现?免疫细胞和这个ET hot sport, 它的作用是相互的。哎,就是说T细胞在,呃。攻击这个肿瘤细胞。哎,肿瘤细胞呢,呃,固体肿瘤细胞这个hot spot, 哎,这个肿瘤细胞所在的区域呢,也在改造免疫细胞。
36:00
从而产生。这种。是吗?哎,从而产生这种哎,相互协同的一个作用。哎,有的时候呢,肿瘤细胞产生免疫逃逸,就是在改造T细胞,使它无法识别或者说改造自身。改变自己的表达程序,哎,使它无法识别这个地方呢,就会存在这个local relationship的Miss,就是局部的一个哎,空间关系的一个,哎,消失啊。哎,这里面就体现了局部的空间那个消失,从这个哎进一步发展来看。哎,进一步发展来看,哎,随着他们的之间的一个哎发生和发展。和其他细胞类型的距离啊,就开始发生变化啊,侵袭性越高,说明它免疫逃逸的能力越强诶。和其他细胞类型的距离啊,就会越远。哎,这个就是hot sport, 它的一个简单的一个分析啊,用于在肿瘤层面。
37:10
上面那个标题是啥意思?其实它是一种分,其实它是一种生物学的一个介绍啊。哎,生物学的一个介绍。为啥都说了,又没有那么多箭头呢,其实它是这个,哎这个地方呢,就是说哎箭头的多少代表了local relationship.明白吧,这是一种哎关系的最短的距离,From every spot in hot spot of interest, 就是说它这个和其他细胞的一个空间距离关系。
38:01
箭头越多,哎,说明它的这个,呃,互助越强。哎,区域之间的互助越强,哎,箭头越少呢,说明互助越差。不做夜场,像这个地方呢?等一下啊。哎,像这个地方呢,我们分析得到的这个hot sport对吧,它的一个核心区域。T细胞的一个hot细胞的一个核心区域,包括B细胞的hot细胞的一个核心区域,对吧。分析得到他们各自的核心区域之后呢,哎,就开始研究他们的空间关系。中心力嘛,这个单词哪个单词。哪个单词。哎,分析得到这些,哎,每个区域的一个好,呃,核心区域之后呢,就开始研究他们之间的一个关系。哎,研究空间关系的时候啊,采用这种最短的一个PA,哎,最短的距离对于每个sport。
39:05
在hot spot of interest, 就是说对于研究这个hot spot和其他细胞类型最短的一个距离的一个关系,这种距离关系不是大家理解的那个空间距离,而是他们互助的一个强度啊。互助越强,说明他们之间的交流越多。哎,对环境的塑造啊等等方面起到重要的作用。哎,互作越短的话,那说明就没有什么效果了啊。哎,下面这张图呢,其实也是一个简单的道理,哎,对于我们一般体细胞呢,哎,判断它们之间和其他核心细胞的一个距离关系,这个地方,哎,就是他们核心的一个区域叫治息,哎,这个地方也是治息啊,一样的啊,治新。通过这种距离关系的判定呢?来判断它们之间的一个空间特征。好空间特征。哎,这个地方呢,就是简单的一个内容了啊,简单的一个内容了,我们得到这个肿瘤细胞的分布,哎,再得到显著性的这个EMT的hallmark的一个,那么em MT, 其实这个基因基啊,基因基。
40:12
三层啊,志新啊,自新就是核心区域啊。核心区域就是它的一个一个智心嘛,啊,当然智心是物理学概念,我们就理解它为核心区域就可以了啊。哎,通过肿瘤细胞的一个分析呢,哎,分析它EMT hallmark这个基因级的一个hot sport.哎,拿到这个hotport分离至右边这个,注意这个hotport是有统计学显著性的啊,统计是显著性的。然后呢?哎,分析这个细胞类型的hot sport, 哎,前面提到了细胞类型的hot sport, 哎,也是一样的啊,基因级的hot sport和细胞类型的hot sport, 哎,两者结合之后呢,就会发现,诶EMT的hot sport和这个。MYCF的household,哎,存在很强的一个供定位关系。
41:01
哎,存在很强的供电外关系,说明啊,在空间层面肿瘤具有侵袭性和这种细胞。强关联。这个呃,EMT这个hot sport意味着这些区,这些区域啊。这些区域内的,哎,肿瘤细胞呢,具有侵袭性。细胞类型的hot sport, 分析完之后呢,就会发现这些侵袭性区域它的微环境中存主要是因为这个hotport的存在。像句式的hot sport分析完之后呢,反倒和这个具有侵蚀性的hotport。哎,它的固定关系不是很强,说明巨噬细胞并不起主要的一个作用,反而是这种哎,这种细胞类型,哎,固定会非常强,哎,它很可能在这个空间上就会起到主要的作用,促进肿瘤细胞的清洗啊,这是一个简单的例子,大家要会看啊,会看。哎,这里面做了一个简单的总结,就是这种细胞类型的hotportrout和EMT的hotportrout倾向于固定类。哎,这种宫廷危呢,就会触发肿瘤细胞转移。
42:03
啊,种类细胞转移,这个大家要理解啊,这里面强调一遍,就是hot sport有两种,一类是这个基因特征的hotport。一类是这个细胞类型的hotport。对于某些对于这个肿瘤研究啊,当然我们这个研究的比较多的,像这个肿瘤转移。哎,就通常会研究这个em MT, 这是一个最典型的例子,就是说如果肿瘤存在转移的话,它的EMT必然是表达高的嘛,对吧,那表达高的时候在空间上就有一些区域啊,它的清晰性很高。哎,清洗性很高的区域呢,它表达EMT特征就会,哎显著显著的高,这样的话,我对这个EMT这个基因级进行一个显著性分析。哎,就是说它对它进行hotport分析,就可以识别出诶哪些区域肿瘤的侵袭性比较高。像这些区域中流性侵袭性比较弱,那么我为了研究它为什么侵袭性高,最后去研究其他细胞类型的household,就是它细胞类型存在的一个热点区域,那么都通过这种热点区域呢?分析完之后呢,哎,同时要做一下固定位分析。
43:10
哎,发现这个EMT,这个hotport和这个这种细胞类型的hotport,它的供定位关系非常强。哎,也就是从从空间成本来讲,两者之间存在的一个。哎,生物学E,它们共同存在一个地方,必然会发生一定的化学反应啊,从而形成了这个肿瘤的侵袭性的一个提高。这是从这个,这是结合基因特征的hot sport与细胞类型的hot sport的一个内容啊,大家一定要。哎,一定要理解它,哎下面这张图呢,就是更简单的一个示意图了,你看分析得到的emd hot和code,哎,黄色就是冷肿瘤不转移,Hot sport, 哎,Hot呢就是热肿瘤要转移,哎同时呢,又分析出来这个这种细胞类型,它的一个hot sport.哎,这个区域呢。
44:01
就可以明显的感觉到,哎,明显的感觉到具有转移,转移性的这个肿瘤啊,具有转移性的这个肿瘤细胞啊,通常微环境中都有它。哎,功底非常强啊。哎,但是如果我们纯看肿瘤细胞,看它单一什么,单一一种细胞类型分布是看不出这个内容。明白吧,尤其是尤其是像这种大面积的看就更看不出来了,比如说我只看细胞的供定位。比如说这是肿瘤细胞对吧,这是句是这是这个m maf, 这还是分析了好多细胞的,如果只看肿瘤细胞,哎细胞类型的固定位现象来看,哎是很难分析得到这种具有侵袭性肿瘤的一个区域的。哎,必须记住这种hotport具有显著性的一个点,进行一个分析啊。当然了,这是一个典型的例子啊,典型的例子。
45:03
哎,下面这张图呢,也是一样的啊,对于基因特征或者sport,或者这个哎,细胞类型的hot sport这个分析。当然了,Hot sport, 哎,空间上也可以计算这个经营模块的一个热点区域,只不过大家啊,这里面要提醒大家一句,就是说单看一张图。哎,单看一张图可能没什么感觉对吧?哎,当我们把所有的哎空间图对它进行一个hot sport分析之后,啊,可以明显感觉到其中的区别。比如说这个样本,哎,CTRL样本和IPF样本,哎CTRL样本和IPF样样本对这个基因特征,哎,他自己自设了一个基因基因。哎,对这些基因呢,进行一个hot sport分析,可以明显的感觉出来CR和IPF哎之间存在一个很明显的一个差异,对吧,如果在划分好区域之后,这个差异就更明显了啊。
46:04
这就是对啊,这个基因特征在hotport上的一个谚语啊。感觉em MT很难说是真的em MT还是肿瘤混CF。这个是什么意思?感觉EMT很难说是真的em MT.还是肿瘤混CF em MT是基因特征对吧?Em MT是基因特征。哎,EP是基因特征,它是肿瘤侵袭的一种基因特征。那么对于他来讲,我们分析得到他这个hotport就是显著性的一个区域。哎,具有显著特异性的一个区域。那么它必然存在,他们这个区域必然说是一个,哎,肿瘤侵袭性区域,对吧。然后呢,我们再分析这个细胞的hot sport, 就是说细胞显著存在的一个区域。哎,那么他们之间的固定位必然会发生一些生物学反应,这个在这个。
47:03
当然他他用的这个例子很那个很经典,确实这种细胞类型确实促进了肿瘤转移,哎,这个是啊,已经得到共识了啊,文章发的时候呢,这个确实已经,呃呃,前面已经知道有这种共识了啊,不过在其他层面的应用啊,也可以说明这个现象。比如说这种哎,以基因级为特征的这个hotport,它确实在这个哎不同样本中存在明显的一个差异。哎,这种差异必然是疾病带来的。如果我们在分析,哎,划分好组织区域之后啊,必然也会得到这样一个。哎,划分好组织区域之后,必然也会得到这种hot sport分布的一个差异。哎,这就是我们现在的应用啊,我们现在一个应用,对于基因的模块的一个hotport这个应用。大家可以简单看一下。前面是基英的hot spot.对吧。
48:00
呃,下面就是这个细胞的好的sport了啊,比如这种这种细胞,这是成纤维啊,成纤维的hot sport它的一个分布特点。你像康也很少对吧,没什么好的,但是IPF就分布的比较密集了啊,比较的密集了。哎,这些图空间特征大家都简单的,可以看一看啊,看一看。哎,明显能感觉出来这种细胞类型,它的这个。Hot sport分布上啊,不同条件下是存在明显差异的,像这个图和这个图都明显能告诉告诉大家细胞类型的hot sport分布啊,随条件,随这个疾病条件的变化而变化啊,那这种细胞啊,它也是一种细胞。哎,分析之后呢,Log里面是没有这种很显著的hot spot.哎,但是在IPF就是疾病状态,哎,就有了显著的hotport啊,这种差异性的变化,呃,就是疾病带来的导致它整体的这个。哎,区域性啊有了变化。
49:02
哎,对于我们空间样本来说啊,有的时候大家把两个样本放在一起啊,就可以明显感觉到其中的一个差异啊,你像这种的对吧。康守恒IPF。啊,就能感觉到它明显的一个差异。哎,像这种的也是一样的啊。哎,明显的感觉出来。哎,稍等一分钟啊。哎,这篇文章呢,用的是华大的平台,哎,大家能明显感觉出来华大这个平台的一个内容吗?哎,这篇文章其实发表的时间不算,嗯,还哎,还比较新,哎,大家看他这个关于空间华大平台的一个分布。
50:03
有没有感觉到一些新的变化?哎,首先呢,你看大家这个区域属于规整的这种区域,和大家那个分病的一种状态差不多,类似于HD横平竖直的那种分法。哎,对于这种外园区呢,大家可以看一下。哎,反倒是借助这种图像识别的能力。哎,图像识别的能力,进行细胞划分,划分的更加精细了。啊,说明在这个华大的内部啊,有一些非常厉害的人。哎,它能够把这个华大平台啊,也依据这个细胞形态学进行分布,来构建整个的真实的细胞的分布状态。哎,这是华大内部的一个,不知道有没有开发出新的软件啊。那么在借助这个平台的时候啊,他也借助了这个hotport的一个分析,哎,分析得到这个经营模块,哎。这个记忆模块啊,本身这个软件可以自动化是聚类出一些模块,哎,像这里面啊,就识别出来13个模块。
51:00
哎,这个模块的一个分析呢。就体现了这个空间上的一个显著性分布的一个特点。哎,用这个华大数据分析了13个模块啊。好了,这就是这个hotport的一个简单的一个过程啊,简单的一个过程。嗯,简单回顾一下,就是说最开始呢,这个方法呢,主要是借助单细胞基因表达的一个数据。构建它们的相似性的KN网络。哎,由此来识别具有协同性的这个。呃,基因模块我们被称为这个hot spot, 但是随着这个方法的演进啊,他把这个空间的坐标,哎,空间的坐标这个纳入进来之后,用空间的坐标网络。诶,根据他们的距离远近识别这个经营模块。哎,具有相似相同模块的一个地方呢,被称为hot spot.这样的话,确定好这个hot spot之后呢,我们就可以往下做一些更加深入的分析,呃,比如说这个。
52:02
啊,比如说这个像这种,哎,不是这个。哎,像这种,哎。距离分析,哎,自行分析,包括进行特征分析等等等等啊,哎,其中呢,也不可避免的要分析这个领域分析。然后呢,这是最哎核心分析的一些内容啊,其中呢,领域分析已经讲过hotport的是我们今天分析的一个重点,还有距离度量,呃,距离度量是空间轨迹的内容啊,然后呢,这个是简单的一个流程啊,简单的一个分析过程。就是说从肿瘤的角度来看,我们想探索肿瘤的热肿瘤和冷肿瘤它们之间的一个差异。包括后面提到的一个具有侵袭性的肿瘤,它的一个hot sport, 到底是什么内容促进了它的一个肿瘤侵袭性?呃,既要分析肿瘤呃,基因特征的hot sport.也要分析它这个细胞类型的hotport的分布,然后结合共定位的一个分析特点,诶,判断出。哎,他们之间的一个协同关系。
53:03
哎,空间上展示对他们的热肿瘤人肿瘤包括它细胞类型好的细胞的一个分布特点。哎,帮助我们来认识这个肿瘤的发生。然后呢,就是一些简单的其他分析了,包括这种细胞类型好的胞的分析,哎,正常中哎是不存在的,哎,疾病中却存在了明显的一个分布差异。哎,这两种细胞类型都是这样一种状态,那还有一些细胞呢,可能在这个control里面是存在好的sport。但是在这个IPDF里面却消失了,哎,也是有可能的,这样的话,对细胞,哎排布的一些变化,包括它分布特征的一些变化,哎,进一步让我们认识肿瘤的,呃,疾病的一个发生。哎,包括我们这个空间,华大平台借助的这个。呃,高精度的一个内容呢,也借用,也应运用了这个hot sport的一个分析呢,分析特定区域的一个。哎,模块经营模块啊。
54:01
简单回顾一下就是这样啊,大家用的时候呢,可能会要注意一些小的细节啊。我们休息5分钟吧,休息5分钟,来看看代码部分啊,休息5分钟。大家有什么问题可以问啊,可以问啊,现在刚安静下来。
55:11
再说导致的原因,什么导致的原因?
56:40
你主要想做这个图是吧。这个图的这个单词是自新的意思。哎,这是物理概念啊,当然我们就把它理解为区域核心对吧。当我们识别到这个em met, 这种hotport,对吧,Hot sport.它的一个置心的距离呢是2。
57:00
对吧,自内心的距离是2。但是呢,有一些区域呢,哎,这是从这个整体的概念来判断啊,自心到自心,哎距离的概念,但是如果我们分析每个细胞,哎,就是把他们的细胞每一个都来对这个距离啊,最近比如说这个细胞。对他最近的T细胞距离,每个细胞对它最近的巨细胞距离进行综合分析之后呢?哎,发现它的距离,哎呀。是2,哎,对B细胞的综合距离呢是3。明白吧?是这样一种说法啊。这个地方是质心,也就是说质心,比如T细胞的质心在这儿。B细胞在这儿,哎,他们距离这个EMT的执行就是hot sport执行距离是一样的。哎,但是有的细胞呢,但是我们从单个细胞的角度来看。哎,它的细胞距离呢,你像这个地方有有的地方和T细胞就挨着是吧。说明距离很短。呃,当然离得远的,像这种离得T细胞比较远的细胞也是有,对吧,那么综合来看呢,对T细胞的距离是2,那么对于B细胞来讲,直接直观的看就隔开了。
58:09
对吧?哎,即使是离得最近的这个细胞也是有一定距离的,那么通过这种最近,呃,最近的距离这个分析呢,判断出它的距离是3,也就是说它和T细胞距离更近一点啊。哎,这就是为什么前面提到的有这个分析啊,自行分析也要啊,自信分析也要分析这个最近特最近哎,最近距离的一个特征啊。质心分析呢,当然是从整体上看。哎,距离的一个,哎,大体呃,就是整体的一个距离,但是有的时候呢,我们要分析这种领域,哎领域的时候就是I,呃,最近的一个距离。哎,他们距离的一个判断,从这里面也能看清看出来啊。细胞内部确实存在着很多的一个抑制性啊,如果我们从整体的一个细胞层面来看,可能会忽略掉很多的一个细节部分。
59:10
哎,这个就是hot sport一个分析啊,哎,这里面,哎,再多说一句,就是hot sport, 既有基因特征的hot sport, 也有细胞类型的hot sport啊,这个和大家的一个分析有关,通常来讲是要两个综合来看的啊。当然了,单细胞分析hot胞的大家也不要丢了啊,大家也不要丢了诶,在分析这个组织细胞的亚群的时候,比如说组织细胞分了3个亚群啊,用mark定义很难定义的时候,借助hot sport的定义,就是模块的这种定义。哎,这种定义。哎,也可以收到很好的效果啊。比如一个port里面8个肿瘤,2个CF,看起来会会像ET。呃,这种能分出来吗?
60:02
一个port里面有8个,你的意思就是说一个port里面混合有肿瘤和CF对吧。这种就算清晰性高了吧,已经得了一个,已经是得到公认了,不过这种特征啊。这种能分出来吗?这个难道没有翻译出来吗?这种EMT高的呀。肯定是含有肿瘤细胞的,对吧。那么它和这个细胞的hot sport存在固定位,必然是存在这样一个共存的一样hot sport才对。这个地方主要是告诉大家呃,来判断这种清晰性高的区域。哎,还是那句话,如果我们以整体来看,比如这都是肿瘤区域,对吧?都是肿瘤区对不对。他们和无论和句式啊,还和这个MF其实都存在共定位的。因为巨式也在这个肿瘤所在的范围之内。对吧。哎,但是通过这种hotport,就是说通过这种。
61:00
哎,刚才提到的那种,哎,好子port的分析之后呢,就会哎提出来,当然这个好子port呢,它是基于基因级的,具有转移性,呃,具有清袭性的基因级来分析的时候。分析得到的这个hot spot, 哎,它就是转移,就是具有侵袭性的一个区域。哎,热点区域对吧,哎,这个时候呢,我们需要对这个热点区域的一个细胞类型,它的宫定位现象进行一个分析。哎,这个时候呢,无论是基因集还是细胞类型,我们都是要基于hot sport的分析之上,哎,来判断它的。哎,这个时候呢,就会发现诶这种的EMT houseport和这种细胞类型的houseportt,它存在公定微现象。哎,它是清晰的一个触发器。没em MT的肿瘤和间质混在一个sport里面,会看起来会像EMT的肿瘤。没有EMT的,呃,肿瘤和间质混在一个细胞里面,其实这个还是一样的道理啊,就是说肿瘤细胞和间质细胞的,呃,如果说在一个细胞里面,它像这个em m, 呃,Em MT的话,那我们在分析的过程中啊,就会发现,比如说这是em MT的hotport对吧。
62:13
啊,那这个地方呢,如果我们分析得到间质细胞的hot sport和这个EMT so hot sport它也是具有很强的固定位的。哎,举个啊,我以你的这个话题接着往下就是说EMT的sport。和间质细胞的一个hotsport。它如果也存在很强的功能类。哎,那么这个间质细胞在促进肿瘤转移方面也是有这个生物学作用。啊,这个要结合我们的分析结果来看。哎,当然了,接下来还有一些基因级的好的细胞的分析啊,还有细胞类型,好的细胞分析是一样的啊。哎,就是大家呃,既要学会单一的就是基因级的hotport分析,像这种EMT的也要学会这种细胞类型的hotport分析啊。
63:08
好了,接下来我们来看看代码部分啊,代码部分。找个新的节点啊。找一个新的节点。26吧。这个代码相对来讲就比较复杂了,比我们之前的要复杂的多了,所需要加载的内容啊也比较多了啊,当然如果大家只看这个官网的,这个是比较简单的。
64:08
哎,是比较简单的,它只针对这个基因特征的一个基因model的这样一个分析。那么这个分析起来就相对容易一点了。哎,我只需要输入它的一个空间坐标,包括这个表达信息之后啊。哎,包括呃加载一些呃可视化软件。啊,包括它的一个分析的一个拍摄模块。哎,简单做一些分析就可以了,他在分析的时候啊,有一些自动化的函数,比如说像这种。自动化的函数对它的一个差异性进行显,呃,显著性啊,就是进行一个分析,分析得到的一个显著性的模块,以及它的一个空间分布特点。这个是单细胞的啊。哎,空间的分布特点。哎,官方教程是相对比较简单的啊,但是我们真正分析的时候可能会复杂一点啊。比如说他创建了这个。
65:00
哎,Group基因into special models哎,就是把基因依据空间坐标进行一个模块的分析啊,很简单,两行代码就搞定了。哎,接下来呢,每个模块它的一个空间分布特点得到就可以了,对吧,但是我们在真正分析的时候啊,可能要。哎,可能要有一个比较麻烦的一个东西了啊。哎,我们先把我们该需要的都加载的,加载的非常多啊,非常多。我们都加载上啊。Frequency啊。Some color.啊,这些都是需要加载的啊,还要加载这个cell to location, 加载cell to location的原因在于什么呢?哎,之前的分析啊,就是计算机分析是基于C图location,这里面如果想分析细胞类型的好port就需要对C图location的结果进行一个。哎,分析了啊。
66:02
接下来我们读我们的。数据,这个数据哪来的呢?就是第7节课给大家讲的那个数据啊。第7节课讲的那个数据,就是那四个样本LEVEL1234,就是肝癌的LEVEL1234,对它进行一个分析啊,其中呢,基础分析我们就不多啊,不多介绍了,很多那个分析呢,已经做过了,你像这个里面都有些什么呢?哎,Sample, 哎4个样本,4个肝癌样本,哎later呢,就是聚类的结果,哎聚类的结果啊,还有一些其他的,比如说这个我。点我。哎,高变是不是高变基因。哎,平均值分布分布的normalizationation啊平均值。STDSTD, 这是这个方差。还有标准差啊这一类的。然后呢,加载我们的hot spot这个大家装上就可以了啊。
67:04
我们的分析啊,都是基于这个空间坐标来分析的。哎,我们的数据呢,都是基于有个示例数据,能把代码跑通。实例数据啊,实例数据有的时候是不能给大家的,因为我的数理数据很多是客户来源吧。颜色还可以。这里面定义了一个函数啊,这个函数其实在原,其实在那个。哎,官方代码里面是没有的啊,是没有的。其实每次给大家讲课的时候啊。大家要注意这个数据的特点,每次我都会给大家讲这个数据的一个基础特点。大家一定要注意这个,呃,数据特点的一个能力,然后该有的内容大家有就可以了,你像这个数据呢。啊,这个数据其实大家标准分析完就有啊,就我那个第7课那个脚本,大家标准分析完自动就有了。
68:07
明白吧,就是说第7个单多样本,这个整多样本进行一个整合之后呢,哎,自动就会有这样一个自动分析出来,就是这样一个数据格式。啊,大家拿到自己的空间数据可以分析一下。哎,然后继续加载,大家看加载了很多啊,真的非常多。真的非常多,哎呀,这个脚本研发的时候其实费了很长时间。接下来呢,就要进行诶hot sport分析了啊hot sport分析。这个分析啊,就开始有一定的差异性了,哎,有的是基因,基因有的是什么细胞类型对吧。那这个时候呢,我们在分析的时候啊,就要有一定的选择性了。怎么选择性?第一个,如果我们针对细胞进行hot sport.那么用的矩阵是哪个呢?哎,用的是结转机的矩阵,或者像高精度平台那个细胞类型坐标矩阵。
69:04
明白吧,如果是。细胞,呃,如果是基因级的一个hotport分析呢,哎,我们就要借助这个空间的一个基因,做空间的这个基因B口的这个矩阵进行了一个hot时报的分析,啊,两者就开始有了一定的。嗯,分呃两组就开始分开了,像这里面演示的呢,是基因的一个hotport,当然基因基啊。这个基因级。很多是固定的,就像课上,哎,刚才讲到的这个EMT基因基。哎,它是一些固定的基因,哎,基因的一个内容,包括这个缺氧啊,包括这个。呃,血管生成啊等等等等都和肿瘤相关的一些基因集,把它放进来就可以啊,放进来就可以。接下来呢,就开始计算了。计算呢也是一样,这个函数,这个函数借鉴呢,就是hot sport的一个。啊,软件的一个函数这里面啊。有一些常见的一个内容需要大家注意了。
70:01
首先第一个哎,指定基因基,第二个neighbors写多少呢。如果单细胞的话,通常是写30。单细胞啊,注意单细胞,那么对于我们空间来讲就开始又有差异了。又有差异了啊,如果我们用的是wisdom。哎,用的是V字母。大家看。为什么?拥挤。用6啊用6。这个图已经告诉大家了,哎,周围6个点,这个时候这个值就不能写30了,而是写6。那个是如果像那种高精度平台呢,写多少。哎,写10啊写10。或者20啊都可以,这个地方我们是微字模就用6。I factor, 呃,3这个参数不要改啊,金symbol=none啊。这个地方就是设置这个,哎,我们用哪个图表。
71:03
对于我们空间来讲就是呃,Special.哎,对于我们空间来讲就是special啊,就是空间的一个坐标,作为它的一个。嗯。歌手就是那个网络的一个输入啊。然后我们来计算啊。哎,这个地方大家要注意了啊,各种平台就开始有差异了啊,各种平台就开始有差异了,哎,大家,呃,反正前面的课也多次强调过,关于哎领域的一个分析内容,大家一定要注意啊,一定要注意。啊,因为大家分析完之后啊,数据格式都是差不多的,包括Python版本数据格式也是一样的,拿到的也是这个类似于这个你看啊。哎,类似于这种的buck扣的是不是在组织,包括它的坐标样本啊,聚类之后有雷的没有,没有雷在我们这个分析中是不重要的,前几列信息啊,无论哪种空,呃,空间平台都是一样的。
72:03
明白吧,哪种无论哪种空间平台都是一样的,那么在分析这个呃,Hotport的时候呢,在指定这个邻居数量的时候呢,就会有一些些许的不同啊。通常我们都是空间的这种hot spot就是6了。当然有的时候我们分析单细胞,单细胞那种kn graph那种输入的话就是30。明白吧?就是3尺。呃,第二个注意的删除就是这个u rap, 这个用哪个领域举,呃用哪个这个举,呃这个连连接性进行一个输入,大家可以看一下空间呢,其实也有很多的一个不同。哎,比如说这个,我当然大家用special就可以了。啊,也有一些其他的,比如说harmony连接。哎,U map连接u map就是我们降为后那个二维坐标作为连接。哎,那种是不是也可以呢?在单细胞上是可以用的啊,还有PCA连接。对吧,这种联系方式呢,就哎比较的那个。
73:02
哎,比较的偏向单细胞的分析啊,我们空间就讲空间。就可以了。哎,然后接下来呢,就是一个SCO,呃,计算出来的Co。哎,这个靠,就包含了一个核心热点的一个问题啊,像负的这种。呃,相相对比较低,高的就会高一点啊。分析得到这个内容呢,接下来干嘛,可视化就可以了啊。哎,上一步没跑啊,这一步没跑啊,这一步跑一下啊。把这个分数付给到我们的对象里面。然后呢?画图。
74:00
嗯,保存出我们的结果就可以了啊。保存住我们的结果就可以了。哎,这就是我们画到的基因的一个hot spot.哎,基因的hot spot, 对它进行一个hot spot的一个识别啊。像那种比较红点,他这个卡拉巴,你看大家看见没。当大家多样本分析的时候,卡拉巴是一致的。也就是说这个时候在判断这个hotsport的时候,大家在处于一个同样一个水平线啊,这里拿一个经济作为演示,大家可以明显感觉到,其实把这个多样的混合到1啊,还是有差异的啊。不过这个基因集啊,我是随便选的啊,没什么规律性,为了演示选了这么几个基因啊,很多时候啊,这个基因要靠大家去那种专门的官方网站。专门的这个通路网站上把它选举出来。
75:01
啊,这个是基因的特征。如果我们想分析support这个特征是什么呢?还有分析细胞类型的胞怎么做呢?哎,这个地方就开始变化了。这个是什么?这是什么?哎,细胞类型。Neighbor是多少?诶和平台有关,和平台有关,自己选取就可以。哎,Fact不用管,哎,Factor一个参数直接设成这样就可以了,这个时候基因symbol就变成了我们的细胞类型了。啊,三四次就细胞类型了,当然这个也可以实时闹。这个时候的矩阵。干嘛?哎,就要有一个新的矩阵了。就是说这个地方的一个OBSM。这个时候就要有一个sal location的矩阵了。大家把那个节选期的结果,哎,附到这儿读进来,附在这个地方。就可以了啊就可以了,然后继续往下跑,就可以拿到细胞类型的一个hotport的一个分布。
76:05
啊,这个时候呢,就和刚才提到的那样,哎,我们的这个EMT通路的sport和那些基因的support,就是存在一个这样一个公定位的现象,从而呃,分析它们之间是否存在一定的生物协同作用。啊,这个分析的时候就更加精细化了,不能从这个整体来看,整体看的话。当然很多都是假阳性的,哎,我们需要在这个hotport的基础上看啊。好了,这就是我们的。Hotport这个课程了啊,大家有什么问题吗?
我来说两句