生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。...生存分析适合于处理时间-事件数据,生存时间(survival time)是指从某起点事件开始到被观测对象出现终点事件所经历的时间,如从疾病的“确诊”到“死亡”。...生存分析方法大体上可分为三类:非参数法、半参数方法和参数法,用Kaplan-Meier曲线(也称乘积极限法Product limit method)和寿命表法(Life table method)估计生存率和中位生存时间等是非参数的方法...,半参数方法指Cox比例风险模型,参数方法指指数模型、Weibull模型、Gompertz模型等分析方法。...survival包中包括了所有生存分析所必须的函数,生存分析主要是把数据放入Surv object,通过Surv()函数做进一步分析。
R里面已经包含了众多的回归 为了解释OLS模型的参数,数据必须满足以下统计假设: 评估模型的方法 #lm拟合回归模型 #简单线性回归 fit = lm(weight~height,data=
功效分析是统计检验中很重要的一部分,但实际上在科学文献中,特别是生命科学研究中极少有人使用。一方面是实验条件有限,另一方面是分析水平有限。希望有条件的实验人员在进行分析时还是应当考虑下功效。...不相等) pwr.anova.test() 平衡的单因素ANOVA pwr.chisq.test() 卡方检验 pwr.f2.test() 广义线性模型 pwr.p.test() 比例(单样本) pwr.r.test...,该文章可以作为一个实例阅读,分析函数的使用可以用它作为参考。...其他软件包 软件包 目的 asypow 通过渐进似然比方法计算功效 longpower 纵向数据中样本量的计算 PwrGSD 组序列设计的功效分析 pamm 混合模型中随机效应的功效分析 powerSurvEpi...)设计的功效分析 powerGWASinteraction GWAS交互作用的功效计算 pedantics 一些有助于种群基因研究功效分析的函数 gap 一些病例队列研究设计中计算功效和样本量的函数 ssize.fdr
PCA分析过程 2.0 手动计算 2.1 prcomp函数 2.2 princomp函数 2.3 psych::principal 3. PCA结果解释 4....特征向量主要起转换作用,其数值不能说明什么问题,解释力更强的是载荷loadings,但很多R输出中经常混用,egien vector与loadings。...PCA分析过程 2.0 手动计算 #特征分解 dat_eigen%cor()%>%eigen() #特征值提取 dat_eigen$values...princomp函数输出有主成份的sd,loading,score,center,scale. data(wine) #三种葡萄酿造的红酒品质分析数据集 wine.pca<-princomp(wine,...这两个信息可以判断主成分分析的质量: 成功的降维需要保证在前几个为数不多的主成分对数据差异的解释可以达到80-90%。 指导选择主成分的数目: 1.
#判别分析 用以判别个体所属群体的一种统计方法 判别分析重点是两类群体的判别方法 #主要判别分析方法 有距离判别 贝叶斯判别 费歇判别法 1、关键点: #贝叶斯判别 贝叶斯判别式假定对研究对象已有一定的认识...#当取得样本后 就可以用样本来修正已经有的先验概率分布 得出后验概率分布 #然后通过后验概率分布 进行各种统计推断 #实际上就是使平均误判损失(误判概率与误判损失的结合)ECM达到极小的过程 2、案例分析...(一)两个总体的贝叶斯判别分析 #1.载入数据 TrnX1<-matrix( c(24.8, 24.1, 26.6, 23.5, 25.5, 27.4,-2.0, -2.4, -3.0, -1.9...source("E:/R/discriminiant.bayes.R") #3、协方差相同时的判别 discriminiant.bayes(TrnX1, TrnX2, rate=8/6,var.equal...distinguish.bayes.R") distinguish.bayes(X,G) PS:=============distinguish.bayes.R====================
因子分析可以看做是主成分分析的进一步扩展,主成分分析重点在综合原始变量的信息,而因子分析重在解释原始变量之间的关系。...因子分析的步骤和主成分也是差不多的,关于因子分析前的一些准备工作可以参考之前主成分分析的步骤,比如相关矩阵的计算,KMO检验和Bartlett球形检验等,这里不再介绍。...只有数据之间的相关性好,才有可能提炼出公共因子,建议大家相关性分析和两个检验不要忘记。 R语言主成分分析 演示数据 数据来自于孙振球医学统计学第4版例22-2....但是提取几个因子并没有绝对的标准,我们可以结合多种方法或专业知识,和提取主成分的方法类似,可以参考之前的介绍的方法:R语言主成分分析 除此之外,还可以结合特征值大小、累计贡献率来确定使用几个因子。...,我并没有找到好用的可视化R包,如果大家知道,欢迎评论区留言。
方差分析与回归分析 在回归分析中,通过量化的预测变量来预测量化的响应变量,建立了相应的回归模型。 同时,预测变量也不一定是量化的,还可以是名义型或者有序型变量。...单因素组内方差分析 ? 单因素组内方差分析,又叫做重复测量方差分析。 含组间和组内因子的双因素方差分析 ?...协方差分析 上面分析了疗法和时间两个因素对焦虑症的影响,属于双因素混合模型方差分析。 有一个问题需要考虑:治疗后的差异可能是由于治疗前情况的差异产生。...本案例中,BDI为协变量,该设计分析为协方差分析(ANCOVA)。...当因变量不只有一个,设计被称为多元方差分析(MANOVA)。 多元协方差分析 多元方差分析中,如果协变量也存在,就叫做多元协方差分析。
当包含的因子是解释变量时我们关注的重点通常会从预测转向组别的差异的分析,这种分析方法称作方差分析(ANOVA) ,除了R中的基础包,还需要加载car、gplots、HH、rrcov和mvoutlier包...,安装请用:install.package(),方差分析一般用ANOVA模型-使用aov()函数,回归时用到的lm()函数也能分析ANOVA模型 。...在ANOVA方差分析中,表达式等式右边的因子排列顺序很重要,如在双因素方差分析中,若不同处理方式中的观测数不同,那么模型y ~ A*B与模型y ~ B*A的结果不同。...R默认类型I(序贯型)方法计算ANOVA效应 (顺序很重要)。第一个模型可以这样写:y ~ A + B + A:B。...R中的ANOVA表的结果将评价: 1.A对y的影响 2.控制A时,B对y的影响 3.控制A和B的主效应时,A与B的交互效应。 ?
判别分析(discriminant analysis)是根据判别对象若干个指标的观测结果判定其属于哪一类的统计方法。经典的判别分析方法有Fisher判别和贝叶斯判别分析。...当分类很确定时,判别分析可以有效替代logistic回归,但是如果自变量和因变量关系很复杂时,判别分析表现不如logistic回归。...如果你有两个类别,比如良性和恶性,判别分析会分别计算属于两个类别的概率,然后选择概率大的类别作为正确的类别。 线性判别分析假设每个类中的观测服从多元正态分布,并且不同类别之间的协方差相等。...下面用predict提取判别分析的分类结果。 predict用于判别分析可以得到3种类型的结果,class是类别,posterior是概率,x是线性判别评分。...plot of chunk unnamed-chunk-11 二次判别分析和线性判别分析用法一样。
“医学和生信笔记,专注R语言在临床医学中的使用、R语言数据分析和可视化。主要分享R语言做医学统计学、临床研究设计、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。...主要介绍使用R语言进行层次聚类、划分聚类(K均值聚类和PAM)。...canned 170 25 7 7 1.2 ## shrimp canned 110 23 1 98 2.6 层次聚类在R语言中非常简单...或者可以借助其他R包快速绘制好看的聚类分析图形。 树状数据/层次数据可视化 又是聚类分析可视化! R语言画好看的聚类树 R语言可视化聚类树 如何选择聚类的个数呢? 可以通过R包NbClust实现。...在R语言中可以通过kmeans()实现K均值聚类。 使用K均值聚类处理178种葡萄酒中13种化学成分的数据集。
p=9589 ---- 目录 怎么做测试 假设条件 并非所有比例或计数都适用于逻辑回归分析 过度分散 伪R平方 测试p值 Logistic回归示例 模型拟合 系数和指数系数 方差分析 伪R平方 模型的整体...p值 标准化残差图 绘制模型 Logistic回归示例 模型拟合 系数和指数系数 方差分析 伪R平方 模型的整体p值 标准化残差图 绘制模型 Logistic回归示例 ---- 怎么做测试 Logistic...回归可以使用glm (广义线性模型)函数在R中执行 。...并非所有比例或计数都适用于逻辑回归分析 一个不采用逻辑回归的例子中,饮食研究中人们减肥的体重无法用初始体重的比例来解释作为“成功”和“失败”的计数。...伪R平方 对于广义线性模型(glm),R不产生r平方值。pscl 包中的 pR2 可以产生伪R平方值。 测试p值 检验逻辑对数或泊松回归的p值使用卡方检验。方差分析 来测试每一个系数的显着性。
可与博客对着看:R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等) ———————————————————————————————————————————————— 基于监督算法的情感分析存在着以下几个问题...一般为数据中不正常的符号所致,常见的方法是将`quote = ""`设置为空,这样做虽然避免了警告,但是仍然解决不了问题,有时数据会对不上号,所以最好从符号上着手将一些特殊符号去除,还有一些文本的正则表达式的问题,可见博客: R语言...1.2 数据清洗(一、二级) 文本数据清洗步骤有很多:一级清洗(去标点)、二级清洗(去内容)、三级清洗(去停用词,这个步骤一般分词之后)(具体可参考博客第二部分内容:R语言︱词典型情感分析文本操作技巧汇总...可参考博客:给R变个形 图4 4.2 训练集- 随机森林模型 随机森林模型不需要id项,通过row.names把id这一列放在R默认序号列,如图4中的第一列。...可见:R语言︱机器学习模型评估方案(以随机森林算法为例) 本文大多学习之《数据挖掘之道》,还未出版,摘录自公众号:大音如霜,感谢老师的辛勤,真的是非常用心的在写代码以及服务大众。
今天给大家解释一个组内相关系数(intraclass correlationefficient,ICC)分析方法,其主要用于评价具有确定亲属关系的个体间某种定量属性的相似程度,同时也可以用于评价不同测量方法或者评定者对同一定量结果的可重复性或一致性...接下来我们看下在R语言中是如何进行计算的,首先我们需要用到R包irr。 安装irr包:install.packages(‘irr’)。 其中主要的函数是icc: ?...Type 主要是指何种分析模式;consistency指的是从两组的相关性出发,如果两组具有一定的相关性那么就认为consistency好;agreement主要指两组中每个值的一致性是否好,如果每个值的一致性高那么
R语言拥有大量和聚类分析相关的函数,在这里我主要会和大家介绍K-means聚类、层次聚类和基于模型的聚类。 1....数据预处理 在进行聚类分析之前,你需要进行数据预处理,这里主要包括缺失值的处理和数据的标准化。...K-means聚类 在聚类分析中,K-means聚类算法是最常用的,它需要分析者先确定要将这组数据分成多少类,也即聚类的个数,这个通常可以用因子分析的方法来确定。...层次聚类 R语言提供了丰富的层次聚类函数,这里我给大家简单介绍一下用Ward方法进行的层次聚类分析。...我们可以使用R包“mclust”的Mclust()函数来实现这种模型聚类分析,同时你可以通过help(mclustModelNames)去查看各类模型的详细信息。
上次介绍了生存分析中的寿命表、K-M曲线、logrank检验、最佳切点的寻找等,本次主要介绍Cox回归。 本推文不涉及理论,只有实操,想要了解生存分析的理论的请自行学习。...cox回归也是回归分析的一种,可以计算出回归系数和95%的可信区间,因此结果可以通过森林图展示: # 为了森林图好看点,多选几个变量 fit.cox <- coxph(Surv(time, status...2 ) 这个结果如果你觉得不好看,或者你还有其他的森林图想做到统一的样式,可以考虑之前的介绍的画森林图的方法进行个性化定制: 画一个好看的森林图 用更简单的方式画森林图 R语言画森林图系列...R语言画森林图系列4! 以上是Cox回归的主要内容,大家有问题可以加群或者评论区留言,下次继续介绍时依协变量Cox回归和时依系数Cox回归。...www.sthda.com/english/wiki/survival-analysis-basics https://www.emilyzabor.com/tutorials/survival_analysis_in_r_tutorial.html
facebook-wosn-links.txt | sed '/%/d' | awk '{print $1" "$2}' > facebook-wosn-links-clean.txt 数据读入 利用R语言...read.table函数以table格式存储数据 # R语言读入数据 friends.whole <- read.table("Your File Address", header=FALSE, sep...=" ", col.names=c("from","to")) 数据选取 数据中包含非常多的用户,数据间相互影响,为了使结果更清晰,我们选定某一用户,分析其好友的分布特点 library(igraph
生存分析是临床常用统计方法,一旦和时间扯上关系,分析就变得复杂多了,此时不再是单一的因变量,还需要考虑时间给因变量和自变量带来的各种影响。 本次主要演示R语言做生存分析的一些方法。...但是一般在生存分析中我们喜欢用1代表死亡,用0代表删失,所以我们更改一下(其实不改也可以,你记住就行)。...在R语言中通过survdiff()实现logrank检验。...sex=2 2 ## 205 sex=2 2 ## 206 sex=2 2 通过ggsurvplot()进行可视化,非常多的细节可以修改,超级详细的教程可以参考后面的推文:超级详细的R语言生存分析可视化...多时间点和多指标的ROC曲线绘制,可参考:R语言画多时间点ROC和多指标ROC曲线 平滑版ORC曲线和最佳截点:生存资料ROC曲线的最佳截点和平滑曲线 ROC曲线的比较:ROC(AUC)曲线的显著性检验
我们上一期介绍了如何实现GO分析的可视化,运行了GOplot包自带的数据并且很畅通。然而我们如何才能获取那些可以直接输入的数据表格或者说前期的工作是怎么实现的。...今天就跟大家介绍下如何利用R语言实现GO的流程化分析。...我们需要以下三个包:GO.db是GO分析的数据基础它包含了GO的基本分层信息;topGO是基因的功能富集分析包;GOProfiles利用GO谱进行富集分析。接下来我们逐个介绍如何使用以上三个R包。...GGHumanMethCancerPanelv1 GPL15396 Homo sapiens hthgu133b GPL17897 Homo sapiens hthgu133a GO的基础数据已经准备好,接下来是如何做功能富集分析并输出我们想要的结果...至此我们的GO和gene匹配的过程结束了,接下来就是我们的核心部分富集分析了。富集分析有很多方法,在此包中的方法我们列出如下: ?
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析 R语言meta分析(4)网状Meta 分析 R语言meta分析(5)累积Meta分析...(1)为何做累积Meta分析 meta分析是对具有共同研究目的相互独立的多个研究结果给予合并分析,综合评价研究结果。...(2)累积Meta分析介绍 累积meta分析是指各原始研究按照某个变量的变化依次引人meta分析的一种独特的显示方法。...(4)累积Meta分析总结 累计meta分析原理简单 ,计算简便 、结果表述直观 。 累计 meta分析是一个涉及设计、实施 、分析、解释全过程的研究 ,易受到各种来源的偏倚对 分析结果的影响。...1、累积meta分析与传统meta分析的共同点是:做法是相同的。 2、累积meta分析与传统meta分析的不同点是:传统meta分析只进行一次分析,而累积meta分析进行多次分析。
领取专属 10元无门槛券
手把手带您无忧上云