Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >R语言中的Theil-Sen回归分析

R语言中的Theil-Sen回归分析

原创
作者头像
拓端
修改于 2020-08-24 02:03:56
修改于 2020-08-24 02:03:56
1.6K01
代码可运行
举报
文章被收录于专栏:拓端tecdat拓端tecdat
运行总次数:1
代码可运行

原文链接:http://tecdat.cn/?p=10080


Theil-Sen估计器是一种在社会科学中不常用 的简单线性回归估计器  。三个步骤:

  • 在数据中所有点之间绘制一条线
  • 计算每条线的斜率
  • 中位数斜率是 回归斜率

用这种方法计算斜率非常可靠。当误差呈正态分布且没有异常值时,斜率与OLS非常相似。 

有几种获取截距的方法。如果 关心回归中的截距,那么知道 软件在做什么是很合理的。 

当我对异常值和异方差性有担忧时,请在上方针对Theil-Sen进行简单线性回归的评论 。

我进行了一次 模拟,以了解Theil-Sen如何在异方差下与OLS比较。它是更有效的估计器。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(simglm)library(ggplot2)library(dplyr)library(WRS)# HeteronRep <- 100n.s <- c(seq(50, 300, 50), 400, 550, 750, 1000)samp.dat <- sample((1:(nRep*length(n.s))), 25)lm.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))ts.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))lmt.coefs.0 <- matrix(ncol = 3, nrow = nRep*length(n.s))dat.s <- list()ggplot(dat.frms.0, aes(x = age, y = sim_data)) +  geom_point(shape = 1, size = .5) +  geom_smooth(method = "lm", se = FALSE) +  facet_wrap(~ random.sample, nrow = 5) +  labs(x = "Predictor", y = "Outcome",       title = "Random sample of 25 datasets from 15000 datasets for simulation",       subtitle = "Heteroscedastic relationships")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(coefs.0, aes(x = n, colour = Estimator)) +  geom_boxplot(    aes(ymin = q025, lower = q25, middle = q50, upper = q75, ymax = q975), data = summarise(      group_by(coefs.0, n, Estimator), q025 = quantile(Slope, .025),      q25 = quantile(Slope, .25), q50 = quantile(Slope, .5),      q75 = quantile(Slope, .75), q975 = quantile(Slope, .975)), stat = "identity") +  geom_hline(yintercept = 2, linetype = 2) + scale_y_continuous(breaks = seq(1, 3, .05)) +  labs(x = "Sample size", y = "Slope",       title = "Estimation of regression slope in simple linear regression under heteroscedasticity",       subtitle = "1500 replications - Population slope is 2",       caption = paste(         "Boxes are IQR, whiskers are middle 95% of slopes",         "Both estimators are unbiased in the long run, however, OLS has higher variability",         sep = "\n"       ))

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R语言在不同样本量下的Littles MCAR检验
我进行一个小型仿真,以在不同样本量下测试Little的MCAR检验1。我可以研究线性回归中的异方差。我能够找到一些使用Little's MCAR检验的小样本研究人员的例子,因此我进行了仿真。
拓端
2020/08/14
1.1K0
R语言实现混合模型
普通的线性回归只包含两项影响因素,即固定效应(fixed-effect)和噪声(noise)。噪声是我们模型中没有考虑的随机因素。而固定效应是那些可预测因素,而且能完整的划分总体。例如模型中的性别变量,我们清楚只有两种性别,而且理解这种变量的变化对结果的影响。 那么为什么需要 Mixed-effect Model?因为有些现实的复杂数据是普通线性回归是处理不了的。例如我们对一些人群进行重复测量,此时存在两种随机因素会影响模型,一种是对某个人重复测试而形成的随机噪声,另一种是因为人和人不同而形成的随机
机器学习AI算法工程
2018/03/14
4.5K0
R语言有RStan的多维验证性因子分析(CFA)
如果您已经熟悉RStan,那么您需要组合的基本概念是具有相关随机斜率和异方差误差的标准多级模型。
拓端
2020/11/11
8570
R-ggdist - 分布和不确定性可视化
今天的推文给大家介绍一个我发现的比较优秀的一个可视化R包-ggdist包,这是一个非常优秀和方便的用于绘制 分布(distributions)和不确定性(uncertainty) 的可视化绘图包,详细介绍大家可以去官网查阅:ggdist官网。本期推文涉及的内容主要如下:
DataCharm
2021/02/22
7390
R-ggdist - 分布和不确定性可视化
全网最全的R语言基础图形合集
直方图是一种对数据分布情况进行可视化的图形,它是二维统计图表,对应两个坐标分别是统计样本以及该样本对应的某个属性如频率等度量。
生信学习者
2024/06/12
1130
全网最全的R语言基础图形合集
R语言使用Rasch模型分析学生答题能力
几个月以来,我一直对序数回归与项目响应理论(IRT)之间的关系感兴趣。 在这篇文章中,我重点介绍Rasch分析。
拓端
2020/08/14
1.2K0
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
在混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合(点击文末“阅读原文”获取完整代码数据)。
拓端
2025/05/01
1260
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据|附AI智能体
在混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合(点击文末“阅读原文”获取完整代码、数据和AI智能体)。
拓端
2025/05/08
1710
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据|附AI智能体
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据|附代码数据
在混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合(点击文末“阅读原文”获取完整代码数据)。
拓端
2022/11/02
1.9K0
R语言 基础作图
*ggplot2中通过不同的geom函数生成图层,从前往后覆盖,因此需要考虑函数书写的顺序
Magnolia
2023/01/06
1.5K0
R语言可视化及作图7--ggplot2之标签、图例和标题绘制
geom_label可以使用fill对颜色进行填充,fontface设置字体,geom_text不能填充颜色
前端小tips
2021/12/08
5.9K0
R语言可视化及作图7--ggplot2之标签、图例和标题绘制
全网最全 | R语言中的方差分析汇总
另外还有重复力效应(个体永久环境效应)、母体效应、窝别效应等等,都是使用表型数据剖分的形式进行计算和评估。
邓飞
2021/09/27
3.1K0
生信技能树R语言作业-高级
数据包: ALL, CLL, pasilla, airway 软件包:limma,DESeq2,clusterProfiler 工具包:reshape2 绘图包:ggplot2
Y大宽
2019/05/13
3.5K0
生信技能树R语言作业-高级
R语言中的Stan概率编程MCMC采样的贝叶斯模型|附代码数据
概率编程使我们能够实现统计模型,而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用
拓端
2023/05/24
5360
数据科学24 | 回归模型-基本概念与最小二乘法
回归分析在统计学中非常重要,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。
王诗翔呀
2020/07/03
4K0
数据科学24 | 回归模型-基本概念与最小二乘法
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
这里唯一的问题是权重Δold是未知β的函数。但是实际上,如果我们继续迭代,我们应该能够解决它:给定β,我们得到了权重,并且有了权重,我们可以使用加权的OLS来获取更新的β。这就是迭代最小二乘的想法。
拓端
2021/03/16
1.5K0
生信技能树R语言学习直播配套笔记
1.1 判断数据类型class() 1.2 按Tab键自动补全1.3 数据类型的判断和转换 (1)is 族函数,判断,返回值为TRUE或FALSE
生信技能树
2022/06/08
1.2K0
生信技能树R语言学习直播配套笔记
目前最全的R语言-图片的组合与拼接
李誉辉,四川大学硕士在读,研究数据分析与可视化,以及网络爬虫。誉辉兄最近出的文章都是很系统的,从R ggplot2的基础讲解到三维数据可视化plot3D,文章都整理讲解得很全面系统,我本人也是很喜欢这样的文章,故而推荐给大家。
生信宝典
2019/09/29
5.7K0
目前最全的R语言-图片的组合与拼接
跟着Nature Plants学作图:R语言ggplot2画变种火山图
https://www.nature.com/articles/s41477-022-01146-6#Sec44
用户7010445
2023/01/06
5650
跟着Nature Plants学作图:R语言ggplot2画变种火山图
R语言_回归分析
R里面已经包含了众多的回归 为了解释OLS模型的参数,数据必须满足以下统计假设: 评估模型的方法 #lm拟合回归模型 #简单线性回归 fit = lm(weight~height,data
用户1147754
2019/05/26
1.2K0
推荐阅读
相关推荐
R语言在不同样本量下的Littles MCAR检验
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验