Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据

R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据

原创
作者头像
拓端
发布于 2023-03-27 12:51:34
发布于 2023-03-27 12:51:34
49100
代码可运行
举报
文章被收录于专栏:拓端tecdat拓端tecdat
运行总次数:0
代码可运行

全文下载链接: http://tecdat.cn/?p=26105 

最近我们被客户要求撰写关于LCTM的研究报告,包括一些图形和统计输出。

在本文中,潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。然而,对于给定的数据集,可以根据类的数量、模型结构和轨迹属性得出不同模型的分数

本文说明了LCTM的基本用法,用于汇总拟合的潜在类轨迹模型对象的输出。

例子

目的:通过将 BMI 建模为年龄函数,识别具有不同轨迹的参与者亚组。根据迄今为止可用的文献,我们假设初始 K=5 类 BMI 轨迹。

我们使用体重指数 (BMI) 重复测量 10,000 个样本的长格式数据框。

提供了一个示例(模拟)数据集 bmi 来描述整个步骤。

包含的变量有:

id - 个人 ID 年龄 - BMI 测量的年龄,以年为单位 bmi - 个人在 T1、T2、T3 和 T4 时间的体重指数,以 kg/m^2 为单位 true_class - 用于识别模拟个人 BMI 数据的类别的标签

加载数据

绘制数据

潜在类轨迹建模的八步示例

为了对纵向结果 yijk 进行建模,对于 k=1:K,类,对于个体 i,在时间点 j,tj可以使用许多建模选择。我们在这里给出方程来说明这些,并按照复杂度增加的顺序将它们命名为模型 A 到 G。

模型 A:无随机效应模型 | 固定效应同方差 | - 解释个人轨迹与其平均类轨迹的任何偏差仅是由于随机误差

其中假设所有类的残差方差相等,

相关视频

**

拓端

,赞17

模型 B:具有特定类别残差的固定效应模型 | 异方差 | 与模型 A 相同的解释,随机误差在不同的类别中可能更大或更小。

其中假设残差方差不同

模型 C:随机截距 解释是允许个体的初始体重不同,但假设每个班级成员遵循平均轨迹的相同形状和大小

对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj,

其中随机效应分布

模型 D:随机斜率 允许个体在初始权重和平均轨迹的斜率上有所不同

对于 k=1:K,类,对于个体 i,在时间点 j , tj,

其中假设随机效应分布为

模型 E:随机二次 - 跨类的共同方差结构 允许个体在类内通过初始权重变化,但是假设每个类具有相同的变异量。对于 k=1:K, 类, 对于个体 i, 在时间点 j, tj,

其中假设随机效应分布为 

模型 F 和 G:随机二次 - 允许方差结构跨类变化的比例约束 ,增加模型 E 的灵活性,因为允许方差结构相差一个乘法因子,以允许某些类具有更大或更小的类内方差。该模型可以被认为是模型 G 的更简洁版本(将要估计的方差-协方差参数的数量从 6xK 参数减少到 6+(K-1)个参数。

对于 k=1:K, classes, 对于个体 i, 在时间点 j, tj,

其中假设随机效应分布为 

第一步:选择随机效应结构的形式

为了确定随机效应的初始工作模型结构,可以遵循 Verbeke 和 Molenbergh 的基本原理来检查没有随机效应的模型中每个 K 类的标准化残差图的形状。

如果残差轮廓可以近似为平坦、直线或曲线,则分别考虑随机截距、斜率或二次项。

为了拟合没有随机效应的潜在类模型。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
hlmfixed(bmig)

然后,我们将拟合模型输入 LCTM中的 step1 函数,以检查特定类别的残差。

第2步

优化步骤 1 中的初步工作模型以确定最佳类数,测试 K=1,...7。可以根据最低贝叶斯信息标准 (BIC) 来选择所选类别的数量。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
set.seed(100)


for (i in 2:4) {
  mi <- lchlme( data.frame(bmg[1:500,])
  
}
#> Be patient, hlme is running ... 
#> The program took 0.29 seconds 
#> Be patient, hlme is running ... 
#> The program took 0.69 seconds 
#> Be patient, hlme is running ... 
#> The program took 2.3 seconds

modelut <-kable(lin)

第 3 步

使用步骤 2 中推导出的偏好 K 进一步细化模型,测试最优模型结构。我们测试了七个模型,从简单的固定效应模型(模型 A)到允许残差在类别之间变化的基本方法(模型 B)到一组具有不同方差结构的五个随机效应模型(模型 CG)。

  • A(SAS、PROC TRAJ)
  • B型(R,mmlcr)

调用 source() 命令。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mmldata = bmi_l01
#             )
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# model_b$BIC
  • C (SAS、PROC TRAJ)
  • D 型(SAS、PROC TRAJ)
  • E型 (R, lcmm)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
moe <- hlmfixed = bmi ~1+ age + I(age^2),
           mixture = ~1 + age + I(age^2)
          
#> Be patient, hlme is running ... 
#> The program took 0.77 seconds
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
me$BIC
  • F型 (R, lcmm)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fixed = bmi ~1+ age + I(age^2),
           mixture = ~1 + age + I(age^2)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mod$BIC
  • G (SAS、PROC TRAJ)

第四步

执行一些模型充分性评估。首先,对于每个参与者,计算被分配到每个轨迹类的后验概率,并将个体分配到概率最高的类。在所有类别中,这些最大后验分配概率 (APPA) 的平均值高于 70% 被认为是可以接受的。使用正确分类、不匹配的几率进一步评估模型的充分性。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
LCTMdel_f

第 5 步

  • 图形表示方法;
  • 绘制包含每个类的时间平均轨迹
  • 每个类具有 95% 预测区间的平均轨迹图,显示每个类内预测的随机变化
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
plotpred <- predictY
plototp
  • 个人水平的“面条图”随时间变化,取决于样本量,可能使用参与者的随机样本
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(bm, aes(x = age, y = bmi)) + geom_line
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
ggplot(bmong) + geom_line

01

02

03

04

第 6 步

评估模型。

第 7 步

使用四种方法评估临床特征和合理性;

1. 评估轨迹模式的临床意义,旨在包括至少 1% 的人群的类别

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
postprb( modf )

2. 评估轨迹类别的临床合理性

使用生成的图 来评估预测的趋势对于正在研究的组是否现实。例如,对于研究 BMI,显示下降到 <5 kg/m2 的预测趋势是不现实的。 

3. 潜在类别与传统分类的特征列表

使用从所选模型中提取类分配;

然后用描述性变量反馈到主数据集中。

然后可以根据需要将这些制成表格。

等等。

4. 使用 kappa 统计的类成员与传统 BMI 类别成员的一致性

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 定义BMI类别,这些类别的数量需要与类别的数量相等 
confusionMatrix(bmi_class, bmclass
kable(y, row.names = )

第 8 步

酌情进行敏感性分析。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据
最近我们被客户要求撰写关于潜类别(分类)轨迹模型LCTM的研究报告,包括一些图形和统计输出。
拓端
2023/01/03
7280
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状|附代码数据
最近我们被客户要求撰写关于潜类别混合效应模型(LCMM)的研究报告,包括一些图形和统计输出。
拓端
2023/06/19
9200
如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据
线性混合模型假设 N 个受试者的群体是同质的,并且在群体水平上由独特的曲线 Xi(t)β 描述 。
拓端
2023/01/12
1K0
如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据
线性混合模型假设 N 个受试者的群体是同质的,并且在群体水平上由独特的曲线 Xi(t)β 描述 。 最近我们被客户要求撰写关于线性混合模型的研究报告,包括一些图形和统计输出。
拓端
2022/11/28
5500
R软件用潜在类别混合模型LCM分析老年人抑郁数据轨迹多变量建模研究
潜在类别混合模型假设总体具有异质性,由 GG 个潜在类别组成。在多变量的情况下,潜在类别是根据 KK 个纵向结果来定义的,从而形成 GG 个组,每个组的特征由 KK 个轨迹均值轮廓集表示(点击文末“阅读原文”获取完整代码、数据、文档)。
拓端
2025/02/19
1170
R软件用潜在类别混合模型LCM分析老年人抑郁数据轨迹多变量建模研究
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
每一个动态现象都可以用一个潜过程(Λ(t)来描述,这个潜过程在连续的时间t内演化(点击文末“阅读原文”获取完整代码数据)。
拓端
2025/03/17
940
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程|附代码数据
最近我们被客户要求撰写关于潜过程混合效应模型(lcmm)的研究报告,包括一些图形和统计输出。
拓端
2023/05/10
5590
基于R语言混合效应模型(mixed model)案例研究|附代码数据
在本文中,我们描述了灵活的竞争风险回归模型。回归模型被指定为转移概率,也就是竞争性风险设置中的累积发生率
拓端
2023/02/10
1.3K0
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
每个动态现象都可以用一个潜过程(Λ(t))来表征,这个潜过程在连续的时间t中演化。有时,这个潜过程是通过几个标志来衡量的,因此潜过程是它们的共同因素。
拓端
2023/08/30
2310
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
R语言回归、anova方差分析、相关性分析 《精品购物指南》调研数据可视化|附代码数据
最近我们被客户要求撰写关于回归、anova方差分析、相关性分析的研究报告,包括一些图形和统计输出。
拓端
2023/03/03
5960
SAS,Stata,HLM,R,SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据
本文用于比较六个不同统计软件程序(SAS,Stata,HLM,R,SPSS和Mplus)的两级分层线性模型的过程和输出
拓端
2022/12/02
1.8K0
R语言线性混合效应模型(固定效应&随机效应)和交互可视化3案例|附代码数据
线性混合效应模型是在有随机效应时使用的,随机效应发生在对随机抽样的单位进行多次测量时。来自同一自然组的测量结果本身并不是独立的随机样本。因此,这些单位或群体被假定为从一个群体的 "人口 "中随机抽取的。示例情况包括
拓端
2022/12/27
1.7K0
R语言LME4混合效应模型研究教师的受欢迎程度|附代码数据
文中本教程对多层_回归_模型进行了基本介绍(点击文末“阅读原文”获取完整代码数据) 。
拓端
2022/10/31
8230
R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系|附代码数据
线性混合模型(有时被称为 "多层次模型 "或 "层次模型",取决于上下文)是一种回归模型,它同时考虑了(1)被感兴趣的自变量(如lm())所解释的变化--固定效应,以及(2)不被感兴趣的自变量解释的变化--随机效应。由于该模型包括固定效应和随机效应的混合,所以被称为混合模型。这些随机效应本质上赋予误差项ϵ结构。
拓端
2023/05/09
6710
数据分享|用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化|附代码数据
养殖者通常会切开贝壳并通过显微镜计算环数来估计鲍鱼的年龄。因此,判断鲍鱼的年龄很困难,主要是因为它们的大小不仅取决于它们的年龄,还取决于食物的供应情况。而且,鲍鱼有时会形成所谓的“发育不良”种群,其生长特征与其他鲍鱼种群非常不同。这种复杂的方法增加了成本并限制了其普及。我们在这份报告中的目标是找出最好的指标来预测鲍鱼的环,然后是鲍鱼的年龄。
拓端
2023/07/17
6260
数据分享|用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化|附代码数据
养殖者通常会切开贝壳并通过显微镜计算环数来估计鲍鱼的年龄。因此,判断鲍鱼的年龄很困难,主要是因为它们的大小不仅取决于它们的年龄,还取决于食物的供应情况。而且,鲍鱼有时会形成所谓的“发育不良”种群,其生长特征与其他鲍鱼种群非常不同。这种复杂的方法增加了成本并限制了其普及。我们在这份报告中的目标是找出最好的指标来预测鲍鱼的环,然后是鲍鱼的年龄。
拓端
2023/03/24
1.4K0
R语言实现混合模型
普通的线性回归只包含两项影响因素,即固定效应(fixed-effect)和噪声(noise)。噪声是我们模型中没有考虑的随机因素。而固定效应是那些可预测因素,而且能完整的划分总体。例如模型中的性别变量,我们清楚只有两种性别,而且理解这种变量的变化对结果的影响。 那么为什么需要 Mixed-effect Model?因为有些现实的复杂数据是普通线性回归是处理不了的。例如我们对一些人群进行重复测量,此时存在两种随机因素会影响模型,一种是对某个人重复测试而形成的随机噪声,另一种是因为人和人不同而形成的随机
机器学习AI算法工程
2018/03/14
4.4K0
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
最近我们被客户要求撰写关于预测心脏病数据的研究报告,包括一些图形和统计输出。 本报告是对心脏研究的机器学习/数据科学调查分析。更具体地说,我们的目标是在心脏研究的数据集上建立一些预测模型,并建立探索性和建模方法。但什么是心脏研究?
拓端
2022/12/23
7760
Python线性混合效应回归LMER分析大鼠幼崽体重数据、假设检验可视化|数据分享
在数据分析领域,当数据呈现出层次结构时,传统的一般线性模型(GLM)可能无法充分捕捉数据的特征。混合效应回归作为GLM的扩展,能够有效处理这类具有层次结构的数据,如聚类数据、重复测量数据和纵向数据等。本文将深入探讨混合效应回归的基本原理、关键概念、不同模型类型的差异,以及如何使用Python进行建模和分析(点击文末“阅读原文”获取完整代码数据)。
拓端
2025/01/15
1200
Python线性混合效应回归LMER分析大鼠幼崽体重数据、假设检验可视化|数据分享
R语言建立和可视化混合效应模型mixed effect model|附代码数据
我们已经学习了如何处理混合效应模型。本文的重点是如何建立和_可视化_ 混合效应模型的结果
拓端
2023/02/07
1.8K0
推荐阅读
R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据
7280
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状|附代码数据
9200
如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据
1K0
如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据
5500
R软件用潜在类别混合模型LCM分析老年人抑郁数据轨迹多变量建模研究
1170
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
940
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程|附代码数据
5590
基于R语言混合效应模型(mixed model)案例研究|附代码数据
1.3K0
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
2310
R语言回归、anova方差分析、相关性分析 《精品购物指南》调研数据可视化|附代码数据
5960
SAS,Stata,HLM,R,SPSS和Mplus分层线性模型HLM分析学生受欢迎程度数据|附代码数据
1.8K0
R语言线性混合效应模型(固定效应&随机效应)和交互可视化3案例|附代码数据
1.7K0
R语言LME4混合效应模型研究教师的受欢迎程度|附代码数据
8230
R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系|附代码数据
6710
数据分享|用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化|附代码数据
6260
数据分享|用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化|附代码数据
1.4K0
R语言实现混合模型
4.4K0
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析|附代码数据
7760
Python线性混合效应回归LMER分析大鼠幼崽体重数据、假设检验可视化|数据分享
1200
R语言建立和可视化混合效应模型mixed effect model|附代码数据
1.8K0
相关推荐
R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验