在临床研究中,多数情况下,连续指标与结局的关联不是线性关系,比如血压与心血管疾病发生的关系,可能在血压在升高到一定值后心血管事件发生突然升高,另外连续指标在临床应用时不如分类指标方便,因此临床应用相关指标时总会想办法找到一个正常范围或截断值。对于于一般的二分类结局指标,可以用ROC曲线去实现,但对于生存类型的数据,寻找截断值比较困难。今天给大家介绍一款小软件,快速实现寻找截断值。
软件的名字是X-tile,是耶鲁大学开发的单一功能小软件(话说国外统计专家多会编程,又特别爱编小软件、小程序)。软件只有2M,问度娘就可以下载到了。安装过程也很简单,不需要特殊设置,这里就不细说了。软件打开后是这样的界面:
简洁明了,左上角是官网,中间的声明中提示不要用于商业用途。可以操作的只有左下角“Analyze”和右下角”Exit”。点击“Analyze”后:
此时只能点击左上角“file”-“open”,弹出对话框,可以导入你的数据,这个软件现在可以比较好的支持txt数据,因此我们将数据复制到txt文件里,如下图:
数据包含三个变量,年龄,生存状态和时间(月),目的找到一个或几个好的年龄节点,其生存率明显不同。将数据导入后,可以看到有三个变量,点击任何一个变量,在中间可显示变量的具体取值。右侧是操作界面。
将生存状态、生存时间和目标变量选入相应的框(此软件可以对1-2变量取截断值,选取到Marker1,Marker2即可),本研究只研究一个连续变量,Marker2空着就可以。点击左上角的”Do“-“Kaplan-Meier”-“Marker1”,出现
此时鼠标放在中间直方图的不同位置,上面表中可以给出以鼠标所在位置为截断点分成两组,进行log-rank检验的结果。
在左侧中间的图上(下图)左健单击:
此时上方表格给出最优截断值。
可以看到软件认为最优分为组,35-44组病死率89%,45-58岁组病死率为80%,59-81岁组病死率为100%,右侧三组比较的卡方值在7.1-4.5之间。三组的生存曲线是明显分开的。
对于生存数据寻找截断值,上述软件可快速找到最优截断值,对于不会编程的小伙伴们非常实用。
而其背后的原理也非常简单,就是“枚举法”,即以不同的值作为截断值分组进行统计检验,检验结果p值最小的结果可以认为是最好的截断值,也即是向数据学习的结果。
你会用了吗?
领取专属 10元无门槛券
私享最新 技术干货