前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >R语言中的偏最小二乘回归PLS-DA

R语言中的偏最小二乘回归PLS-DA

作者头像
拓端
发布于 2025-01-01 04:38:17
发布于 2025-01-01 04:38:17
17500
代码可运行
举报
文章被收录于专栏:拓端tecdat拓端tecdat
运行总次数:0
代码可运行

原文链接:http://tecdat.cn/?p=8890

主成分回归(PCR)的方法 本质上是使用第一个方法的普通最小二乘(OLS)拟合来自预测变量的主成分(PC)点击文末“阅读原文”获取完整代码数据)。

相关视频

这带来许多优点:

  1. 预测变量的数量实际上没有限制。
  2. 相关的预测变量不会破坏回归拟合。

但是,在许多情况下,执行类似于PCA的分解要明智得多。

今天,我们将 在Arcene数据集上执行PLS-DA, 其中包含100个观察值和10,000个解释变量。

让我们开始使用R

癌症/无癌标签(编码为-1 / 1)存储在不同的文件中,因此我们可以将其直接附加到完整的数据集,然后使用公式语法来训练模型。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 安装加载

library(caret)
arcene <- read.table("train.data", sep = " ",
 colClasses = c(rep("numeric", 10000), "NULL"))

# 将标签添加为附加列


arcene$class <- factor(scan("rain.labels", sep = "\\t"))

现在的主要问题是:

  • 我们如何根据其血清的MS谱准确预测患者是否生病?
  • 哪种蛋白质/ MS峰最能区分患者和健康患者?

关于预处理,我们将使用preProc参数以精确的顺序删除零方差预测变量,并对所有剩余的变量进行标准化。考虑样本的大小(_n_= 100),我将选择10次重复的5折交叉验证(CV)–大量重复弥补了因减少的验证次数而产生的高方差–总共进行了50次准确性估算。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 编译交叉验证设置


set.seed(100)
myfolds <- createMultiFolds(arcene$class, k = 5, times = 10)
control <- trainControl("repeatedcv", index = myfolds, selectionFunction = "oneSE")

此图描绘了CV曲线,在这里我们可以学习从使用不同数量的LV(_x_轴)训练的模型中获得的平均准确度(_y_轴,%)。

现在,我们 进行线性判别分析(LDA)进行比较。我们还可以尝试一些更复杂的模型,例如随机森林(RF)。

最后,我们可以比较PLS-DA,PCA-DA和RF的准确性。

我们将使用resamples编译这三个模型,并借用ggplot2的绘图功能来比较三种情况下最佳交叉验证模型的50个准确性估计值。

显然,长时间的RF运行并没有转化为出色的性能,恰恰相反。尽管三个模型的平均性能相似,但RF的精度差异要大得多,如果我们要寻找一个鲁棒的模型,这当然是一个问题。在这种情况下,PLS-DA和PCA-DA表现出最好的性能(准确度为63-95%),并且这两种模型在诊断新血清样品中的癌症方面都表现出色。

总而言之,我们将使用PLS-DA和PCA-DA中预测的变量重要性(ViP)确定十种最能诊断癌症的蛋白质。

上面的PLS-DA ViP图清楚地将V1184与所有其他蛋白质区分开。这可能是一个有趣的癌症生物标志物。当然,必须进行许多其他测试和模型来提供可靠的诊断工具。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 拓端数据部落 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
电脑玩游戏卡顿的原因有哪些
P下载站 电脑玩游戏卡顿的原因有哪些 学习、工作闲暇之余,我们可能会采用玩游戏的方式来消遣一下,但是相信大多数的玩家可能都遇到过游戏卡顿的现象,但是对于游戏卡顿解决起来还真的比较棘手,因为其原因还是蛮
牛肉面
2021/01/29
3.5K0
Windows云主机玩游戏的利与弊:全面解析
Windows云主机,作为一台远程计算机,理论上具备运行各类Windows应用程序和服务的能力,自然也囊括了运行游戏的可能性。但是,将云主机作为游戏平台,实际操作中会遇到诸多限制和挑战。接下来,我们将深入探讨这些潜在问题,帮助您更全面地了解Windows云主机在游戏领域的表现。
jtti
2024/05/24
7160
虚拟现实游戏的十大误区
我们算是国内第一批做VR游戏的团队了, 基本上都是一路踩着坑过来的, 也从侧面说明了目前VR游戏的不成熟. 但是, 得益于大公司的资源, 机会和合作关系优势, 我们能在第一时间获得前沿的资料, 并可以体验到最新的一些硬件原型. 所以, 对于整个行业的发展趋势, 相对于其他人会了解的更深入一些. 不过最近我们发现, 大众(甚至是做游戏开发的同事)对于VR的了解还是相当有限的, 甚至还有一些误解, 我觉得有必要总结分析一下, 让大家能够更清楚的认识虚拟现实游戏, 并去接受它. 1.头戴显示器不是一个新东西了,
逍遥剑客
2018/05/21
7210
翻译:VESA Adaptive-Sync / AMD FreeSync / VRR 白皮书[通俗易懂]
近两年,VRR 技术又开始火了起来,无论是 DRM 驱动框架,还是 Xorg 、Sway (Wayland Compositor),都陆续添加了对 VRR 的支持。就连今年即将发布的 AndroidR,也都原生支持了 VRR 的功能。其实 VRR 技术早在 2014 年就已经提出了,但一直用于 PC 平台。随着移动平台 GPU 和 Display 硬件技术的不断发展,可支持的帧率和分辨率也越来越高,游戏玩家对于游戏体验的流畅度要求也越来越高。再加上越来越多的手机开始支持 DisplayPort 接口,将 VRR 技术运用于移动平台已经成为新的趋势。因此本人决定将 VESA Adaptive-Sync 白皮书翻译成中文,方便大家阅读。
全栈程序员站长
2022/06/28
2.4K0
翻译:VESA Adaptive-Sync / AMD FreeSync / VRR 白皮书[通俗易懂]
基于WebRTC的云游戏解决方案和技术优化
大家好,我是来自英特尔的诸剑俊,我们组主要从事有关于WebRTC的研发,并且有一个基于WebRTC的开源项目OpenWebRTC Toolkit (https://github.com/open-webrtc-toolkit),这次演讲的主题是基于英特尔平台和WebRTC技术的云游戏解决方案。
LiveVideoStack
2019/12/17
7.8K0
基于WebRTC的云游戏解决方案和技术优化
显卡相关技术名词解析1
FullSceneAnti-aliasing(FSAA)是一种能够消除画面中图形边缘的锯齿,使画面看起来更为平滑的一种技术。而此抗锯齿(Anti-aliasing)的技术通常被运用於3D或文字的画面。其主要的方法就是将在图形边缘会造成锯齿的这些像素(pixel)与其周围的像素作一个平均的运算,来达到图形平滑的效果,但其缺点就是会造成画面有些许的模糊。
reizhi
2022/09/26
1.2K0
记录一次笔记本超频
我的笔电是神舟战神z7kp7gt,win10环境,屏幕是乐涩的45低色域 60Hz刷新率屏幕..
Erwin
2019/12/31
2K0
ip不稳定什么原因引起
IP不稳定是指IP地址在使用过程中出现频繁断开、连接异常或访问速度不稳定等现象。这种情况可能由多种原因引起,下面我们将对其中一些常见的原因进行分析。
德迅云安全--陈琦琦
2023/11/16
8970
组装了人生第一台电脑
作为一个新时代农民工,电脑肯定是必不可少的。对于写代码还是mbp效率高,所以也一直用的mbp。不过因为工作性质,还需要经常编写大量office文档,为了使用office一些插件,我还专门在我的mbp上面安装了windows10,可见windows系统对我来说也是有需求的。不过虚拟系统还是不方便,最主要的就是不流畅。
小K算法
2021/11/19
5580
显示器屏幕的刷新率hz和帧数fps有什么区别?「建议收藏」
关于游戏帧数FPS值和屏幕刷新率,相信是电竞玩家比较关心的话题了。如果我们需要了解刷新率和帧数的区别,那么我们就需要知道它们原本是什么意思!下面装机之家科普一下.
全栈程序员站长
2022/09/03
5.4K0
显示器屏幕的刷新率hz和帧数fps有什么区别?「建议收藏」
给 FreeBSD 12.1 安装 GNOME3 图形界面
FreeBSD是一个完全开放的、安全的系统,可以Do it yourself的系统。但是个人还是不喜欢呆板的命令行界面,所有就给 FreeBSD 12.1 安装 GNOME3 图形界面。
用户8705033
2021/06/08
1.9K0
openGL之API学习(六十九)水平同步 垂直同步「建议收藏」
垂直和水平是CRT中两个基本的同步信号,水平同步信号决定了CRT画出一条横越屏幕线的时间,垂直同步信号决定了CRT从屏幕顶部画到底部,再返回原始位置的时间,而恰恰是垂直同步代表着CRT显示器的刷新率水平!
全栈程序员站长
2022/08/31
1.4K0
实测:游戏情景中,远控软件实力如何?一篇告诉你ToDesk的强大之处
支持:Windows, macOS , iOS , Android , Linux (x86_x64/Arm_v7l/Arm64)且适配各种分辨率屏幕,多屏幕设备。
呆呆敲代码的小Y
2022/08/26
2.1K0
远程桌面优化避坑指南
最近发现在局域网中用Windows远程桌面看视频画面有肉眼可见的延迟,测试帧率发现只有33帧,于是在网上找优化方法。网上的优化方案就几种,但都基本只讲如何设置,没说明原因。经过测试发现,有些设置不仅没有效果,还会产生“负优化”。所以还是有必要分享一下。
黄啊码
2022/06/20
10.7K0
AMD FreeSync显示器上市,这是要把G-Sync虐成渣了「建议收藏」
玩家玩个游戏也真不容易,配置低的怕卡顿,配置高了帧数漂亮,但又怕画面撕裂,开垂直同步倒是可以解决部分问题,但帧数限制死了又让人觉得很不爽。对于这个问题,NVIDIA 2013年10月份推出了G-Sync技术,AMD随后推出了FreeSync技术与之竞争,现在双方的G-Sync及FreeSync显示器都上市了,一场大战是免不了的。
全栈程序员站长
2022/09/06
1.5K0
学电脑必知的电脑配置
电脑的配置,主要看CPU、显卡、主板、内存、硬盘、显示器等,而笔记本的话就看它的品牌就行了。国外的有HP、apple、松下、东芝等,不过顾客口碑和质量比较硬的是DELL和HP这两个品牌;国产的有:宏基、清华紫光、清华同方、神州、海尔、联想、八亿时空等。
全栈程序员站长
2022/09/13
2.2K0
老游戏,新画质:英伟达GPU驱动新功能上线
本周五,英伟达的 GeForce 显卡驱动迎来了又一次更新,其中 AI 重制经典游戏的功能引人关注。
机器之心
2022/02/23
8080
老游戏,新画质:英伟达GPU驱动新功能上线
家庭影院.液晶电视.液晶电视连接电脑全功略续[通俗易懂]
《家庭影院.液晶电视.液晶电视连接电脑全功略》http://blog.csdn.net/liwei_cmg/archive/2008/11/28/3402883.aspx 一文中介绍了使用三星32A550P1R,作为电脑外接显示器+音箱的方法。其中中提到了 使用1366*768的分辨率。32A550物理分辩率为1920*1080,本文主要介绍使用HDMI 完成1920*1080的点对点连接。
全栈程序员站长
2022/11/02
9220
为什么我玩游戏那么卡?
周末,我正在准备年度述职的PPT,女朋友在一旁打王者荣耀,突然她好像是越塔送了个人头,很不高兴的问我。
Java3y
2019/08/27
2K0
为什么我玩游戏那么卡?
计算机运行游戏卡顿,电脑玩游戏卡怎么办几种实用解决方法
现在很多朋友都喜欢玩游戏,虽然大多数人都是用手机玩游戏了,但还是有一些比较好玩的游戏是需要电脑上玩的,而有时候我们会遇到电脑玩游戏卡的问题,这是怎么回事呢?实际上这种问题需要用排除法来确定问题的所在,从而围绕问题来解决,这里U盘网就教大家由易到难的解决方案。
全栈程序员站长
2022/10/03
8.2K0
计算机运行游戏卡顿,电脑玩游戏卡怎么办几种实用解决方法
推荐阅读
相关推荐
电脑玩游戏卡顿的原因有哪些
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验