Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >有没有一种方法可以提高R中for循环的性能?

有没有一种方法可以提高R中for循环的性能?
EN

Stack Overflow用户
提问于 2020-08-11 10:59:41
回答 3查看 60关注 0票数 0

我有一个数据集,它的观测量略多于132万。我试图在dataset中添加一个"growth.factor“列,该列从另一个名为"cat.growth”的数据集( 44x8 )中设置一个给定的县值和分类。

我需要运行以下352次代码--更改县名和分类名--以获得我想要的结果(44个县,8个不同的分类):

代码语言:javascript
运行
AI代码解释
复制
parcel.data.1$growth.factor <- ifelse(parcel.data.1$classification == "Ag" & parcel.data.1$county == "Ada", 1 + cat.growth["Ada","Ag"], parcel.data.1$growth.factor)

如果我这样做,运行大约需要16.7秒。但是它需要352行代码。使用这个for循环,我可以在4行代码中实现相同的目标:

代码语言:javascript
运行
AI代码解释
复制
for (x in parcel.data.1) {
  for (y in parcel.data.1$classification) {
    parcel.data.1$growth.factor <- ifelse(parcel.data.1$classification == y & parcel.data.1$county == x, 1 + cat.growth[x,y], parcel.data.1$growth.factor)
  }}

但是当我运行它时,我甚至无法完成它( 12分钟后我就放弃了)。我尝试使用我的Mac中的所有核心,使用:

代码语言:javascript
运行
AI代码解释
复制
library(foreach)
library(doSNOW)
c1 <- makeCluster(8, type = "SOCK")
registerDoSNOW(c1)

但这没什么用。我看过所有关于慢循环的博客和其他帖子,但是我的代码只是一行,所以在其他建议中我没有看到任何适用于更快的东西。

任何帮助使这个循环在不到一分钟内运行将是非常感谢的。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2020-08-11 12:27:51

正如其他人所指出的,您不应该使用循环。但你的问题似乎是“为什么这个循环要花这么长时间?”

答案是,您似乎正在遍历parcel.data.1$county的所有136万元素和parcel.data.1$classification的所有136万元素。这意味着您的循环正在计算ifelse() 1360000^2次数,而不是352次。

如果要使用循环,那么对每个列的唯一元素进行循环,这些元素由cat.growth的行名和列名提供。

代码语言:javascript
运行
AI代码解释
复制
for (x in rownames(cat.growth)) { # loop over counties
  for (y in colnames(cat.growth)) { # loop over classifications
    ...
  }
}

这个循环相当于352行代码的原始脚本,因此它应该有大约16秒的运行时间。

注意,如果您还不知道这两个向量的唯一元素,那么您可以使用unique()来找到它们。

票数 0
EN

Stack Overflow用户

发布于 2020-08-11 11:53:37

这似乎是创建联接的原因,而dplyr包正是您想要的。

我没有你的数据,但基于你的代码,我组装了一些简单的假数据,看起来像你的结构一样。

代码语言:javascript
运行
AI代码解释
复制
df1 <- data.frame(x = c("Ag", "Ag", "Be", "Be", "Mo", "Mo"),
                  y = c("A", "B", "A", "B", "A", "B"))
df2 <- data.frame(x = c("Ag", "Be", "Mo"),
                  A = c(1, 2, 3),
                  B = c(4, 5, 6))
library(dplyr)
library(tidyr)
df1 %>%
  inner_join(df2 %>% pivot_longer(cols = c(A, B), names_to = "y")) %>%
  mutate(value = value + 1)
Joining, by = c("x", "y")
   x y value
1 Ag A     2
2 Ag B     5
3 Be A     3
4 Be B     6
5 Mo A     4
6 Mo B     7
票数 0
EN

Stack Overflow用户

发布于 2020-08-11 11:56:59

这个循环可能不是最好的方法。一个备选方案可以是将cat.growth数据(44x8)重塑为具有县、分类和增长因子(即352x3)变量的data.frame,然后在此和原始数据帧上使用“合并”。

为了说明我的意思(基于我对您的数据的理解):

代码语言:javascript
运行
AI代码解释
复制
cat.growth <- as.data.frame(matrix(nrow = 44, ncol = 8,
                            dimnames = list(1:44, letters[1:8]),
                            data = rnorm(44*8)))

parcel.data <- data.frame(county = sample(1:44, 1e06, replace = TRUE),
                          classification = sample(letters[1:8], 1e06, replace = TRUE))

cat.growthL = reshape(cat.growth, direction = "long", 
                      idvar = "county", 
                      ids = rownames(cat.growth),
                      varying = 1:8, 
                      times = colnames(cat.growth),
                      timevar = "classification", 
                      v.names = "growth.factor")

parcel.data2 = merge(parcel.data, cat.growthL)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63364710

复制
相关文章
R中的循环绘图
上面我们将每一张图都单独输出了,下面来介绍如何将其全部组合起来,分别介绍两种R包的方法gridExtra&patchwork
R语言数据分析指南
2022/09/21
4.3K0
R中的循环绘图
python中for循环加速_如何提高python 中for循环的效率[通俗易懂]
对于某个城市的出租车数据,一天就有33210000条记录,如何将每辆车的数据单独拎出来放到一个专属的文件中呢?
全栈程序员站长
2022/09/22
3.7K0
java中如何将嵌套循环性能提高500倍
转载请注明出处https://www.cnblogs.com/funnyzpc/p/15975882.html
上帝
2022/05/10
6630
可以提高云计算性能的6种技术
很多企业致力于追求最佳的应用程序性能,但实现它并非易事。在基于主机的内部部署IT环境中,企业必须提供适当调整的资源以实现性能目标。而采用云计算技术将使这些考虑因素变得更加复杂,因为它限制了用户可以定制基础设施和其他可用功能的程度。
静一
2019/05/22
1.2K0
可以提高云计算性能的6种技术
在Python和R中使用交叉验证方法提高模型性能
模型表现差异很大的可能原因是什么?换句话说,为什么在别人评估我们的模型时会失去稳定性?
拓端
2021/01/28
1.6K0
在Python和R中使用交叉验证方法提高模型性能
VMware Workstation 提高性能的方法
实测非常管用,能有效避免硬盘疯狂被读取导致噪音很大的情况! 首先打开编辑->首选项 Paste_Image.png 点击左侧内存,将额外内存修改为第一项调整所有虚拟机内
飞奔去旅行
2019/06/13
1.6K0
VMware Workstation 提高性能的方法
可能提高GAN性能的方法介绍
生成器试图找到最好的图像来欺骗鉴别器。当两个网络互相对抗时,“最佳”图像不断变化。但是,优化可能会变得过于贪心,使其陷入永无止境的猫捉老鼠游戏中。这是模型不收敛和模式崩溃的原因之一。
AiTechYun
2018/07/27
1.6K0
可能提高GAN性能的方法介绍
如何提高C++中for循环的效率
1. 不假思索的写法(最为常见,且最耗时) 测试用时:0.000143s clock_t startTime,endTime; startTime = clock(); vector<double> row(100); double sum=0; for(unsigned int i=0;i<1000;i++) { for(unsigned int j=0;j<row.size();j++) {
用户9831583
2022/06/16
2K0
提高模型性能,你可以尝试这几招...
在EZDL到底怎样,试试看…一文中,我尝试了百度推出的在线人工智能设计平台EZDL,其愿景是任何人不用编写一行代码就可以轻松地构建、设计和部署人工智能(AI)模型。从试用效果上看,确实不需要编写一行代码,也不需要什么人工智能知识。但对于一名程序员而言,将人工智能包装到一个黑盒子中,而自己毫无掌控感,总有那么一点不踏实。
云水木石
2019/07/01
1.1K0
提高模型性能,你可以尝试这几招...
【测评】提高R运行效率的若干方法
【画图】与SARS-CoV-2病毒结合ACE2基因表达正相关的LncRNA有哪些?
Chris生命科学小站
2023/02/28
1.4K0
【测评】提高R运行效率的若干方法
提高 PHP 7 的性能的几个方法
PHP7 已经发布了, 作为 PHP 10 年来最大的版本升级, 最大的性能升级, PHP7 在多放的测试中都表现出很明显的性能提升, 然而, 为了让它能发挥出最大的性能, 我还是有几件事想提醒下.
Yangsh888
2022/03/29
5480
一种绝对提高开发水平的方法
AntConc 使用工具软件可以把一本电子档中的单词全部提取出来,并分析其出现频率
IT小马哥
2020/03/18
5310
一种绝对提高开发水平的方法
如果做了多年开发的你发现自己的水平一直上不去,你可能要提高自己的英文水平了,英语就是你技术的瓶颈,对有些人可能是硬伤。
张果
2018/07/31
9.2K2
一种绝对提高开发水平的方法
如何提高 Java 中锁的性能
两个月前向Plumbr公司引进线程死锁的检测之后,我们开始收到一些类似于这样的询问:“棒极了!现在我知道造成程序出现性能问题的原因了,但是接下来该怎么做呢?”
哲洛不闹
2018/09/19
1K0
提高java程序性能的小方法
1、避免使用错误的方式,尽量不用instanceof做条件判断,不要将数组声明为:public static final 。 2、使用java中效率高的类,比如尽量使用HashMap 和ArrayList ,除非必要,否则不推荐使用HashTable和Vector ,后者由于使用同步机制,而导致了性能的开销。 3、尽量指定类的final修饰符 带有final修饰符的类是不可派生的。在Java核心API中,有许多应用final的例子,例如java.lang.String。为String类指定final防止了人
神秘的寇先森
2018/05/30
7980
Python中的循环-比较和性能
Python是当今最受欢迎的编程语言之一。这是一种具有优雅且易读语法的解释性高级语言。但是,Python通常比Java,C#尤其是C,C ++或Fortran慢得多。有时性能问题和瓶颈可能会严重影响应用程序的可用性。
计算机与AI
2020/12/14
3.5K0
Python中的循环-比较和性能
计算机最早提高性能的方法
随着本系列进展,我们知道计算机进步巨大,从 1 秒 1 次运算,到现在有千赫甚至兆赫的CPU,这是很大的计算量。
硬核编程
2019/08/19
5360
点击加载更多

相似问题

提高R中嵌套For循环的性能

26

提高R中嵌套循环的性能

11

有没有一种方法可以提高NativeScript中scss文件加载的性能?

10

有没有一种方法可以简化R中利用循环的函数?

13

有没有一种方法可以提高我的简单文本过滤器的性能?

55
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档