首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

无法使用描述性函数运行dplyr::summarize函数:“如果'na.rm‘为FALSE,则不允许缺少值和NaN's’”

dplyr是一个R语言中用于数据处理的包,而summarize函数是其中的一个函数,用于对数据进行汇总计算。该函数可以通过指定各种统计量(如求和、平均值、最大值等)对数据进行聚合计算,并生成一个新的数据框。

然而,当我们在使用dplyr包中的summarize函数时,有时会遇到一个问题,即无法使用描述性函数(如na.rm)来运行该函数。描述性函数是用来处理缺失值的参数,如果na.rm参数设置为FALSE,那么在计算过程中会抛出异常,并不允许包含缺失值或NaN。

解决这个问题的方法是首先确保数据集中不存在缺失值或NaN,或者可以使用其他的处理方法对缺失值进行填充或删除。然后,在调用summarize函数时,将na.rm参数设置为TRUE,这样可以忽略缺失值并继续进行计算。

在腾讯云的产品中,可以使用腾讯云云服务器(CVM)来进行云计算相关的开发工作。腾讯云服务器是基于虚拟化技术构建的云端计算资源,提供了高性能、高可靠性和弹性扩展的计算能力,适用于各种云计算场景。

推荐的腾讯云产品:云服务器(CVM)

腾讯云云服务器提供了多种规格和配置的虚拟机实例,可以满足不同应用场景下的计算需求。用户可以根据自己的需求选择合适的实例类型,进行前端开发、后端开发、软件测试、数据库、服务器运维等工作。

除了云服务器,腾讯云还提供了丰富的云原生产品和服务,包括容器服务、容器注册中心、容器镜像服务等,用于支持云原生应用的开发、部署和管理。

总结:如果无法使用描述性函数运行dplyr的summarize函数,可以尝试将na.rm参数设置为TRUE,同时确保数据集中不存在缺失值或NaN。对于云计算领域的开发工程师来说,可以使用腾讯云的云服务器(CVM)进行相应的开发工作。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

「R」数据操作(七):dplyr 操作变量与汇总

模运算(%/%%%) %/%整除%%取余。 对数 log(),log2()log10() 位移量/偏移量 lead()lag()允许你前移或后移变量的。...summarize()计算汇总值 最后一个关键的动词是summarize(),它将一个数据框坍缩单个行: summarize(flights, delay = mean(dep_delay, na.rm...缺失 你可能会好奇我们先前使用na.rm参数。如果我们不设置它会发生什么呢?...NA #> # … with 86 more rows 我们得到了一堆缺失如果输入不去除缺失,结果必然是缺失。幸运的是,所有的聚集函数都有na.rm参数,它可以在计算之前移除缺失。...sum(x > 10), mean(y == 0) 当与数值函数使用时,TRUE被转换为1,FALSE被转换为0。

2.6K20

教你几招R语言中的聚合操作

在R语言中提供了几种实现数据聚合的常用函数,它们分别是基于stats包中的aggregate函数、基于sqldf包中的sqldf函数以及基于dplyr包中的group_by函数summarize函数。...基于sqldf函数的聚合 ---- 尽管aggregate函数可以非常方便地实现数据的分组聚合,但是它存在两方面的缺点,一个是无法直接对数据集中的单个数值型变量使用不同的聚合函数(除法FUN自定义函数...为了弥补aggregate函数的缺点,使用sqldf包中的sqldf函数是一个不错的选择,它可以允许用户写入SQL语法,并基于SQL实现数据的聚合统计,关于该函数的用法参数含义如下: sqldf(x,...尽管sqldf函数可以借助于SQL语法实现数据的聚合,但是使用函数时容易产生异常错误,例如参数drv的指定错误,就会导致sqldf函数无法生成结果(根据经验,参数drv的设置’SQLite’时,...基于group_bysummarize函数的聚合 ---- 结合dplyr包中的group_by函数summarize函数实现数据的分组聚合可以避开aggregate函数sqldf函数的一些缺点,

3.3K20
  • R数据科学|3.6内容介绍

    上节我们对选择现有的列使用mutate添加新列做了介绍。现在对数据框使用summarize()进行分组摘要进行介绍。...group_by() summarize()的组合构成了使用 dplyr 包时最常用的操作之一:分组摘要。...3.6.2 缺失 聚合函数遵循缺失的一般规则:如果输入中有缺失,那么输出也会是缺失。好在所有聚合函数都有一个 na.rm参数,只需设置na.rm =TRUE,即可在计算前除去缺失。...x[2] x[length(x)] 相同,只是当定位不存在时(比如尝试从只有两个元素的分组中得到第三个元素),前者允许你设置一个默认。...,但如果想要使用加权平均方差的话,就要仔细考虑一下,在基于秩的统计数据(如中位数)上是无法进行这些操作的。

    1K20

    dpois函数_frequency函数

    dplyr时group_by()summarize()是同时使用最常用的工具之一:分组概括。...不幸的是,ggplot2的下一次迭代,ggvis,确实使用了这个管道,但是还没有为黄金时间做好准备。 5.6.2 缺失 您可能想知道我们上面使用na.rm参数。 如果我们不设置它会发生什么?...这是因为聚合函数遵循通常的缺失规则:如果输入中有任何缺失,则输出将是缺失。...与x[1],x[2]x[length(x)]相似,但是如果该位置不存在,则允许设置默认(即,您试图从组中获取第3个元素)只有两个元素)。...当与数字函数一起使用时,TRUE转换为1,FALSE转换为0。这使得sum()mean()非常有用:sum(x)给出x中的TRUE数,而mean(x)给出比例。

    1.8K10

    R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)

    (参考来源:R高效数据处理包dplyrdata.table,你选哪个?) ?...haskey()输出结果:true/false —————————————————————————————————————————————— 二、数据筛选 1、列筛选 .() from_dplyr...DT数据集按照x分组,然后计算v变量的、最小、最大。 (2)dplyr函数利用%>%(链式操作)来改进: 链式操作是啥意思呢?...2、on=""方式 DT[X, on="x"] 这里的on指的是DT变量中的变量名称,X还是按照key,如果没设置就会默认第一行key。...2016-11-28补充: 留言区大神给了一个比较好的选中列的方式,其中主要就是对with的使用: data.table取列时,可以用data[,1,with=FALSE]取data的第一列

    8.6K43

    「R」绘制分组排序点图

    因为研究问题,我最近也想尝试使用改种图形来展示数据。而且,该图可以拓展到任意可以适应的场景下,所以我想基于 ggplot2 来创建一个通用的绘图函数。 ?...使用 如果读者仅仅想使用,请从 Gitee 上安装 sigminer 包,或者拷贝本文最后的函数: remotes::install_git("https://gitee.com/ShixiangWang...下面是一个使用示例,通过构建一个示例数据进行绘图,展示如何传入分组变量变量、分组标签位置、排序以及点的透明度等: set.seed(1234) data <- data.frame( yval...使用 ggplot2 实现这个图我遇到了不少难点,在实现的过程中除了深入理解了 ggplot2,我也同时感受到了它的灵活限制。...我尝试过 geom_ribbon() geom_area() 来实现都不行。我最后使用了 geom_rect(),我是怎么保证矩形画出来的填充跟背景效果一致的?

    1.7K30

    R语言数据处理:飞机航行距离与到达延误时间有什么关系??

    而本文介绍的dplyr包简直就是Hadley Wickham (ggplot2包的作者,被称作“一个改变R的人”)大神我们提供的“数据再加工”神器啊。...is.na(arr_delay)) myFlights 由图可知,我们首先采用is.na()函数找出缺失,再采用逻辑运算符“!...这里要穿插一个排序函数arrange(),默认情况下,升序排列,也可以对列名加desc()进行降序排序。...3.2 应用函数及组合结果 我们使用dplyr包中的summarize()函数,进行数据统计指标的获取及组合。计算出不同目的地的平行航行距离以及平均延误时间。...(%>%是最常用的一个操作符,就是把左侧准备的数据或表达式,传递给右侧的函数调用或表达式进行运行,可以连续操作就像一个链条一样。)

    3.1K40

    数据处理的R包

    MARGIN=2:操作基于列 MARGIN=c(1,2):对行列都进行操作 FUN内置的函数有mean(平均值)、medium(中位数)、sum(求和)、min(最小)、max(最大),当然还包括自定义函数...tidyr包主要涉及:gather(宽数据转为长数据),spread(长数据转为宽数据),separate(多列合并为一列)unite(将一列分离多列) (1)gather 使用gather()函数实现宽表转长表...,语法如下: gather(data, key, value, na.rm = FALSE,···) data:需要被转换的宽形表 key:将原数据框中的所有列赋给一个新变量key value:将原数据框中的所有赋给一个新变量...gender_class是列名转化行后指定的列名, count各列的。 (2) spread spread函数作用gather相反。..., count需要分散的

    4.7K20

    「R」dplyr 列式计算

    ❝在近期使用dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习翻译下...如果你想要通过函数转换列名,可以使用 rename_with()。..._if, _at, _all 「dplyr」 以前的版本允许以不同的方式将函数应用到多个列:使用带有_if、_at_all后缀的函数。这些功能解决了迫切的需求而被许多人使用,但现在被取代了。...我们可以使用数据框让汇总函数返回多列。 我们可以使用没有外部名称作为将数据框列解包单独列的约定。 你如何转移已经存在的代码?...」 的开发者们通过 across() 简化了 「dplyr」 对于一些数据复杂操作的处理逻辑,提高了整体的学习使用效率,让我们使用者更关注于逻辑而非实现上。

    2.4K10

    「R」数据操作(五):dplyr 介绍与数据过滤

    如果你想要在载入tidyverse包后仍然使用这些函数,你需要使用函数的全名stats::filter()stats::lag()进行调用。...,只含TRUEFALSE fctr代表因子,R用它来代表含固定可能的分类变量 date代表日期 dplyr基础 这部分我们学习5个关键的dplyr函数,它可以让我们解决遇到的大部分数据操作问题:...根据选择观察(记录),filter() 对行重新排序,arrange() 根据名字选择变量,select() 根据已知的变量创建新的变量,mutate() 将许多值塌缩单个描述性汇总,summarize...使用filter()过滤行 filter()允许我们根据观测来对数据集取子集。第一个参数是数据框的名字,第二随后的参数是用于过滤数据框的表达式。...解决这种问题的一种有用简写x %in% y。这将选择符合x属于y的行(x是y中的一个)。

    2.5K11

    R语言入门之基本统计量

    描述性统计量 第一部分:使用R语言基本函数进行统计描述 R语言是统计分析而生的,它提供了大量灵活而使用的统计功能,其中最基础的就是一些描述性统计量,主要包括求和、均值、最、方差、标准差...,计算结果sd()一致 #[1] 1.707825 min(a,na.rm = T) #去除NA后再计算最小 #[1] 1 max(a,na.rm = T) #去除NA后再计算最大 #[1]...25% 50% 75% 100% # 1.00 1.75 2.50 3.50 5.00 range(a,na.rm = T) #去除NA后再计算范围,实际上就是同时输出最小最大 #[1]...1 5 除上述基本统计函数之外,R语言还提供大量其它统计函数,例如: summary(a) ,它可以返回各个变量的最小,最大,25%分位数,中位数,75%分位数以及NA的个数(它的计算是自动去除缺失的...第二部分:使用“psych”包进行统计描述 上面的例子都是使用R语言基本函数进行统计描述,实际上R语言里面还有一个很强大的统计包---“psych“,这个R包一开始是计量心理学(Psychometric

    97650

    函数包起来就是一个R包 - 完整开发指南

    如果实际运行的结果期望的不一样,就会报错 最重要的expectation函数有: 测试相等:expect_equal()expect_identical() expect_equal()是基于all.equal...::的时候:已知plyrHmisc包都含有summarize这个函数如果我们先载入了plyr再载入了Hmisc那么在使用summarize的时候就会在Hmisc的namespace中寻找summarize...;相反,如果先载入Hmisc,那么就会使用plyr中的summarize函数,所以为了避免混淆,我们需要使用::来指定搜索的namespace 在NAMESPACE文件中主要使用importsexports...(): 导出可以匹配模式的所有函数 exportClasses(), exportMethods(): 导出所有S4类方法 S3method(): 导出S3方法 4个imports: import(...tags(以@开头) 基本流程: 在.R文件前面加上roxygen注释 运行devtools::document()或者使用快捷键Ctrl/Cmd + Shift + D将注释转化为.Rd文件 查看

    2.3K32

    GMSB文章七:微生物整合分析

    它是一种扩展了单变量方差分析(ANOVA)的技术,允许研究者检验多个响应变量是否受到一个或多个分类自变量的影响。多维数据:MANOVA处理的是多维数据集,即每个观测都有多个响应变量的测量值。...线性模型:它基于线性模型,其中每个因变量可以表示自变量的线性组合加上误差项。假设检验:MANOVA检验的核心是假设检验,主要检验自变量对因变量的总体影响是否显著。...Wilks' Lambda, Pillai's Trace, Hotelling's Trace, Roy's Largest Root:这些都是MANOVA中常用的统计量,用于检验自变量对因变量的影响...], check.names = FALSE) %>% rownames_to_column("sampleid") %>% dplyr::mutate(across(-1, as.numeric)...%>% dplyr::group_by(tax) %>% dplyr::summarise(y = ifelse(mean(y, na.rm = TRUE) > 0,

    9610

    tidyverse:R语言中相当于python中pandas+matplotlib的存在

    / 1.8) 4.5 汇总: summarise() #对数据框调用其它函数进行汇总操作 summarise(mtcars_df,mdisp = mean(disp, na.rm = TRUE)) 4.6...这些函数允许在长数据格式(long data)宽数据格式(wide data)之间进行转换(功能类似于reshape包,但是比reshape更好用,并且可以用于管道%>%连接)。...图片解析参考:https://www.zhihu.com/collection/467554113 #gather(data, key, value, …, na.rm = FALSE, convert...= FALSE) #data:需要被转换的宽形表 #key:将原数据框中的所有列赋给一个新变量key #value:将原数据框中的所有赋给一个新变量value #…:可以指定哪些列聚到同一列中 #na.rm..., drop = TRUE) #data:需要转换的长形表 #key:需要将变量值拓展字段的变量 #value:需要分散的 #fill:对于缺失,可将fill的赋值给被转型后的缺失 stocks

    4.1K10
    领券