首页
学习
活动
专区
圈层
工具
发布

dplyr强大的分组汇总

在现实生活中我们经常会遇到非常多需要分组汇总的情况,单个的汇总价值不大,只有分组之后,才能看出差异,才能表现出数据的价值。...dplyr为我们提供了group_by()函数,主要使用group_by()对数据进行分组,然后再进行各种计算,通过和其他操作进行连接,发挥更加强大的作用。...group_by() 查看分组信息 增加或改变用于聚合的变量 移除聚合的变量 联合使用 summarise() `select()`/`rename()`/`relocate()` arrange()...,还可以根据现有变量的函数进行分组,这样做类似于先mutate()再group_by()。...查看分组信息 group_keys()查看用于分组的组内有哪些类别,可以看到species有38种: by_species %>% group_keys() ## # A tibble: 38 x 1

1.9K30

【R语言】rep函数生成差异表达分组变量

前面给大家介绍了☞【R语言】rep函数的使用,今天我们来举几个数据分析中的应用,例如差异表达分析时,样本类型变量,我们就可以使用rep函数来生成。...我们再来看几个例子 假如我们的样本类型是下面这样的,交替排布的 normal tumor normal tumor normal tumor rep(c("normal","tumor"),3) 再比如多出一个...】因子在临床分组中的应用 我们不用敲完整的样本类型名字,用数字来代替,然后再用factor转回来。...方法三、登堂入室,活学活用 我们联合使用,strsplit函数+factor函数 在方法二中,我们相当于还是要用c()先创建一个数值向量,逗号还是要敲的。...参考资料: ☞【R语言】rep函数的使用 ☞ GEO芯片数据差异表达分析 ☞【R语言】R中的因子(factor) ☞【R语言】因子在临床分组中的应用

71910
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    零基础学会python编程——输入 输出函数与变量

    ---- 一.输入与输出函数 在 Python 语言中,输入与输出函数是最基本的两个函数。输入函数是 input,输出函数是print。接下来将详细讲解这两个函数的用法。...2.input 函数 在程序中,输入和输出像是一对孪生兄弟,既然有输出函数,那么就一定有输入函数。Python中的输入函数是 input。input 函数通过键盘获取输入内容,并将运算结果返回。...第 1 行:使用input 函数获取用户输入内容,并把输入结果赋值给变量a。 第 2 行:使用 print 函数输出变量a的值。...【例 2-7 】 在shell 模式下输入如下程序。 第1 行:创建一个变量 a,并赋值 100。 第 2 行:使用type函数查看变量a的类型。 第3行:输出变量a的类型为 int,即整数类型。...1.单行注释 Python 中使用单行注释非常简单,只需在需要注释的内容之前加上“#”即可。当解释器看到“#”(字符串中的“#”除外),则忽略这一行代码中“#”后面的内容。

    73320

    MySQL高级篇-容易忽略的核心内容变量

    在MySQL数据库的存储过程和函数中,可以使用变量来存储查询或计算的中间结果数据,或者输出最终的结果数据。   在MySQL数据库中,变量分为系统变量以及用户自定义变量 。...会话期间,MySQL服务实例会在MySQL服务器内存中生成与该会话对应的会话系统变量,这些会话系统变量的初始值是全局系统变量值的复制。...如下图: 全局系统变量的特点:针对所有会话都有效,但是不能跨重启。 会话系统变量的特点: 针对当前会话有效,当前会话对某个会话系统变量值的修改,不会影响其他会话同一个会话系统变量的值。...#查看指定的系统变量的值 SELECT @@global.变量名; #查看指定的会话变量的值 SELECT @@session.变量名; #或者 SELECT @@变量名; 举例: # 查看系统全局变量...局部变量只能在存储过程和函数中使用。

    91020

    R语言之数值型描述分析

    cont.vars dplyr::select(birthwt, age, lwt, bwt) 接下来,先计算这 3 个变量的描述性统计量,然后按照母亲吸烟情况(smoke)分组考查描述性统计量。...psych 包里的函数 describe( )可以计算变量忽略缺失值后的样本量、均值、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、全距、偏度、峰度和均值的标准误等。...例如,计算变量 bwt 在母亲不同吸烟情况下的均值,可以输入: tapply(birthwt$bwt, INDEX = birthwt$smoke, mean) # no 3055.69565217391...psych 包里的函数 describeBy( )也可以分组计算与函数 describe( )相同的统计量,例如: describeBy(cont.vars, birthwt$smoke) 函数 describeBy...实际上,在第 3 章介绍的 dplyr 包里的函数 group_by( )和 summarise( )就能非常灵活地计算分组统计量。

    56020

    C语言 第二章 数据类型、变量和输入函数

    一、数据类型简介 在 C 语言中,数据类型指的是用于声明不同类型的变量或函数的一个广泛的系统。变量的类型决定了变量存储占用的空间,以及如何解释存储的位模式。...一个变量应该有一个名字,也就是我们程序员给该空间取的名──叫变量名。 它在内存中占据一定的存储单元。 变量定义必须放在变量使用之前,即先定义后使用,一般都放在函数体的开头部分。...变量:在程序运行过程中可以变化的量。 常量:在程序运行过程中不可以变化的量。...=99.5f; 错误,变量定义必须放在变量使用之前,即先定义后使用,一般都放在函数体的开头部分 //同时定义多个变量 char a,b,c; //同时定义多个变量并赋值...:%d",age); } } scanf("格式控制",地址列表); “格式控制”的含义同printf函数; “地址列表”是由若干个地址组成的表列,可以是变量的地址,或字符串首地址 %f 单精度

    1.1K50

    R语言数据处理:飞机航行距离与到达延误时间有什么关系??

    数据分析有一半以上的时间会花在对原始数据的整理及变换上,包括选取特定的分析变量、汇总并筛选满足条件的数据、排序、加工处理原始变量并生成新的变量、以及分组汇总数据等等。...1.dplyr包的安装加载与示例数据准备 1.1 安装dplyr包 脚本输入代码: install.packages("dplyr") #加载dplyr包 library(dplyr) 1.2安装 nycflights13...包,该软件包中的飞机航班数据将用于本文中dplyr包相关函数的演示。...2.3 删除缺失数据 我们采用dplyr包中的filter()函数,进行缺失数据的删除。脚本输入代码: myFlights 分组 dplyr包里的分组是由group_by()函数实现的,脚本输入代码: by_dest <- group_by(myFlights, destination) class(by_dest

    3.5K40

    【Python】字符串 ⑦ ( input 字符串输入 | input 函数自带提示参数 | input 函数接收的变量类型 )

    ; 使用 input 语句 , 可以 从命令行获取一个数据 , 使用 变量 可以接收该数据 ; 执行 input 代码后 , 命令行会在当前阻塞 , 等待用户输入 , 用户输入完毕后 , 即可将输入的数据保存到...变量中 ; 如下代码中 , 执行 input 后等待用户输入 , 用户输入的数据会由 name 变量接收 ; name = input() 二、代码示例 ---- 在下面的代码中 , 执行 input...() 函数 , 阻塞等待用户输入 , 用户输入后 , 将输入的数据保存到 name 变量中 , 然后再使用 字符串 快速格式化 , 将 name 变量打印到 命令行中 ; 代码示例 : print("请输入名字...三、input 函数自带提示参数 ---- 在 input 中 , 可以传入一个字符串参数 , 作为 用户输入的提示信息 ; input( "输入提示信息" ) 如下代码示例中 , 使用下面两行代码 ,...注意 , 在上述参数中 , 添加 \n 换行符号 , 否则提示信息不会自动换行 ; 四、input 函数接收的变量类型 ---- 使用 input 接收的用户输入的数据 , 类型自动为 字符串类型 ;

    1.8K30

    13.1 函数中的变量

    函数中的变量 在函数中,我们可以看到也进行了变量的使用,那函数中的变量和函数外的变量到底有什么区别呢? 1.1....全局变量的定义 声明在函数外面的变量,可以在文档的任意地方使用这个变量,我们称为全局变量 关于全局变量,使用方式如下 # 定义在函数外部的变量 name = "tom" # 直接使用全局变量 print...,在函数中name输出jerry # 但是,在函数外部,我们重新打印name的值,发现name的值还是tom # # 此时:函数中的name是局部变量,函数外部的name是全局变量 # 如此诡异的情况...,首先描述一下错误出现的条件 1.如果函数中没有声明和全局变量名称一致的局部变量,函数中直接使用全局 变量的值,不会出现错误 2.如果函数中,一旦在任意位置定义了和全局变量名称一致的局部变量,函数中...局部变量 声明在函数内部的变量,只能在函数内部使用,函数执行结束这个变量就会被回收,我们称为局部变量。

    1.9K20

    R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

    dplyr 包的 distinct() 函数可以对数据框指定若干变 量,然后筛选出所有不同值,每组不同值仅保留一行。...offset 表示忽略n个。忽略最后一个即表示选择倒数第二个。 2.6 arrange 按照数据框里的某列或某几列,对所有行进行排序。...在 dplyr 包的 rename() 中用 “新名字 = 旧名字” 格式修改变量名,如: d2.class % dplyr::rename(h=height, w=weight...R 数据整理(六:根据分类新增列的种种方法 1.0) 其他函数 slice dplyr 包的函数 slice(.data, ...) 可以用来选择指定序号的行子集,正的序号表示保留,负的序号表示排除。...dplyr 包的 summarse_at() 函数可以指定一批变量名与一批统计函数,自动命名结果变量,如: d.cancer %>% summarise_at( c("v0", "v1"), list(

    12.1K30

    函数的变量+返回值

    函数的变量: 局部变量 和 全局变量 Python中的任何变量都有特定的作用域 在函数中定义的变量一般只能在该函数内部使用,这些只能在程序的特定部分使用的变量我们称之为局部变量 在一个文件顶部定义的变量可供文件中的任何函数调用...,这些可以为整个程序所使用的变量称为全局变量 (1)、局部函数: #!...y y = 1 fun() print x print y 输出结果: 211 211 1 (5)、函数变量 #!...输出结果: {'y': 1, 'x': 11} 函数的返回值: 函数被调用后会返回一个指定的值 函数调用后默认返回None 指定return 来返回一个值 返回值可以是任意类型 一旦return执行后...设计一个函数,接收一个英文单词,从文件中查询该单词的汉语意思并返回

    7K40

    来增加dplyr的可操作性

    dplyr包在数据变换方面非常的好用,它有很多易用性的体现:比如书写数据内的变量名时不需要引号包裹,也不需要绝对引用,而这在多数baseR函数中都不是这样的,比如: library(tidyverse)...的这种易用性是有代价的,假如想要对分析工作稍微增加一些编程属性时,就会发现dplyr的异常情况,比如将分组变量赋值给一个变量,使用变量来进行分组: ### 分组变量group_var无法完成工作 group_var...辅助dplyr完成编程工作 上面的例子中,之所以group_var不起作用,是因为dplyr直接将group_var当做变量名,然后去mtcars中寻找名字叫做group_var的列,这肯定是会报错的。...为了可以让它执行,我们可以需要告诉dplyr,先对group_var求值,获得真正的分组名:gear,使用gear进行后续操作,这个先求值的操作可以通过!!运算符来完成。...,首先map逐一将分组变量group_v的元素传递给mean_manual函数,传入mean_manual时,先使用!!

    2.8K31

    R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)

    ()函数设置 setkey(dt,a) setkey(DT, colA, colB),可以使得检索和分组更加快速。...2、按条件行筛选 从前用subset的方式进行筛选比较多, new=14,select=a:f) (1)单变量 现在data.table与dplyr from_dplyr =..., -State) dplyr中是arrange函数,而data.table是setorder函数,同时降序的方式。...DT数据集按照x分组,然后计算v变量的和、最小值、最大值。 (2)dplyr函数利用%>%(链式操作)来改进: 链式操作是啥意思呢?...%>%的功能是用于实现将一个函数的输出传递给下一个函数的第一个参数。注意这里的,传递给下一个函数的第一个参数,然后就不用写第一个参数了。在dplyr分组求和的过程中,还是挺有用的。

    10.5K43

    R语言之 dplyr 包

    这个包以一种统一的规范更高效地处理数据框。dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。 下面以 MASS 包里的 birthwt 数据集为例,介绍 dplyr 包里常用函数的用法。...group_by( ) 不会改变数据框的外观,而会改变它与其他 dplyr 动词函数的作用方式 。...as_tibble(birthwt) 下面我们将会看到,把函数 group_by( ) 和 summarise( ) 联合使用能方便地对变量进行分组统计。 7....使用传递符 %>% 组合多个操作 我们经常需要对一个数据框做一系列的操作,后面一个操作的输入需要用前一个操作的输出结果。...race = factor(race, labels = c("white", "black", "other"))) # 第二步把数据框 birthwt1 按照变量 race 分组,把分组后的对象命名为

    87420
    领券