当其他几个列中的值为真(或1)时，使用mutate()创建新列 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据处理第2节：将列转换为正确的形状

它涵盖了操纵列以便按照您希望的方式获取它们的工具：这可以是计算新列，将列更改为离散值或拆分/合并列。...转换列：基础部分您可以使用mutate（）函数创建新列。 mutate中的选项几乎是无穷无尽的：你可以对普通向量做任何事情，可以在mutate（）函数内完成。...mutate中的任何内容都可以是新列（通过赋予mutate新的列名），或者可以替换当前列（通过保持相同的列名）。最简单的选项之一是基于其他列中的值的计算。...在动态创建函数时，通常需要一种方法来引用要替换的值：这是.符号。...如果我想在几分钟内完成，我可以使用mutate_at（）并将包含列的所有'sleep'包装在vars（）中。其次，我在飞行中创建一个函数，将每个值乘以60。

8.1K3 0

tidyverse数据清洗案例详解

对key进行计数，我们可以得到一些有关值结构的提示： who1 %>% count(key) ? 其中key的具体含义，查阅可得：每列的前三个字母：新、旧病例。之后两个字母：结核的类型。...函数主要参数: cols选取的列； names_to 字符串，指定要从数据的列名中存储的数据创建的列的名称。 values_to 字符串，指定要从存储在单元格值中的数据创建的列的名称。...values_drop_na 如果为真，将删除value_to列中只包含NAs的行。...默认情况下，当separate()看到非字母数字字符(即不是数字或字母的字符)时，它将分割值。可以用里面的参数sep。比如：sep='_'。...他还有一个功能,当sep=2时，可通过第二个位置进行分割，使用在省份市级，等数据上。

1.6K1 0

您找到你想要的搜索结果了吗？

是的

没有找到

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险收益可视化

当我们需要更新此模型或扩展到 5 因素案例时，可以节省时间。看看 FF website. 数据被打包为 zip 文件，所以需要做的不仅仅是调用 read_csv()。...使用tempfile() 基础 R 中的函数来创建一个名为 temp. 这是我们将放置压缩文件的地方。 temp <- tempfile() R 创建了一个名为的临时文件 temp 。...还将FF数据转换为十进制，并创建了一个名为R\_excess的新列，保存高于无风险利率的收益。...我们的模型对象现在包含一个 conf.high 和 conf.low 列来保存我们的置信区间最小值和最大值。...因此，市场因素在该模型中占主导地位，而其他两个因素的置信区间为零。 ---- 本文摘选《R语言Fama French (FF) 三因子模型和CAPM多因素扩展模型分析股票市场投资组合风险/收益可视化》

3.9K3 0

生信代码：数据处理（ tidyverse包）

dplyr包下主要是以下几个操作: select()——选择列 filter/slice()——筛选行 arrange()——对行进行排序 mutate()——修改列/创建列 summarize(...1 mutate() mutate（）与基础函数transform（）相似，都可以添加新的一列，但是允许引用刚刚创建的列： mydata 1=c(2,2,6,4),...) ##选取1，2列 df %>% select(name,score) df %>% select(-3) ##同样也可以用start_with 或 end_with筛选出具有前缀或者后缀的列 df...，如果后续要使用到，需要保存下来 5 arrange() R base包中涉及到排序的包括 sort()，rank()，order()，而在dplyr包中与排序相关的是arrange()包，默认是从高到低进行排序...，我们如果对个人或者科目感兴趣的话，可以使用group_by（name或者type），然后利用summarize函数就可以求出分类之后的各个统计值。

2.1K1 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

2.6 arrange 按照数据框里的某列或某几列，对所有行进行排序。可以使用 desc 产生倒序，或写入多个列使其按照多个列进行排序。...2.10 表格的拆分与合并将同一列中的内容分为两列内容。或将两列内容合并为同一列内容。首先还是可以创建一个数据框。...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...3 b c 使用unite，可以将两列“合并”为一列。...对于即将合并的新列，需要使用引号；但对于想要合并的多个列名，可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用的分割符。

10.9K3 0

R数据科学|3.5内容介绍及习题解答

上节我们对选择现有的列进行了介绍与习题解答，现在对数据框添加新列进行介绍，这里使用mutate()函数，注意：mutate()总是将新列添加在数据集的最后。...创建新变量的多种函数可供你同mutate()一同使用。...偏移函数：lead()和lag()函数它们可以返回一个序列的领先值和滞后值。它们可以计算出序列的移动差值（如）或发现序列何时发生了变化（）。它们与group_by()组合使用时特别有用。...在这种情况下，时间的差异应该是24小时(1,440分钟)。有些航班跨越时区，总飞行时间将以小时(60的倍数)为间隔。所有航班都是从纽约起飞的，都是美国国内航班。...#> [1] 2 4 6 5 7 9 8 10 12 11 当两个向量相加时，R会将较短向量的值，生成与较长向量相同长度的向量。

2.6K5 0

使用dplyr进行数据转换

• 使用现有变量的函数创建新变量(mutate())。 • 将多个值总结为一个摘要统计量(summarize())。函数的使用方法： (1) 第一个参数是一个数据框。...(2) 随后的参数使用变量名称(不带引号)描述了在数据框上进行的操作。 (3) 输出结果是一个新数据框。...filter 1.使用filter()筛选行 filter(flights, month == 1, day == 1) 2.其他比较运算符、>=、<、<=、!...11, 12)) 如果想要找出延误时间(到达或出发)不多于2小时的航班，那么使用以下两种筛选方式均可: filter(flights, !..., -(year:day)) mutate 使用mutate()添加新变量 flights_sml <- select(flights, year:day,ends_with("delay

9721 0

csvtk：高效命令行版极简dplyr

filter2 按照数学表达式筛选，约等于 lunix 中的 awk，复杂版 + join 按照字段合并多个文件，类似于 linux 的 join split 按照某列值拆分文件，也就是分组保存为多个文件...+ mutate 对某一列进行正则表达处理增加新的一列 mutate2 对多列进行 awk 类似的字符和数学表达式处理，增加新列 + gather 类似于 dplyr 中的 gather() 函数，数据...： csvtk plot hist csvtk plot box csvtk plot line csvtk 示例因为篇幅的原因，这里仅展示几个使用示例，更多更详细的内容可以直接参考爪哥写的使用文档。...使用 mutate2 可以按照复杂运算快速添加新的内容，支持的操作和 filter2 一致。...所以，如果你在使用过程中有什么问题和需求，不妨去给他提几个 issue，没准他一顺手就实现了你的想法。

3.7K6 0

「R」dplyr 行式计算

按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单，当它与 rowwise() 结合时，它也可以简便地操作汇总一行多列。...，我们县创建一个行式数据框： rf % rowwise(id) 我们然后使用 mutate() 添加一个新的列，或者使用 summarise() 仅返回一个汇总列： rf %>% mutate...它们允许你避免显式的循环和/或使用 apply() 或 purrr::map 家族函数。...[1] 3 1 注意，这种魔力只适用于引用现有列时，而不适用于创建新行。...()——runif()返回多个值，而mutate()表达式必须返回长度为1的值。

6.2K2 0

「R」dplyr 包使用

()函数会对列进行处理，并且创建新的列表，简单来说就是把向量作为输入值，输出单个数值。...(.tbl, .cols, .funs, ...)把函数应用到数据框指定的列举例：vars(-Species)表示除了这列，对其他的进行运算 > mutate_at(iris, vars(-Species...y中其他列的内容根据索引组合上去。...bind_rows(..., id = NULL) id是增加的新列的名字 intersect(x, y, ...)取得同时出现在x和y两个数据框中的行 ?...union(x, y, ...)整合出现在x数据框中或y数据框中的，去除了两个数据框中重复的部分，想要保留重复的话使用union_all() ?

1.1K2 0

R 数据整理（六：根据分类新增列的种种方法 1.0）

也就回到了开始创建的数据框test。 separate&&unite 将同一列中的内容分为两列内容。或将两列内容合并为同一列内容。首先还是可以创建一个数据框。...对于待分离的对象（col），不必加上引号；但对于即将创建的新列（into），需要使用引号，由于是两列，这里使用向量创建。sep参数设定读取表格信息时以何符号作为分隔符。...对于即将合并的新列，需要使用引号；但对于想要合并的多个列名，可以不用使用引号。sep 参数设定多列合并后不同数据分隔使用的分割符。...everything 可以实现对列的自定义排序。其语法逻辑为，去掉指定的列后，筛选其他的列。...) [1] TRUE 小进阶 count 计算向量或数据框中某列的重复值，并返回不同信息及它们重复的次数。

2.1K2 0

tidyverse：R语言中相当于python中pandas+matplotlib的存在

；查看数据时，不再会一行显示不下（会自动隐藏一部分，自带head）；有两种方式来创建tibble格式的数据： 1....其他格式转化，使用as_tibble转换为tibble格式 > dft_1 <- as_tibble(mtcars) > dft_1 # A tibble: 32 x 11 mpg cyl...#key：将原数据框中的所有列赋给一个新变量key #value：将原数据框中的所有值赋给一个新变量value #…：可以指定哪些列聚到同一列中 #na.rm：是否删除缺失值 widedata 为字段的变量 #value：需要分散的值 #fill：对于缺失值，可将fill的值赋值给被转型后的缺失值 stocks <- data.frame( time = as.Date...：unit() #unite(data, col, …, sep = “_”, remove = TRUE) #data：为数据框 #col：被组合的新列名称 #…：指定哪些列需要被组合 #sep：组合列之间的连接符

4.2K1 0

R语言第二章数据处理⑤数据框列的转化和计算目录正文

正文本篇描述了如何计算R中的数据框并将其添加到数据框中。一般使用dplyr R包中以下R函数： Mutate（）：计算新变量并将其添加到数据表中。它保留了现有的变量。...Mutate_at（）/ transmutate_at（）：将函数应用于使用字符向量选择的特定列 Mutate_if（）/ transmutate_if（）：将函数应用于使用返回TRUE的谓词函数选择的列...my_data %>% mutate(sepal_by_petal_l = Sepal.Length/Petal.Length) transmute：通过删除现有变量来创建新变量，删除现有列，添加新列...tbl：一个tbl数据框 funs：由funs（）生成的函数调用列表，或函数名称的字符向量，或简称为函数。predicate：要应用于列或逻辑向量的谓词函数。...选择predicate为或返回TRUE的变量。

4.2K2 0

17. R编程（三：运算符、控制语句、基本函数）

| 表示或，只有一个条件成立就返回真&表示与，必须所有条件均满足才返回真 2. if 条件语句 if 基本句只要if 随后的条件句返回为TRUE，则其后的语句则会被执行。...表示各种与 EXPR 可能输出值的绑定语句。当... 中的某个丛句与EXPR值相等时，便会输出丛句对应的值。因此switch 常用于for 循环的遍历打印。...我们可以创建一个空列表，让每次循环输出的值作为一个元素添加到列表中。使用 do.call 语句我们可以对列表进行 cbind ，将其拼接在一起。...x对应的值为down； #a>1 且b的值为up； #其他情况，x对应的值为no load("deg.Rdata") x1 1)&(deg$b<0.05) x2...table(x)) # 6.将x添加到deg数据框中，成为新的一列 deg mutate(deg, x) load("deg.Rdata") deg <- cbind(deg,x) load("deg.Rdata

8141 0

两个神奇的R包介绍，外加实用小抄

新建一个数据框并赋值给bioplanet这个变量（赋值符号列值，这里列名要加双引号。这里涉及的几个给列填充数值的函数有 rep，重复，括号中填要重复的字符和重复次数。...这是一种组织表格数据的方式，提供了一种能够跨包使用的统一的数据格式。有多统一？每个变量（variable）占一列，每个情况（case，姑且这么翻译）和观测值（observation）占一行。...expand（列出每列值所有可能的组合，天哪我是写到这里的时候刚看懂的！）来看示例 ? ? 我是看到了结果才知道我干了啥的喂。就是选中的列中的值各种组合，成为一个新表。...Sampleid select(frame3,contains("n")) #列名包含n的列 select(frame3,starts_with("a")) #以a开头的列 5.mutate 根据原有的列生成新的列...这是根据相同的列名进行合并，当在两个表格中列名不一样时，需要在括号内加 by=c("col1"="col2") 其中col1和2分别是在两个表格中的需合并的列名 semi_join，anti_join

2.5K4 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...然后我们将展示一些其他动词的使用。...) # df 每列乘以 mult 对应列的值 df %>% mutate(across(all_of(names(mult)), ~ .x * mult[[cur_column()]])) #> #...n, sd)) #> n x y #> 1 3 1 4.041452 其他动词到目前为止，我们聚焦于 across() 和 summarise() 的组合使用，但它也可以和其他「...我们可以使用没有外部名称作为将数据框列解包为单独列的约定。你如何转移已经存在的代码？

2.4K1 0

数据分析：多诊断指标ROC分析

数据分析：多诊断指标ROC分析介绍pROC::roc函数能够使用一个指标（predictor）去区分两个或多个分组（response），并计算95%置信区间的原理基于以下几个关键点：ROC曲线：ROC曲线是一种图形表示...这样，可以使用逻辑回归或其他分类方法来估计预测指标（predictor）的概率。排序和阈值：pROC::roc函数根据预测指标的概率对样本进行排序，并计算在每个可能的阈值下模型的TPR和FPR。...index：用于预测的指标列的名称。group：包含响应变量（如“健康”或“癌症”）的分组列的名称。group_names：一个向量，包含group列中的所有可能的组名。...创建一个新的数据框（tibble），包含ROC曲线的类型（带有标签的AUC和CI）、敏感性（sensitivities）和特异性（specificities）。...将三个结果的数据框合并，并使用dplyr::mutate和factor函数调整type列，以确保所有的类型按照相同的顺序排列。这有助于后续在同一图形上统一展示。

2381 0

生信技能树- R语言-day7

duplicated(mm)] 提取没有重复的第一次出现的mutate，数据框新增一列mutate(test, new = Sepal.Length * Sepal.Width) new是新产生的列名新加之后...，如果没有赋值，那么这个数据框还是没有新加，没有赋值，就没有产生补充select（）filter（）如何简化连续的步骤1....")#a1 且b的值为down；#a>1 且b的值为up；#其他情况，x对应的值为nok1 = deg$a 1 & deg$b 1的所有行向量/列表的隐式循环-lapplylapply(list, FUN, …)对列表/向量中的每个元素实施相同的操作lapply(1:4,rnorm)两个数据框的链接merge可以合并inner_join...left_join(test1,test2,by="name")right_join：右连接，以右边的为准right_join(test1,test2,by="name")表达矩阵画箱线图当x和y没有名字可以简写表达清楚的时候

1040 0

R语言的综合应用-1

= c("jimmy 150","nicker 140","tony 152") #这是好几个字符串组成的一个向量str_split(y," ")str_split(y," ",simplify =...#2.distinct，数据框按照某一列去重复distinct(test,Species,.keep_all = T)类似与unique（给向量去重复）#3.mutate，数据框新增一列mutate(test..., new = Sepal.Length * Sepal.Width)注意，这样操作结束后，test还是原来的列数，因为没有给新的赋值。....#1if(){}if(){}else{}if(一个逻辑值，不可以是多个逻辑值组成的向量){CODE1}else{CODE2}当（逻辑值是TRUE时），{运行CODE1}当（逻辑值是FALSE时），{运行...x为逻辑值或逻辑值向量；yes为逻辑值为TRUE时的返回值；no为逻辑值为FALSE时的返回值例如：x = rnorm(3)xifelse(x>0,"+","-")#3ifelse()+str_detect

9320 0

R语言快速入门主线知识点分享|文末有资源

:12 ############ 引用 ############ x[1,4] # 值引用 x[行索引,列索引] # 行/列引用 x[行索引,] 或x[,列索引] x[1,] # 引用第一行...列索引] # [1] 4 # > # 行/列引用 x[行索引,] 或x[,列索引] # > x[1,] # 引用第一行 # [1] 1 2 3 4 # > x[,4] # 引用第一列 #...TRUE | TRUE TRUE | FALSE #xor异或：当对应元素不等时返回TRUE xor(T,F) #返回TRUE xor(T,T) xor(F,F) # 所有为真T...& FALSE # [1] FALSE # > # | 或 # > TRUE | TRUE # [1] TRUE # > TRUE | FALSE # [1] TRUE # > #xor异或：当对应元素不等时返回...1] TRUE # > any(F,F) # [1] FALSE options(digits=3) # 设置有效数字 NA # 缺失值 ##### dplyr包的下述五个函数用法 filter

8292 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭