有没有办法在R中结合使用str_detect和group_by？

在R中结合使用str_detect和group_by是可以的。str_detect是字符串处理函数，用于检测字符串中是否包含指定的模式。group_by是数据分组函数，用于按照指定的变量对数据进行分组。

结合使用str_detect和group_by可以实现在分组的数据中检测特定模式的字符串。具体操作如下：

首先，加载必要的包，例如tidyverse包，其中包含了str_detect和group_by函数。

library(tidyverse)

创建一个数据框，例如df，包含需要进行分组和字符串检测的变量。

df <- data.frame(
  group = c("A", "A", "B", "B"),
  text = c("apple", "banana", "cat", "dog")
)

使用group_by函数按照group变量对数据进行分组。

df_grouped <- df %>% 
  group_by(group)

使用str_detect函数在分组的数据中检测包含特定模式的字符串，例如检测是否包含字母"a"。

df_filtered <- df_grouped %>% 
  filter(str_detect(text, "a"))

在上述例子中，df_filtered将只包含包含字母"a"的字符串的分组数据。

关于R中的str_detect函数和group_by函数的更详细信息，可以参考以下链接：

str_detect函数介绍：https://dplyr.tidyverse.org/reference/str_detect.html
group_by函数介绍：https://dplyr.tidyverse.org/reference/group_by.html

请注意，以上答案仅供参考，具体实现可能会因为具体情况而有所不同。

相关·内容

示例：在H5中使用video结合canvas来录制视频和上传

2.将 video里的视频帧展示在 canvas 上。 3.录制 canvas 上的绘制的内容并生成字节blob 包。..._mediaRecorder.ondataavailable 的回调方法中追加保持字节。...blobURL =" + blobURL); uploadFile(fullBlob); } }// end initMediaRecorder 方法：开始和停止动画...答：使用 cancelAnimationFrame() 接收一个参数 requestAnimationFrame默认返回一个id，cancelAnimationFrame只需要传入这个id就可以停止了。

2.6K2 0

【钱塘号】用R语言爬取美国总统的twitte进行数据分析

Twitter R包是对twitter数据进行文本挖掘的好工具。本文是关于如何使用Twitter R包获取twitter数据并将其导入R，然后对它进行一些有趣的数据分析。...注册后你将收到一个密钥和密码：获取密钥和密码后便可以在R里面授权我们的应用程序以代表我们访问Twitter：根据不同的搜索词，我们可以在几分钟之内收集到成千上万的tweet...分词之后可以得到相关twitter的高频词汇，然后将其可视化除此之外，还可以结合数据中的时间戳数据和地理数据进行可视化分析推特和FB其实也是科研讨论的重镇...在WordCloud里，就会显示在推特上，讨论的最多的和lncRNA有关的词汇。比如：表达，变化，剪切，模式，肿瘤等等，说实话是没有什么特别大的用处哈。...情感分析安卓和 iPhone 推文在情感上也有很大的差异，让我们来量化一下。

2.4K7 0

用R语言爬取美国新总统-川普的twitte进行数据分析

2.8K5 0

stringr2

stringr2 sunqi 2020/8/13 概述 str_detect:用来匹配字符中的字母，返回布尔值 str_count()：匹配字符，返回匹配的个数正文 rm(list=ls()) library...(stringr) x <- c("sunqi", "wanglong", "lisi") str_detect(x, "i") ## [1] TRUE FALSE TRUE # str_count..."1234", "B246", "217C", "2357f", "21WD4") ) str_match_all(x, "\\d") ## [[1]] ## [,1] # 求tibble中每个单元格中数字的和...unnest(num) %>% # 对提取的的数字转换为数字 mutate_at(vars(num), as.numeric) %>% # 按照x分组计算和 group_by(x)...## 1 1234 10 ## 2 217C 10 ## 3 21WD4 7 ## 4 2357f 17 ## 5 B246 12 结束语随着数据量越来越大，R语言对于内存的需求也越来越大

4662 0

在Win10中使用Linux版本的R和Python

” 写在前面相信在Windows中使用 Python 和 R 小伙伴为数不少，虽然 Python 和 R 并不挑平台，但是总还有一些情况 Linux 版本更有优势，这些情况包括： R 在 Linux...此时一个常见的折衷办法是使用虚拟机，不过虚拟机本身也很有很多问题 ” 虚拟机资源开销巨大。...解决那么有没有什么办法可以让我们同时享受 Linux 带来的效率和 Window 给我们带来的便捷呢？...” Okay，那就让我们直接进入正题：和在Win10中使用Linux版本的R和Python 启用 Linux 子系统 1....你已经成功在 Linux 子系统中创建了一个 Jupyter 服务器并且在 Windows 中直接访问了！安装 R （Linux）大猫强烈推荐使用微软的 Microsoft R Open。

6.3K3 0

你以为川普的推特都是他自己写的？数据可不这么认为！

数据证明，安卓端和iPhone发的推分别是两个人所写的。而且发推时间，使用标签，加链接，转发的方式也截然不同。同时，安卓端发的内容更加激烈和消极。...安卓手机： 500 多条推文没有双引号，200 多条有双引号 iPhone：几乎没有双引号与此同时，在分享链接和图片时，安卓和 iPhone 也大不相同。...str_detect(text, '^"')) %>% count(source, picture = ifelse(str_detect(text, "t.co"), "Picture/link...情感分析安卓和 iPhone 推文在情感上也有很大的差异，让我们来量化一下。...但据报道，上任后的川普必须使用一部由美国特工处认证的安全加密手机，以替换他之前使用的安卓系统手机。据称前总统奥巴马就无法通过安全手机发推文，那使用安全手机后，川普还能继续愉快的“推特治国”吗？ ?

1K6 0

TidyFriday R 语言中桑基图的一些画法。。。

is.na(City)) %>% dplyr::filter(stringr::str_detect(City, "[一-龥]+")) %>% select(prov = Province, city...使用 sankeywheel 绘制介绍桑基图画法的教程当然首先要介绍我自己写的 R 包啦，我有一个 sankeywheel 包可以用来绘制桑基图，其实我在探索微信好友数据的那个教程里面已经介绍过了这个...R 包的使用，这里重复下： library(sankeywheel) df %>% group_by(prov, gender) %>% count() %>% ungroup() ->...大家一定注意到这个图存在很严重的标签重叠问题，有两个解决办法：解决文本标签重合的方法 1: ggrepel::geom_text_repel ggplot(pg, aes( axis1 = prov...使用 echarts4r 绘制这个也蛮好用的： library(echarts4r) df_count df_count %>% e_charts(width = "100%", height =

1.3K2 0

在 R 中实现 Excel 的功能

许多 R 的新用户在金融、市场、商业分析等领域有丰富的行业经验，但是他们并没有太多的编程背景，所以日常工作中还是选择 Excel、PowerBI 这些传统的工具进行工作；tidyquant 的作者意识到了这些痛点...，于是他在新版本中加入了好多 Excel 的特性，如果你是 Excel 的重度患者，又想体验 R 强大的数据处理和可视化功能，那么本文再合适不过了！...Excel 中使用 VLOOKUP 是想在一个表中添加列，这列的值要去另一个表中查找，在 R 中怎么做呢？...在 R 中实现各种「IFS」函数很多同学喜欢 Excel 是因为它的条件筛选功能，比如SUMIFS(), COUNTIFS(), AVERAGEIFS()等； ? 在 R 中如何实现呢？...tidyverse 它可以处理异常复杂和庞大的数据，这是 Excel 所不具备的，你还可以结合 ggplot 和 shiny 做出很多 BI 类的应用，去 tidyquant 的官网尽情探索吧！

2.5K3 0

文献复现-单细胞揭示新辅助治疗后NSCLC的免疫微环境变化

NMPR患者中：癌细胞表现出雌激素代谢酶的过表达和血清雌二醇升高。...在所有患者中，治疗促进了细胞毒性T细胞和CD16+NK细胞的扩增和活化，减少了免疫抑制性Treg，并将记忆CD8+T细胞激活为效应表型。...S100P：与钙离子结合的蛋白质，参与细胞增殖、迁移和侵袭等生物学过程，也可能与多种癌症的发生和发展有关。 #4. PCNA：是细胞周期中S期的细胞核蛋白，在DNA复制和细胞增殖过程中起重要作用。...CX3CL1是一种细胞因子，也被称为神经内皮炎性因子1（N-TAC），它是一种趋化因子，在炎症和免疫反应中起着重要作用。它与免疫细胞的迁移和炎症反应相关，同时也参与神经发育和神经保护。 #2....它参与睾酮、雄激素和孕激素的代谢转化，同时还具有抗氧化和抗炎活性。在某些癌症中，AKR1C3的过度表达与抗药性和肿瘤的恶性进展有关。

1.2K1 1

R语言批量生成CaseWhen的解决方案

近期写R代码，经常用dplyr::case_when结合stringr::str_detect进行条件判断。...痛点：判断条件可能会改或增删，全写在case_when里，代码冗余且不利于复制和维护，stackoverflow找了一圈，没发现好的解决方案，干脆自己写了一个通用代码以自动生成批量case_when判断...)") fx <- eval(parse(text=x2)) fx({ { x}})} 需要用到的包： library(purrr) library(stringr) 使用示例...'(an)|(ch)','contains an or ch' ) 或者写在Excel里，然后复制单元格，用conditions <- clipr::read_clip_tbl()读进R...如果想改条件，在conditions里放肆增删改，改完再跑一遍allCaseWhen即可。没有写默认条件，因为没必要，可以用coalesce()处理。以上。

6012 0

R语言行筛选的方法--filter

上篇是数据框中列的筛选（R语言列筛选的方法--select），本次讲解行的筛选，主要是介绍filter函数。 1....数据这里，使用asreml分析中的BLUP值为例，相关的模型为： m1 = asreml(Phen ~ G , random = ~ vm(Progeny,ainv) + vm(Dam,ainv) +...「提取目的：」提取加性效应的BLUP值，显性效应的BLUP值和母体效应的BLUP值提取BLUP值大于0.1的个体 2....filter结合其它函数，也可以进行行的筛选。...如果想对ID中，包含ainv的行，进行筛选，可以这样操作： re3 = blup2 %>% filter(str_detect(ID,"ainv")) %>% arrange(-effect) head

5.7K3 0

表达芯片数据分析1

rep(c("Disease","Normal"),each = 10) }else if(T){ # 第三种方法，使用字符串处理的函数获取分组 k = str_detect(pd$title,...下一行代码里的列名是从colnames(b)的输出结果里复制的 ids2 = b[,c("ID","Gene Symbol")] colnames(ids2) = c("probe_id","symbol") #和R...str_detect(ids2$symbol,"///");table(k2) ids2 = ids2[ k1 & k2,] # ids = ids2 #使用方法二需要将42行F改为T，55...rep(c("Disease","Normal"),each = 10) }else if(T){ # 第三种方法，使用字符串处理的函数获取分组 k = str_detect(pd$title,...str_detect(ids2$symbol,"///");table(k2) ids2 = ids2[ k1 & k2,] # ids = ids2 #使用方法二需要将42行F改为T，55

4823 0

单细胞文章复现-抗PD-1免疫治疗联合雄激素剥夺治疗可诱导转移性去势敏感前列腺癌的强免疫浸润

根据前列腺肿瘤标志物基因（如KLK3）的表达，以及使用淋巴细胞和髓系细胞作为拷贝数正常参考的推断拷贝数变异分析，确认三群上皮细胞均为肿瘤细胞。...12), legend.title= element_text(size= 12)) + guides(fill=guide_legend(title = "Tissue")) 在骨转移中...在所有组织中，CD8 T细胞和常规（非Treg）CD4细胞占很大比例。...theme(plot.title = element_text(size=20,hjust=0.5)) p2 } poplot(sce_bone,'Bone') 在骨转移中...，抗PD-1增加了CD8 T细胞浸润到转移部位的程度(骨、肝和肺转移是这样的趋势)，而单独使用 ADT时无法观察到。

3411 0

R 数据整理（八： stringr 处理字符串数据）

（其实R 也提供了nchar 的方法）拆分与组合拆分需要注意的是，提取拆分后的元素需要使用 [[]] 双括号选择。...> length(x2) [1] 8 合并 collapse 设定合并向量中内容使用的分隔符。...str_c(x2,collapse = " ") collapse 参数设定分离的元素结合成一个字符串分离的符号。还可以将两个向量中的元素，或向量和另外一个字符串进行合并。...ppple" "7+a" "3+ppple" 提取字符串 str_sub(string, start = 1L, end = -1L) ，从start 到end，为提取的string 中字符在字符串中的位置...> sum(str_detect(x2,"h")) [1] 4 > mean(str_detect(x2,"h")) [1] 0.5 提取匹配字符将向量中符合要求的元素提取为一个新的向量。

1.1K3 0

懒癌必备-dplyr和data.table让你的数据分析事半功倍

接下来，我就为大家分享几个我在工作当中最常用来做数据分析用到的包，dplyr和data.table，我保证你get到这两个包后，就再也不想用R里面自带的基础包函数进行数据分析了！！...（贼笑中） dplyr包 R语言中最为重要的包（之一）！它可以让数据分析功能更加强大，代码更加简洁。你可以随心所欲的操作它，使用它获取你想要的数据，而且它的语法非常简单，非常直白。...找到合适的packages并学习使用它，绝对会让我们数据分析工作事半功倍！我们有没有发现dylyr包中函数使用的一些规律？有的！...以上这段代码我们使用group_by和summarise的结合实现了对数据集分组分析，并进行统计量计算的一个功能。...data.table把我们刚刚用group_by和summarise组合才能实现的功能，直接在一句代码里面就实现了，而且代码的可读性和可扩展运用性非常强！

2.4K7 0

教你几招R语言中的聚合操作

前言 ---- 在数据处理和分析过程中，可能会涉及到数据的聚合操作（可理解为统计汇总），如计算门店每天的营业总额、计算各地区的二手房的平均价格、统计每个消费者在近半年内最后一笔交易时间等。...在R语言中提供了几种实现数据聚合的常用函数，它们分别是基于stats包中的aggregate函数、基于sqldf包中的sqldf函数以及基于dplyr包中的group_by函数和summarize函数。...基于group_by和summarize函数的聚合 ---- 结合dplyr包中的group_by函数和summarize函数实现数据的分组聚合可以避开aggregate函数和sqldf函数的一些缺点，...而且使用起来也非常的方便和快捷。...：指定数据库中的哪些变量需要用作分组变量； add：bool类型的参数，是否在已分组的数据框上再添加group_by的分组设置，默认为FALSE；summarise(.data, ...) .data：

3.3K2 0

从零开始的异世界生信学习 GEO数据库数据挖掘--GEO代码-芯片数据分析-1

', getGPL = F) ##getGEO函数可以下载到工作目录下和读取GSE文件， class(eSet) length(eSet) eSet = eSet[[1]] 图片在GEO数据库网页中可以查看数据的基本信息...array芯片数据才可以用此代码分析图片 GEO文件下载并读取到R中为只有一个元素的list 在列表中取子集后得到"ExpressionSet"结构数据，为"Biobase"包中的数据形式 #(1)提取表达矩阵...因子：在R语言中类别变量（名义型）以及有序类别（有序性）变量称为因子。...，查看R包中哪部分是所需要的注释，R包无法自动补齐，注意 ids <- toTable(hgu133plus2SYMBOL) ##使用toTable函数加载R包中的SYMBOL，并生成数据框 head...str_detect(ids2$symbol,"///");table(k2) ## ids2 = ids2[ k1 & k2,] # ids = ids2 } ##GPL网站下载的表格文件中可能存在多余的行

9712 0

文本挖掘和情感分析的基础示例

我们需要了解的问题是：在TripAdvisor评论中，随着时间的推移，哪些词的频率在增加？...在评论中，哪些词的频率在下降？...在我们的案例中，我们的目的是确定评论者（即酒店客人）对他过去对酒店的体验的看法。这种可能是判断或评价。评论中最常见的正面和负面词汇。 reviews % filter(!...所以我们需要进行下一步：使用Bigrams在情感分析中提供语境我们想知道单词前面有“not”这样的单词的频率。...那么，在我们的数据中，哪些词在错误的方向上做了最大的“贡献”呢？

5.2K1 0

【R语言】dplyr对数据分组取各组前几行

所以在画图的时候，也需要区分这三类。下面这张表就是GO富集分析得到的结果，我们可以根据ONTOLOGY这一列来分组，就可以得到BP，CC和MF三个组。...，三类都有方法二、使用top_n #使用top_n r2=GO_result %>% group_by(ONTOLOGY) %>% top_n(n=-5,wt=p.adjust) r2 这里可以使用...方法三、使用slice_head #使用slice_head r3=GO_result %>% group_by(ONTOLOGY) %>% slice_head(n=5) r3 方法四、使用slice_min...会根据指定的p.adjust有小到大排序，然后取每组前5行方法五、使用group_modify结合head #使用group_modify r5=GO_result %>% group_by(ONTOLOGY...) %>% group_modify(~ head(.x, 5)) r5 方法六、使用filter #使用filter r6=GO_result %>% group_by(ONTOLOGY) %>%

1.8K2 1

生信代码：数据处理（ tidyverse包）

大家在学习R语言的时候，大多参考《R语言实战》这本书，但这本书年代过于久远（中文第二版是2016年），主要着力点也是在R base上，R语言可视化的ggplot2包也只是简要介绍，而对于tidyverse...结合，分组对原数据框进行处理。...同样也可以用start_with 或 end_with筛选出具有前缀或者后缀的列 df %>% select(start_with("n")) 3 filter() filter()是对数据行方向的选择和筛选...，需要保存下来 5 arrange() R base包中涉及到排序的包括 sort()，rank()，order()，而在dplyr包中与排序相关的是arrange()包，默认是从高到低进行排序，如果变换排序顺序则可以使用...() group_by可以对原数据框进行分组计算，例如对于我们本文中的数据框，我们如果对个人或者科目感兴趣的话，可以使用group_by（name或者type），然后利用summarize函数就可以求出分类之后的各个统计值

2K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云