腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
包含
许多
文本
元素
的
dataframe
列
中
提取
部分
字符串
(不
使用
正则表达式
)
、
、
、
、
我有一个
dataframe
,其中有一
列
文本
。很难在其中找到任何
正则表达式
模式。不过,我感兴趣
的
是根据我已经拥有的国家
的
预定义列表
提取
所有国家。我认为这应该不会太难,但是在str_extract
中
找不到方法来做到这一点 下面是一个可复制
的
示例: data <- data.frame (text_column = c("I travelled tocountry_vector <- c("Germany&q
浏览 39
提问于2020-09-18
得票数 0
5
回答
是否有一个
正则表达式
可以在两个斜杠之间和一个特定
字符串
之后找到一个
字符串
?[R]
、
、
我有一个
包含
如下URls
的
列
的
dataframe
:我只尝试将该
列
的
nameofpage
部分
提取
到一个新
列
中
我不知道如何在那个位置
提取
字符串
。
字符串
有时
包含
文字"
浏览 0
提问于2019-03-30
得票数 2
回答已采纳
2
回答
标识分组后查找
字符串
、
、
我
使用
pandas遍历了csv文件
中
几千行杂乱
的
数据。我正在迭代其中一个
dataframe
列
,该
列
通常
包含
相当短
的
完全不同
的
串联客户信息(姓名、位置、客户编号、电话号码等)。客户号码和电话号码之间没有太多可识别的区别,尽管df
列
中
的
大多数行都在电话号码
的
字符串
文本
中
包含
电话标识符,如下所示(其
浏览 2
提问于2019-01-18
得票数 0
1
回答
Power查询
提取
列
文本
,同时保留原始
列
内容?
、
、
、
如何在
不
更改原始
列
的
内容
的
情况下
从
powerQuery
中
的
列
中
提取
文本
?(即复制
部分
字符串
,然后粘贴到新
列
中
) 我正试图清理数据争用
的
应用步骤,目前我必须复制一
列
,
从
复制
的
列
中
提取
文本
,然后重命名该
列
。
浏览 0
提问于2021-08-19
得票数 0
回答已采纳
1
回答
str.contains()在熊猫数据框架
中
的
应用
、
、
、
我是Python和朱庇特笔记本
的
新手,我目前正在学习本教程:。到目前为止,我已经导入了熊猫库和其他一些东西,我制作了一个数据框架'df‘,这只是一个CSV文件
的
公司利润和收入数据。我在理解本教程
的
下面一行时遇到了困难:我理解本教程
的
意义:识别利润变量
包含
字符串
而不是数字
的
所有公司但是我不明白^0-9
的
意义。
浏览 0
提问于2019-09-24
得票数 2
回答已采纳
1
回答
我有一个问题,
正则表达式
提取
与多个匹配
我正在尝试
从
字符串
"60毫升
的
扑热息痛和0.5毫升
的
XYZ“中
提取
60毫升和0.5毫升。此
字符串
是spark
dataframe
中
列
X
的
一
部分
。虽然我能够在
正则表达式
验证器
中
测试我
的
正则表达式
代码来
提取
60ML和0.5ML,但我不能
使用
regexp_extract来
提取</e
浏览 13
提问于2019-02-09
得票数 3
回答已采纳
6
回答
C#
使用
正则表达式
提取
单词
、
、
我已经找到了
许多
示例,说明如何
使用
regex检查,或者如何
使用
正则表达式
分割
文本
。aaaa 12312 <asdad> 12334 </asdad>aaaa 1234 ...... 1
浏览 6
提问于2011-04-05
得票数 3
回答已采纳
1
回答
在
DataFrame
中选择
元素
、
、
我有一个没有
包含
信息
字符串
的
列
标题
的
dataframe
。我希望根据每个单元格
中
的
一个子
字符串
选择单元格
中
的
部分
值,并将这些
元素
包括在列表
中
。数据文件如下所示:1 B[2,9] A[2,1] B[3,7]
从
dataframe
中</e
浏览 4
提问于2020-04-07
得票数 2
回答已采纳
1
回答
从
熊猫系列
中
删除匹配多个
正则表达式
模式
的
字符串
、
、
、
我有一个Pandas
dataframe
列
,其中
包含
需要清除
的
字符串
,这些
字符串
与各种regex模式相匹配。我当前
的
尝试(如下所示)遍历每个模式,创建一个
包含
匹配
的
新
列
,然后循环遍历
dataframe
,在找到
的
匹配处拆分该
列
。然后删除不必要
的
匹配
列
“re”。虽然这适用于我目前
的
用例,但我不禁认为,在熊猫
浏览 4
提问于2016-07-28
得票数 2
1
回答
使用
模式获取特定
的
,以
提取
R
中
字符串
的
特定
部分
、
、
、
、
我有一个
dataframe
,其中
包含
一个"URL“
列
和一个”
从
评论
中
摘录“
列
。我想从网站获得完整
的
评论,而不是得到html代码
的
其余
部分
。我需要R来定位html代码
中
的
解压缩,然后
提取
前一个"”分隔
的
所有
文本
。如下所示:(不需要
的
文本
) (不需要
的
文本
浏览 18
提问于2020-11-04
得票数 0
1
回答
如果条件不满足,为什么带条件
的
np.where不能只处理数据帧
中
的
一行
、
、
、
、
下面是一个示例:0 Hon*da\nCivic 22000 0这正是我需要
的
。但是,如果df只
包含
一行,这不满足条件,我会得到一个错误
浏览 1
提问于2020-05-22
得票数 1
1
回答
在Spark Scala
中
对数组
的
每个成员应用函数
、
、
我在一个数据帧中有一个
列
,它是一个
字符串
数据类型数组。我需要
提取
字符串
的
一
部分
,因此我需要对数组
中
的
每个
元素
应用
正则表达式
。所以我想
使用
scala
Dataframe
API来应用它。regexp_extract($"myString","(\\d+)-(\\d+)",1).cast(LongType) 在数组
的
每个成员上
浏览 20
提问于2021-04-24
得票数 1
5
回答
在groovy中
使用
regex
提取
子
字符串
、
、
如果我在一些
文本
中有以下模式:我想
提取
"Hellow“
部分
,所以我
使用
下面的代码来匹配它:println contentMatcher[0] 然而,我一直得到一个空指针异常,因为
正则表达式
似
浏览 0
提问于2013-07-09
得票数 41
回答已采纳
2
回答
用C++
从
html文件中
提取
纯
文本
、
、
我需要
提取
所有的html
元素
,包括html标签。我只想保留纯
文本
。我被要求用C来做这件事,我
不
鼓励
使用
正则表达式
。如果我
使用
字符串
函数,它只删除分隔符,而不是其中
的
字符串
。我需要创建一个
从
html文件中
提取
纯
文本
的
程序。任何关于如何做到这一点
的
指南都将不胜感激。谢谢!
浏览 0
提问于2013-03-10
得票数 0
1
回答
正则表达式
末尾
的
Php前瞻性断言
、
、
我想写一个带有断言
的
正则表达式
,
从
字符串
unknownstring/55.1
中
提取
数字55,下面是我
的
regex preg_match=\.1)$/', $str, $match); 所以,基本上,我想说
的
是,给我斜杠后面的数字,后面跟着一个点和数字1,在那之后没有字符。但它与
正则表达式
不</e
浏览 2
提问于2014-12-15
得票数 5
回答已采纳
1
回答
使用
JavaScript
从
Html获取
文本
、
、
、
、
需要
使用
JavaScript /NodeJs
从
包含
HTML
的
字符串
中
提取
一个键。我得到一个HTML页面作为一个服务
的
响应,其中
包含
一个需要
提取
的
键,键在标签
中
,页面嵌套很重,即使在转换到JSON之后也没有帮助。 尝试
使用
也
不
获取所有结果
的
正则表达式
(因为有
许多
匹配
的
标记)。标签<em
浏览 1
提问于2018-04-05
得票数 0
回答已采纳
4
回答
提取
带有两个点分隔
部分
的
散
列
标签
的
Regex。
、
我正在尝试创建一个
正则表达式
,以便
从
字符串
中
提取
一些
文本
。我想从urls或普通短信中
提取
文本
,例如:我
的
正
浏览 0
提问于2019-05-29
得票数 2
回答已采纳
1
回答
使用
regex替换Pandas
中
的
整个
列
。
、
首先,我已经看过了关于这个主题
的
其他问题,它们要么对我
的
情况不起作用,要么我只是不理解它们。我在pandas中有一个数据帧,大约有8
列
。第8
列
是我想要
使用
正则表达式
从
该
列
的
每个
元素
中
提取
特定
部分
的
列
。我看到
的
完成此操作
的
代码如下: new[8].replace(r'.*', r'N
浏览 1
提问于2018-12-22
得票数 0
1
回答
正则表达式
验证URL散
列
在Javascript
中
不起作用
、
我有以下代码,用于检查URL散
列
部分
并
提取
查询
字符串
。location.hash.substr(1) : "";所以这里
使用
的
正则表达式
是/^[a-z-_&=\d]*$/,但是如果我有像type=mytype&q=search这样
的
查询
字符串
,它将返回空值如果我
从
正则表达式
中
删除^,它将开始返回查询
字符串</em
浏览 6
提问于2021-06-11
得票数 0
4
回答
使用
python将无序列表标签添加到纯
文本
文件(用于html输出)
如果可能的话,我需要
使用
正则表达式
在长长
的
项目列表周围添加无序列表标记。该
文本
是
从
文本
文件中
提取
的
,并在标记函数中进行处理,该函数
包含
许多
不同
的
正则表达式
,用标记标记替换原始
文本
文件
中
的
某些
元素
。* Item One* Item Three我目前有一个
正
浏览 4
提问于2012-05-23
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Pandas&NumPy进行数据清洗的6大常用方法
干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML
用Python做网页爬虫
数据加载、存储与文件格式
python将一列数据转成字符串并提取前几位
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券