腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
将新列添加到Pandas
DataFrame
,并用来自同一df的另一列
中
的第一个单词填充
、
、
、
我有格洛斯特郡警察报告的2011-16年的犯罪
数据
。这是我导入到Pandas
数据
帧
中
的.csv文件。我想将这些
数据
按其相关的城镇/城市进行分组,例如‘'Gloucester','Tewkesbury',忽略每个城市
中
的特定LSOAs。理想情况下,我会向
dataframe
追加一个新列,只复制其中的地名,并对其进行分组。我对
如何
进行分组很满意,但首先不是新的专栏。任何关于
如何
做到这一点的建议都将受到感谢。
浏览 3
提问于2017-04-23
得票数 0
1
回答
如果regex不能匹配,
如何
返回null?
、
我在Scala中
使用
了spark 2.4。我
使用
regexp_extract()
从
数据
中
提取
相关字段:我有一个样本
数据
:我
使用
以下
正则表达式
提取
字段\;\&]+)regexp_extract("foo/
浏览 6
提问于2022-07-27
得票数 0
1
回答
python
使用
regex创建新列
、
、
、
我正在尝试
从
Python
dataframe
中
的现有列创建一个新列。"A-Z*A-Z.{9}“
浏览 12
提问于2019-11-21
得票数 1
回答已采纳
2
回答
用于清除名称的
正则表达式
、
我有两个名字的
数据
。
dataframe
更长,但我
使用
top3作为示例。JOSEPH W. JOHNAAMIR, DENNIS MABAD, FARLEY J 我需要
提取
这两个dfs
中
的名字,
如何
在一个
正则表达式
中
提取
它们可以用Python编写两个
正则表达式
代码来<e
浏览 1
提问于2020-10-08
得票数 1
回答已采纳
3
回答
将
数据
分割成几个
数据
、
我有一个基于regex搜索的
数据
文件,我需要分割成几个
数据
格式。搜索没有固定的模式,即有时有一个单一的
正则表达式
,有时是几个的组合。下面是一个只
提取
了一组行的最小示例:Age <- c(20, 30, 31, 33)注意,我正在将一些行
提
浏览 0
提问于2018-10-24
得票数 3
回答已采纳
1
回答
如何
在Julia
中
从
单列
DataFrame
中
提取
column_name字符串和
数据
向量?
、
我能够
使用
正则表达式
提取
我想要的向量的列,但是现在我想从该
DataFrame
列中
提取
一个包含列名的字符串和一个包含
数据
的
DataFrame
。
如何
构建下面的f和g?其他方法也很受欢迎。julia> df =
DataFrame
("x (in)" => 1:3, "y (°C)" => 4:6) Row │ x (in) y (°C
浏览 28
提问于2021-09-24
得票数 2
回答已采纳
1
回答
Spark 2 Python重命名列并设置列
数据
类型
、
、
我
使用
DataFrame
读入HDFS文件,并
使用
正则表达式
提取
数据
。是否可以在不单独重命名或转换列的情况下重新定义
DataFrame
的模式?我的计划是将
DataFrame
转换为RDD,然后
使用
模式将RDD转换回
DataFrame
。 我不确定这是不是一个好主意。
浏览 4
提问于2018-08-06
得票数 0
回答已采纳
3
回答
如何
从
dataframe
名称中
提取
信息并基于该名称创建列
、
下面是一些表示我拥有的
数据
的模拟
数据
: var1 = c('a', 'bvar1 = c('a', 'b', 'c', 'd', 'e'),我需要在每个
数据
帧
中
添加一个列,该
浏览 1
提问于2020-07-06
得票数 1
回答已采纳
1
回答
我有一个问题,
正则表达式
提取
与多个匹配
我正在尝试
从
字符串"60毫升的扑热息痛和0.5毫升的XYZ“中
提取
60毫升和0.5毫升。此字符串是spark
dataframe
中
列X的一部分。虽然我能够在
正则表达式
验证器
中
测试我的
正则表达式
代码来
提取
60ML和0.5ML,但我不能
使用
regexp_extract来
提取
它,因为它只针对第一个匹配。因此我只得到了60毫升。你能给我推荐
使用
UDF的最好的方法吗?
浏览 13
提问于2019-02-09
得票数 3
回答已采纳
1
回答
如何
通过
正则表达式
删除基于相同索引的唯一字符
、
、
在学习的过程
中
,其中一个问题是在哪里
使用
正则表达式
来
提取
值。 我想知道,如果在每一行中都相同并且匹配相同的索引位置,我们
如何
实现
正则表达式
来删除所有字符。下面是
DataFrame
: print(df)0 [b,e,c]2 [a,b,c]
正则表达式
: df.column1.str.extract(r'(\w,\w)') column1 0 b,
浏览 22
提问于2021-08-18
得票数 1
回答已采纳
1
回答
如何
使用
正则表达式
从
DataFrame
中
提取
数据
?
、
、
我正在尝试更正
DataFrame
中
的
数据
,但面临着值替换问题。原始值以“31^”或"54_“的格式出现,我需要它以整数的格式出现,例如31.54 frame = pd.
DataFrame
({'first': [123, '32^'], 'second': [23,
浏览 75
提问于2021-11-17
得票数 0
回答已采纳
2
回答
熊猫,str.extract多重表达错误- ValueError:错误的项目数通过5,放置意味着1
、
、
、
、
我
使用
熊猫str.extract方法,并在模式中
使用
了多个
正则表达式
。str.extract似乎不喜欢多个
正则表达式
。我
如何
使用
‘或’与
提取
?以下是有关
数据
的摘录:13/01/2020 - AM06/01/2020 -\r10/01/202002/12/2019
浏览 3
提问于2020-01-04
得票数 1
1
回答
使用
Python
中
的
正则表达式
提取
产品代码并应用于列
、
我有一个包含多个列的pd.
DataFrame
,其中一个列具有
从
web中
提取
的url,例如:我
使用
正则表达式
提取
产品代码,如下所示但是,如果我尝试复制到整个
数据
集(其中有多个列)
浏览 0
提问于2018-11-19
得票数 0
2
回答
在Python
中
的
数据
帧行中
提取
regex匹配而不是组
、
、
我是一个编码新手,我通常
使用
R来实现这一点(stringr),但我开始学习Python的语法。我想根据regex模式在
数据
框架中生成第二列,其中只包含第一列
中
的一些单词。,columns=['Test']) 现在,为了
提取
我想要的(大写词),在R
中
,我通常
使用
: df <- str_ex
浏览 1
提问于2019-04-22
得票数 1
回答已采纳
4
回答
使用
regex将URL
提取
到新的
数据
帧列
中
。
、
、
我想
使用
regex
从
dataframe
中
的文本中
提取
所有URL到一个新列
中
。我有一些较旧的代码,用于
提取
关键字,因此我希望将代码调整为
正则表达式
。我想将
正则表达式
保存为字符串变量,并在这里应用: data$ContentURL <- apply(sapply(regex, grepl, data$Content, fixed=FALSE), 1,function(x) paste(selection[x], collapse=&
浏览 6
提问于2014-10-21
得票数 6
回答已采纳
1
回答
正则表达式
在import.io
中
不执行任何操作
我正在尝试弄清楚
如何
在import.io上
使用
正则表达式
。我有一个HTML列,成功地
从
网页上的链接拉取
数据
。我只想
提取
链接上的查询字符串的一部分,所以我转到regexp字段并输入一个
正则表达式
,该
正则表达式
在regex101.com上测试成功。问题是,
提取
的
数据
根本不会改变。实际上,我可以在regexp字段
中
输入完全胡言乱语,这对
提取
的
数据
完全没有影响。我有点困惑
浏览 0
提问于2015-10-07
得票数 0
1
回答
在python
中
只
提取
年份而不是日期
请有人用代码帮助只
提取
年份,并将其设置为
数据
中
的一个新列,
使用
上面所附照片中的python。当我尝试时,结果没有一致性,它给了我不同的值。它同时
提取
年份和日期,而不仅仅是年份。我认为今年是第二个角色。我
使用
了不同的代码,但它不起作用。我试过
使用
下面的代码 df_movies['
浏览 0
提问于2022-12-01
得票数 0
1
回答
基于不同列的过滤器
从
Pandas
DataFrame
中
提取
文本
、
、
我想创建一个名为"my_new_col“的新列,它只在State列= "Idaho”时才
从
"Text“列中
提取
单词"Lime”。Oregon","Idaho","Oregon"], 'Text': ["Lime Light","New Egg","Lime Inc","Monteray","NovaDing"]} df = pd.
DataFra
浏览 20
提问于2021-02-10
得票数 0
回答已采纳
1
回答
一个起始词和多个结束词之间的Pandas
DataFrame
提取
、
、
我想编写一个
正则表达式
,
使用
str.extract
从
Pandas
DataFrame
中
提取
模式,该表达式
提取
在开始单词和以两个可能的结束单词之一结束的模式之间找到的第一个匹配。如果末尾只有一个停用词,如示例1所示,则str.extract
中
的以下
正则表达式
有效。但是我
如何
组合两个停用的单词呢? R‘(?s)开始(.*?)STOP\s+WORD’
浏览 16
提问于2021-07-17
得票数 1
回答已采纳
1
回答
如何
将所有
从
网站抓取的
数据
保存在pandas
数据
帧
中
?
、
、
、
我已经写了一个代码,
从
网页抓取联系信息
使用
BeautifulSoup和一个预先设计的库CommonRegex,这基本上是
正则表达式
刮美国地址information.While我能够
提取
的信息是在一个列表的形式,并将其转换为熊猫
数据
帧,我不能保存在一个列表
中
存在的所有值。df.phones(link.get_text()) for i in df1: dfr = pd.
DataFram
浏览 8
提问于2020-04-23
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python中如何使用正则表达式提取数据
python网络爬虫:正则提取爬虫结果,教你如何使用正则表达式
如何对 dataframe中的某一列数据 开根号呢?
【WPS神技能】如何从Excel表格中快速提取不重复数据?
Excel如何从混乱数据中提取邮箱
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券