腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
有效地
将
函数
应用于
大型
pandas
系列
?
、
、
我有一
系列
以unix时间为起始日期的
pandas
时间样本。每个时间样本是x*1/ 512,所以时间戳0= 0,时间戳2=1/ 512或0.00195,时间戳3=2/ 512或0.0039。
浏览 18
提问于2019-10-03
得票数 0
回答已采纳
2
回答
熊猫在str
系列
中计数频率
、
、
、
给定类型为str的
Pandas
系列
,我希望得到由str.split返回的结果的频率。例如,给定
系列
我想要def: 1结果。我怎么能拿到这个?编辑:解决方案应该
有效地
处理5000万行的
大型
系列
。
浏览 0
提问于2016-05-02
得票数 2
回答已采纳
1
回答
使用apply
将
系列
存储到
pandas
DataFrame单元格中
、
、
我有一个返回序列的
函数
。我使用apply()
将
函数
应用于
dataframe,并希望
将
结果
系列
存储到数据帧的新列中。'> 2 | 3 | <class '
pandas
.core.series.Series'> 但是,似乎
pandas
想要扩展该
系列
并将
浏览 2
提问于2018-11-30
得票数 0
1
回答
对已分组的
Pandas
系列
索引执行操作
、
我想根据值对
Pandas
系列
进行分组,然后对该
系列
的索引执行聚合操作。熊猫没有认出我经过ser.index。Value': ['a', 'a', 'b', 'c', 'c', 'c']}, index=dti)如果您提议的解决方案是
将
这个
系列
转换成一个DF,那么请注意,在我的实际用
浏览 2
提问于2021-05-13
得票数 0
回答已采纳
2
回答
熊猫的UDF功能需要非常长的时间才能完成大数据
、
、
、
我是PySpark和
Pandas
的新手,我运行以下
Pandas
函数
来混淆包含字符串的列(例如:输入'Luke‘
将
导致'ulek')def jumble_stringrandom.sample(x, len(x))).lower()) 在
浏览 1
提问于2021-08-30
得票数 1
回答已采纳
1
回答
Pyspark管道在
pandas
数据帧上的应用
、
、
、
我有一个pyspark管道(包含估算和一个机器学习模型)和一个
pandas
数据帧。我是否可以在不将其转换为Pyspark dataframe的情况下
将
管道
应用于
此
pandas
数据帧?如果不可能,我
如何
有效地
使用pyspark管道来生成对
pandas
数据帧的预测?
浏览 3
提问于2021-09-13
得票数 1
1
回答
访问传递给apply()的自定义
函数
中先前计算的结果
、
、
我正在使用Python中的
Pandas
,在将自定义
函数
应用于
一个
系列
时,我希望访问前面的计算结果。大致如下: previous_result = value print(series.ap
浏览 4
提问于2017-01-21
得票数 3
回答已采纳
1
回答
如何
有效地
将
pandas
.Timestamp
函数
应用于
完整的数据/列?
、
、
、
许多功能已经简化,以便
有效地
应用于
列,而不是单个单元格/行。其中一个
函数
是to_datetime()
函数
,我在后面的问题中使用它作为示例。我感兴趣的特定
函数
是
函数
,但在
pandas
.Timestamp类(可能还有其他熊猫类)中有大量符合这种描述的
函数
,而且文档很少。是否有一种
有效地
将
这些
函数
广播到一整列数据中的方法?如果是的话,我将
如何
做到? 注意:我知道我可以使用app
浏览 3
提问于2020-12-17
得票数 2
回答已采纳
1
回答
正在提取
pandas
timedelta实例属性,天
、
、
、
、
我有一个由
pandas
timedelta组成的
pandas
Series,ages。现在,如果我编写以下代码:age[0].days,它会像这样打印:218我写了这段代码来做这件事,但是运行它会输出错误。range(len(age)):输出:我查找了错误,它提到了我使用lists...what的错误含义,以及
如何
将</em
浏览 0
提问于2018-05-22
得票数 1
1
回答
pandas
_udf给出了与pyarrow相关的错误
、
、
、
、
.|2020-03-03| 我正在使用
pandas
_udf,并且apache箭头已启用。from pyspark.sql.functions import col,
pandas
_udfspark.conf.set("spark.sql.execution.arrow.pyspark.fallback.enabled", "true") lat_long_udf = <
浏览 30
提问于2020-08-31
得票数 0
回答已采纳
1
回答
用用户提供的列表从熊猫df中删除停止词组
、
、
、
、
我有一个raw_corpus,正在尝试用用户定义的stoplist删除秒词(我编辑了nltk英语秒表文件)。我的塞字文件一定有问题吧? 这是我的密码:stoplist="/User/dlhoffman/nltk_data/corpora/stopwords/english"raw_corpus['constructed_recipe'] = raw_corpus['constructed_rec
浏览 2
提问于2018-01-24
得票数 0
回答已采纳
1
回答
通过在所有相邻值上运行一个
函数
来制作一个熊猫
系列
、
、
我有一个熊猫
系列
,s1,我想要制作一个新的
系列
,s2,通过应用一个
函数
,它需要两个输入来创造一个新的价值。此
函数
将
应用于
s1上的2值窗口.由此产生的
系列
s2应该比s1少一个值。我的
系列
包括以弦乐表示的音高。import
pandas
我想使用这个<
浏览 2
提问于2016-04-14
得票数 0
回答已采纳
3
回答
`json.loads()`和`.apply(json.loads)`有什么区别?
、
我对编码非常陌生,现在我正在尝试处理来自kaggle的TMDB_5000数据集。[{"cast_id": 242, "character": "Jake Sully", "credit_id": "5602a8a7c3a3685532001c9a", "gender": 2, "id": 65731, "name": "Sam Worthington", "order": 0},
浏览 0
提问于2018-11-11
得票数 0
回答已采纳
1
回答
给给定数组设置一个
系列
、
、
、
、
如何
有效地
将
熊猫
系列
(或索引级别)降至给定数组(
系列
,索引),即将该
系列
中的每个元素x映射到地板数组中的最大元素y,从而使y <= ximport
pandas
as pd # the
浏览 1
提问于2020-02-20
得票数 1
回答已采纳
2
回答
如何
在python中保存大的数组,使其占用更少的内存?
、
我是python的新手。我有一个很大的数组a,它的维数是(43200, 4000),我需要保存它,因为我需要它用于将来的处理。当我尝试用np.savetxt保存它时,txt文件太大,我的程序运行到内存错误,因为我需要处理5个相同大小的文件。有没有办法节省大量的数组,使其占用更少的内存?
浏览 4
提问于2013-09-11
得票数 10
回答已采纳
1
回答
错误'Series‘对象不能解释为整数,我不知道我该怎么做
我的代码: datos=pd.read_csv('/Users/rafaelsuarez/Documents/Data/UCELL.csv', sep=','
浏览 0
提问于2021-10-19
得票数 0
1
回答
函数
在大熊猫效率独特价值中的应用
这是一个关于
如何
在熊猫中
有效地
应用
函数
的一般性问题。我经常遇到需要将
函数
应用于
pd.Series的情况,而且只将该
函数
应用于
唯一值会更快。mf['qtr'] = pd.Index(mf['date']) + pd.offsets.QuarterEnd(0) 但对于
大型
数据集,这可能需要一段时间。因此,为了加快速度,我
将
提取date的唯一值,<em
浏览 2
提问于2015-07-09
得票数 5
1
回答
如何
改变ASCII标志的特殊标志?
、
你知道
如何
将
“łźą”这样的特殊标志换成“lza”的ASCII标志吗?我试着使用unidecode,就像互联网建议的那样。import
pandas
as pd history = pd.read_csv('history.csv', encoding='unicode_escape
浏览 6
提问于2022-08-22
得票数 0
1
回答
用乘数法计算分组滚动累积和
、
我想计算一列乘以
Pandas
DataFrame中的常数后的滚动累积和。例如,鉴于该
系列
:000012.25该
系列
需要对一个组进行计算,例如: pd.DataFrame该
系列
将
只包含0或1作为值,而1
将
只在本
系列
中出现一次。因此,任何计算在之前的级数1之和都是1。
浏览 5
提问于2020-04-23
得票数 0
回答已采纳
2
回答
如何
将
混合字节/字符串的
pandas
.Series转换/解码为字符串或utf-8
、
、
、
我想在两个可能的情况下解决这个问题: 目前用于:b.str.decode('utf-8') 给出字符串已经在UTF-8中的NaNs。或者他们是自动ASCII?我可以在error中给出decode参数,以便字符串保持“未解码”状态,
浏览 0
提问于2019-08-05
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
Pandas 初学者代码优化指南
pandas指南:做更高效的数据科学家
Python使用pandas使数据可视化笔记
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券