腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
提高
pandas
和
apply
语句
的
速度
或
替换
、
、
我有一个几百万行
的
中型数据帧,我发现逐组对列求和非常慢。return pd.Series(x.sum(), index=x.index) summary_df['cost'] = output_df.groupby(['id', 'run'])['cost'].
apply
对于每个run值,有10000个不同
的
id值,即每个run值对应10000个组。run本身包含数百个不同
的
值。这两列都是整数。我读到过,对于中等大小
的
数据<
浏览 27
提问于2021-05-23
得票数 1
回答已采纳
1
回答
Pandas
DataFrame
的
条件级联
、
我正在连接
的
列,并希望
提高
代码
的
速度
。9 str(r.loc['apple']) + ' :: ' + str(r.loc['pear'])+'into result else str(r.loc['apple
浏览 0
提问于2017-02-06
得票数 4
回答已采纳
2
回答
如何用一个函数
替换
字符串数据帧中
的
多个字符
我正在尝试用"“
替换
字符串中
的
一些字符。我正在尝试使用lambda函数来丢弃字符串中不需要
的
字符。请帮我解决这个问题。我
的
示例是: import
pandas
as pd2 Candy-go 3 Bread
浏览 56
提问于2020-12-01
得票数 0
回答已采纳
1
回答
使用基于条件
的
if
语句
填充熊猫数据帧中缺少
的
值
、
、
、
我有一个
Pandas
数据框架,其中缺少一些值。例如,在第542行中缺少纬度
的
值。我
的
目标是基于条件CNTY_CITY_LOC,通过在
Pandas
中应用if elif
和
apply
函数来填补纬度
的
缺失值。在我使用
Pandas
的
apply
函数应用if
语句
后,丢失
的
值将被
替换
,但纬度列中
的
所有其他值都会丢失。我做错了什么?谢谢你
的
帮忙
浏览 3
提问于2022-05-16
得票数 1
回答已采纳
1
回答
Dask groupby
apply
运行
速度
和
Pandas
一样慢
、
、
我希望通过在6核macbook pro上使用Dask dataframe而不是
Pandas
来
提高
性能。然而,Dask
的
执行
速度
与
Pandas
数据帧一样慢,大约需要5分钟。ddf = ddf.set_index(ddf.index, sorted = True) paired = ddf.
浏览 1
提问于2019-07-12
得票数 0
1
回答
在
pandas
系列中如何用Nan
替换
非字符串值?
、
、
我试过用
pandas
.Series.
apply
函数来做这件事,但它认为在大数据量
的
情况下
速度
很慢。有没有更快
的
方法来
替换
值? 这是我尝试过
的
,但在大系列(例如百万个项目)上
速度
很慢。s = pd.Series([1, 2, 3, 'str1', 'str2', 3]) s.
apply
(lambda x: x if type(x) == str else np.nan)
浏览 9
提问于2021-01-28
得票数 1
回答已采纳
0
回答
如何
提高
pandas
dataframe.
apply
()处理大数据
的
速度
、
、
、
= 0:else:merged_df['Decision'] = merged_df.
apply
(func, axis=1)我猜
pandas
.
apply
()比迭代for循环要花更多
的
时间。我
的
数据框有两列,名为GT_x、GT_y
和
,它有"AA“
或
"BB”
浏览 18
提问于2017-06-13
得票数 2
3
回答
将熊猫
的
一个int转换为多个bool列
、
、
、
背景我希望这些特性在我
的
数据框架中被命名为列。我现在
的
解决方案在记忆中爆炸,而且
速度
非常慢。如何
提高
记忆效率?import
pandas
as pddf['some_int'].astype(int).
apply
(bin).str
浏览 0
提问于2017-05-02
得票数 3
回答已采纳
1
回答
加快熊猫滚动窗口
的
速度
、
、
、
、
我想要加速我
的
代码,我使用
pandas
.rolling().
apply
()
的
自定义函数。下面的代码运行得很好,但
速度
非常慢。有没有什么方法可以在应用百万行
的
时候加速。i in [12, 9, 6, 3]: df[f'want_col_{i}'] = df.groupby(['account'])['types'].rolling(window = i).
apply
(lambda x: sum(x ==
浏览 20
提问于2020-12-20
得票数 2
回答已采纳
1
回答
不适用于从日期时间序列中提取日期
和
月份
、
、
我有下面的Series,并希望提取datetime
的
日期。import
pandas
as pd 到目前为止,我能想到
的
唯一解决方案是使用
apply
方法:但是,我注意到对于大型
pandas
dataframe,
apply
方法并不是非常快。在前面的代
浏览 3
提问于2017-05-11
得票数 1
回答已采纳
1
回答
熊猫细胞价值分配
的
最快方法
、
、
我有一个名为calculate_distance
的
函数,它以4个
Pandas
单元为输入,并返回一个新值,我希望将它分配给特定
的
Pandas
单元。如下面的代码所示,这4个输入值动态变化。.iloc[i-1], df['longitude'].iloc[i-1], df['latitude'].iloc[i], df['longitude'].iloc[i]) 有比这个“新手”循环更快
的
方法吗
浏览 0
提问于2018-09-20
得票数 2
回答已采纳
1
回答
Pandas
系列来自If-Then-Else
语句
、
使用if-then-else
语句
(
或
类似
语句
)生成
Pandas
系列
的
最常用方法是什么?,但如果name值是“特殊
的
”,则希望返回一个特殊
的
新标签。我能够使用df.
apply
来处理事情: lam
浏览 4
提问于2017-07-11
得票数 2
回答已采纳
2
回答
每个php都需要一个单独
的
请求吗?
、
我正在努力减少我网站上
的
请求数量(以
提高
页面
速度
)。在一个文件中,我有10个单独php请求
语句
调用10个不同
的
php文件。如果有人能澄清这张表格,我将不胜感激。请注意,我不是一个有经验
的
程序员<e
浏览 1
提问于2014-03-26
得票数 0
3
回答
使用数据帧中
的
np.array索引值更快地设置新DF值
、
我需要根据NumPy数组索引设置新
pandas
df列
的
值,该数组索引也存储在df中。这是可行
的
,但对于较大
的
df,它
的
运行
速度
相当慢。有什么关于如何
提高
速度
的
建议吗?np.random.random((5,5))df['ij']=d
浏览 1
提问于2021-07-14
得票数 1
1
回答
如何在select查询中使用udf进行优化
在视图中,我们编写了5个UDF函数,我用它们来根据select查询中
的
条件查找数据
和
返回值。eng_kpi.udf_ProjectX_Get_Prerequisite_ECRs(EC_Number),'') as [Prerequisite ECRs] 如果我在不使用udf函数
的
情况下运行
浏览 1
提问于2015-06-24
得票数 0
1
回答
Python函数无法删除系列中
的
子字符串
、
、
我试图用
替换
和
剥离函数删除括号内
的
子字符串。parenthesis = '\((.*?)str.replace(parenthesis, '') 然后我尝试了lambda函数,希望能
提高
速度
df['first name']= df['first na
浏览 1
提问于2020-12-13
得票数 0
回答已采纳
4
回答
将嵌套
的
if
语句
替换
为AND
、
我想知道嵌套
的
if是否比AND
语句
更好。我有一个循环,循环运行了很多次,所以我在考虑更快
的
执行
速度
。下面是与我
的
代码具有相同逻辑
的
代码。嵌套
的
if
语句
在循环中。{ { } } 如果我用this And
语句
替换
嵌套
的
if
语
浏览 1
提问于2012-07-06
得票数 5
回答已采纳
2
回答
关于PDO
和
准备好
的
陈述
的
几个问题
、
、
我开始在我
的
应用程序中使用PDO
和
准备好
的
语句
,但是我有一些问题要问专业人士。希望你能帮我!) 我什么时候应该使用准备好
的
语句
?在我
的
整个application?Can中,我使用准备好
的
语句
和
INSERT
的
?,我可以使用插入中有可变列
的
准备
语句
吗?(使用SELECT
或
INSERT),准备
语句
的
速度</e
浏览 0
提问于2011-02-16
得票数 2
1
回答
如何加速
pandas
在numba引擎中应用lambda函数
、
、
、
、
在
pandas
加速
的
情况下,我了解了numba引擎,可以显着
提高
速度
。 在最新
的
例子中,我喜欢使用argsort
和
lambda来获得任意
的
索引,但它似乎相当慢。为什么lambda会使代码变慢?我怎么才能写出合适
的
应用函数而不影响
速度
呢?我甚至在nb.njit中包装了lambda函数,但仍然看不到更多
的
加速。从逻辑上讲,np.argmax
和
np.argsort -1是相同
的
,但np.
浏览 82
提问于2021-08-14
得票数 0
回答已采纳
1
回答
如何高效地遍历此数据帧并使用内置
的
numpy
或
pandas
执行函数?
、
、
、
、
我之前读过this
的
文章,注意到
pandas
应用函数,iterrows
和
for循环是非常慢
和
高效
的
处理
pandas
数据帧
的
方式。我正在对一些文本数据进行情感分析,但使用
apply
会导致高内存使用率
和
低
速度
,类似于this answer中所示。%%time data.merge(data.essay.
apply
(lambda s: pd.Series({'neg':sid.pola
浏览 9
提问于2020-01-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用AI提高对深海物种的识别速度和准确率
最新的 GaN IC 提高了速度、效率和功率密度
这十二个用于Python 数据操作的 Pandas 方法你还不知道?
Python数据预处理:使用Dask和Numba并行化加速
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券