腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
正确
使用
pandas
矢量化
?
、
、
、
、
根据an article的说法,vectorization比apply a函数到
pandas
dafaframe列要快得多。但我有一个特殊的例子,就像这样: import
pandas
as pd AttributeError: 'numpy.ndarray' object
浏览 8
提问于2019-01-31
得票数 0
回答已采纳
2
回答
在
pandas
数据帧中插入sklearn CountVectorizer的结果
、
、
、
我有一堆14784个文本文档,我正在尝试对它们进行
矢量化
,这样我就可以运行一些分析。我
使用
sklearn中的CountVectorizer将文档转换为特征向量。vectorizer = CountVectorizer其中examples是所有文本文档的数组 现在,我正在尝试
使用
其他功能为此,我将这些特性存储在一个
pandas
数据帧中。目前,我的
pandas
数据帧(不插入文本特征)具有形状(14784, 5)。我的
浏览 0
提问于2016-11-02
得票数 14
2
回答
向量化& ValueError,但不是从“或”和“和”操作符
、
、
、
、
这个很好地解释了
如何
解决在
使用
条件时出现的ValueErrors,例如“或”而不是“\”和“和”而不是&。当尝试用一个函数
使用
矢量化
时,
使用
a.empty、a.bool()、a.item()、a.any()或a.all()“来进行
矢量化
。具体来说,在这种情况下,映射和应用工作得很好,但是
矢量化
仍然会抛出ValueError。
浏览 2
提问于2021-02-09
得票数 1
回答已采纳
1
回答
需要python库来更新大型Excel文件的数据透视表
、
我已经尝试
使用
Openpyxl来更新有透视表的Excel文件,我得到内存错误。我
使用
了优化的阅读器(link - )并将read_only设置为false,但仍然收到内存错误
浏览 0
提问于2020-12-15
得票数 0
1
回答
提高大熊猫群的性能
、
当我编写它时,我最初在
Pandas
DataFrames上进行了数据处理,但是当这导致了糟糕的性能时,我最终用普通的Python重写了它,
使用
的是for循环,而不是
矢量化
的操作,列表和切分,而不是DataFrames令我惊讶的是,用vanilla编写的代码的性能最终远远高于
使用
Pandas
编写的代码。由于我的手工编码的数据处理代码比原来的
Pandas
代码要大得多,而且更加混乱,所以我还没有完全放弃
使用
Pandas
,而且我目前正在尝试优化
Pand
浏览 1
提问于2017-11-20
得票数 37
回答已采纳
1
回答
为什么我不能在我的数据框架中迭代一个新列?
、
、
、
我已经创建了一个数据框架的价格,移动平均线,现在列'maX‘,突出当2个移动平均线交叉;Date 11/24/2009 88.97 89.07 88.36 88.50 NaN Na
浏览 2
提问于2017-05-17
得票数 0
回答已采纳
1
回答
Pandas
中日期时间转换的问题
、
、
、
、
date"].apply(lambda s: datetime.strptime(s, '%Y-%m-%d %H:%M:%S%z')))[1]))类“datetime.datetime”
如何
使用
apply函数(或类似的函数)获得datetime.datetime对象?
浏览 2
提问于2019-01-04
得票数 2
1
回答
pandas
中的loc是
使用
向量化逻辑还是
使用
for循环?
、
我
使用
loc函数访问
pandas
中的行,如下所示: pdf.loc[pdf.a>2] 这是
矢量化
的吗?它比
使用
numpy更好吗 pdf[pdf.a>2]
浏览 11
提问于2019-04-27
得票数 0
2
回答
[
pandas
]有没有更快或更简单的计算累积旅行距离的方法?
、
、
、
、
(实际代码更为复杂import time, math, random x = [random.randint(0,100) for我认为如果长度较大,
使用
像上面这样的熊猫计算会因为for迭代而变得更慢。 有没有比我想象的更快或更简单的计算方法?谢谢!
浏览 2
提问于2021-01-22
得票数 1
1
回答
使用
列名和行索引从
pandas
数据框中选择值的
正确
方式是什么?
、
使用
列名和行索引(我指的是行号)从
pandas
数据框中选择值的最有效方法是什么?我想想出一个更快/更少的内存不足的解决方案,因为这实际上是一些用户可以同时
使用
的web应用程序。 非常感谢。
浏览 7
提问于2019-11-09
得票数 1
回答已采纳
1
回答
如何
将TfidfVectorizer的输出输入到LinearSVC分类器中?
、
、
我试图在Scikit学习中
使用
LinearSVC构建一个线性分类器。我决定
使用
TF-下手
矢量化
来实现文本输入的
矢量化
.我写的代码是:vectorizer = TfidfVectorizer我遇到的问题是: 主要问题是:
如何
获得测试
浏览 1
提问于2019-03-17
得票数 1
2
回答
将列类型更改为int64
pandas
geopandas最佳实践
、
、
、
最终我
使用
了:我想知道这是不是熊猫的最佳实践,与相比又
如何
?
浏览 4
提问于2018-02-16
得票数 1
回答已采纳
2
回答
如何
将函数应用于dask数据帧并返回多个值?
、
、
在
pandas
中,我
使用
下面的典型模式将
矢量化
函数应用于df并返回多个值。只有当所述函数从单个任务中产生多个独立输出时,这才是真正必要的。请看我这个过于琐碎的例子:df = pd.DataFrame({'val1': [1, 2, 3, 4, 5], 'val2df进行分块,并
使用
多处理来提高效率,但我希望
使用
dask来完成此任务。继续这个例子,下面是我
如何
在<
浏览 2
提问于2017-01-19
得票数 8
1
回答
查找数百万条记录的皮尔逊相关性
、
、
、
我正在做一个NLP任务,其中我有一个按天分组的文本中单词出现的分布。我想要找出给定单词和数据库中所有其他单词之间的皮尔逊相关性。除了手动迭代数据库中的所有其他单词并计算相关性之外,是否可能有一些算法解决方案。可能与图形有关?
浏览 2
提问于2020-02-04
得票数 0
1
回答
使用
矢量化
在
pandas
中创建列
、
我正尝试在一个
pandas
数据帧上
使用
矢量化
来创建一个新列。数据帧相当庞大(数百万条记录)。我在这里展示了一个虚拟的例子。我展示了一个非
矢量化
的版本,它可以工作,但效率不是很高。我试图在
使用
函数的同时实现
矢量化
版本(实际的函数比这里显示的函数要复杂得多)。import
pandas
as pd df = pd.DataFrame({'Type':list('ABBC'), 'Set
浏览 4
提问于2018-08-31
得票数 0
1
回答
numpy矢量法重采样像熊猫DataFrame重采样
、
、
我可以
使用
Pandas
.DataFrame
使用
.resample('5Min').agg(~),也可以
使用
numpy数组和result = [max(input[i:i+5]) for i in range但是,它需要大量的时间来处理大的输入数组,因为它不是
矢量化
的。我能用np数组进行
矢量化
计算吗?
浏览 2
提问于2020-10-29
得票数 1
回答已采纳
1
回答
为什么numpy select比apply方法的自定义函数慢?
、
、
10000}) 我想生成以下输出: array(['same as column', 'b', 'c', 'this is']*10000, dtype=object) 为此,我定义了下面的函数,并通过
pandas
': else: df['a'] = df['a'].apply(fn) 然后,其他人建议我
使用</e
浏览 20
提问于2020-12-30
得票数 2
回答已采纳
2
回答
方法对熊猫系列中的值进行排序?
、
、
考虑以下
pandas
.Series对象: split_words.sort()然而,我有一个庞大的数据集,所以
矢量化
在这里很重要
如何
使用
熊猫str属性来完成同样的
浏览 2
提问于2016-09-06
得票数 2
回答已采纳
3
回答
熊猫的逐行矢量法洗牌
、
、
、
如何
以不同的方式有效地对每一行的列进行洗牌?import
pandas
as pd display(df)当然,基于apply的解决方案可以工作--但这不会被
矢量化
,因此速度会慢。 是否有一种快速(理想情况下是
矢量化
)的方法来对每一行进行不同的采样?
浏览 0
提问于2021-07-22
得票数 1
回答已采纳
1
回答
使用
Pandas
进行
矢量化
、
、
、
对于中间的一行底行 与中间行相似,但
使用
MSuite表示。如果没有
矢量化
,我将继续遍历数据帧,同时在每次MSuite和TCase增加时进行缓存,并附加缓存的值。
浏览 16
提问于2020-03-15
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
教你如何方便正确地使用Python和Pandas来匿名信息
如何正确使用DeepSeek?
如何正确使用代理IP?
如何正确使用充电宝
如何正确使用助听器电池
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券