腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
如何
总结
稀疏
的
熊猫
数据
帧
?
、
我
有一个
熊猫
数据
框架,看起来像这样: df0 2020-08-17 1 1 0 Date A B C3 2020-08-18
浏览 22
提问于2020-09-01
得票数 0
回答已采纳
3
回答
如何
在Python中创建大
数据
框架
、
、
、
我
有一个
稀疏
矩阵,X,由TfidfVectorizer创建,其大小是(500000, 200000)。
我
想把X转换成一个
数据
帧
,但是
我
总是会收到一个内存错误。
我
试过了和 pd.read_csv(X.toarray().astype("float32"), columns=tokens有人能告诉
我
什么是简单
的
解决办法吗?
我<
浏览 0
提问于2021-04-10
得票数 1
2
回答
作为DataFrame列
的
Scipy
稀疏
矩阵
、
、
、
、
我
正在开发基于pandas DataFrame对象
的
工具。
我
希望将scipy
稀疏
矩阵保留为DataFrame
的
列,而不是将其按行转换为dtype('O')
的
列表/数值数组。当在矩阵中
的
行索引上提供pd.RangeIndex时,矩阵将对
数据
帧
中
的
每一行重复(因为pandas认为它是标量)。ma = scipy.sparse.rand(10, 100, 0.1, 'csr'
浏览 12
提问于2016-09-12
得票数 4
回答已采纳
2
回答
使用groupby.sum()对大型
稀疏
熊猫
数据
帧
进行分组非常慢
、
、
、
我
有(607875, 12294)大小
的
熊猫
数据
帧
。
数据
是
稀疏
的
,如下所示:0 abc 0 0 1 ...2 abc 0 0 1 ...对于较小
的
数据
帧
,它工作得很好,但对于这种大小,它工作了一个小时,没有完成工作。输出
数据</em
浏览 2
提问于2020-03-11
得票数 1
1
回答
如何
在不使用panda dataframe
的
情况下添加其他功能?
、
、
我
使用python api从mysql
的
一个表中返回
数据
。下面的代码适用于1个功能。zip
的
返回值是一个1
的
元组。trgt = zip(*listtrain)
如何
添加另一个特性
如何
构建fX?来自f1和f2。 谢谢。
浏览 34
提问于2018-06-03
得票数 0
1
回答
如何
使用计算值手动填充
熊猫
数据
?
、
我
有几个
数据
(按季度),
我
正在计算每个季度
的
值,并试图填充一个具有日期变量(季度)
的
表,即12-31-201506-30-2016 ...在这里,对于每个季度,
我
有一个顶级帐户
的
列表,
我
在
总结
,比方说,前100行来计算每个季度前100个帐户
的
持有量。现在,
我
想用计算值填充表。sum, topaccount_2021_12['balance']
浏览 1
提问于2022-03-18
得票数 1
回答已采纳
2
回答
为什么矩阵(在R中)比包含相同
数据
的
图像文件要慢和大得多?
、
、
、
我
在处理原始成像质谱
数据
。这种
数据
非常类似于一个传统
的
图像文件,除了3个彩色通道之外,我们还有对应于我们正在测量
的
离子数量
的
通道(在
我
的
例子中,是300)。
数据
最初是以专有格式存储
的
,但可以将其导出为具有以下格式
的
表形式
的
.txt文件:正如你所想象
的
那样,这些文件可能是巨大
的
。典型
的
图像可能
浏览 1
提问于2016-02-02
得票数 0
回答已采纳
2
回答
将Pandas SparseDataframe转换为Scipy sparse csc_matrix
、
、
、
我
想把
熊猫
的
SparseDataFrame转换成scipy.sparse.csc_matrix。但我不想先把它转换回稠密矩阵。基本上,
我
需要
的
是进一步从df获得一个scipy.sparse.csc_matrix。有办法做到这一点吗?
浏览 0
提问于2016-12-15
得票数 3
1
回答
Python:可以使用带有
数据
帧
的
"as_matrix“作为scikit模型
的
输入吗
、
、
、
嗨,
我
见过一些机器学习实现
的
例子,它们使用带有
数据
帧
的
as_matrix作为机器学习算法
的
输入。
我
想知道是否可以使用元组,它是.as_matrix
的
输出,作为机器学习算法
的
输入,如下所示。
浏览 2
提问于2017-05-15
得票数 0
1
回答
将
熊猫
数据
转换成
稀疏
数组
、
将混合列类型
的
熊猫
数据
帧
--数值、序数和分类--转换为
稀疏
数组是机器学习中
的
一个核心问题。现在,如果
我
的
熊猫
的
数据
框架只包含数字
数据
,那么将
数据
框架转换为
稀疏
的
csr矩阵:如果
我
的
数据
框架由顺序
数
浏览 4
提问于2020-05-18
得票数 2
1
回答
AttributeError:“Series”对象没有属性“”to_coo“”
、
、
、
、
我
正在尝试使用sklearn模块中
的
朴素贝叶斯分类器来分类电影评论是否是正面的。
我
使用一袋单词作为每个评论
的
特征,并使用一个大型
数据
集,其中包含评论
的
情感评分。df_bows = pd.DataFrame.from_records(bag_of_words)4 0 0 0 0
浏览 29
提问于2020-07-22
得票数 3
1
回答
从
稀疏
数据
帧
填充连续
的
熊猫
数据
帧
、
、
我
有一个字典名称date_dict,以datetime日期为关键字,值对应于观察值
的
整数计数。
我
将其转换为
稀疏
序列/
数据
帧
,并希望将其加入或转换为具有连续日期
的
序列/
数据
帧
。DateTime索引创建一个空
的
数据
帧
,但是这会引入一个不需要
的
列,而且看起来很笨拙。
我
觉得
我
好像错过了一个涉及连接
的
浏览 1
提问于2012-11-14
得票数 17
回答已采纳
2
回答
如何
从
熊猫
数据
帧
创建
稀疏
矩阵?
、
、
假设
我
在dataframe中有
稀疏
数据
。
我
如何
从它创建一个
稀疏
矩阵,在哪些模型中
我
可以使用它进行预测?
浏览 0
提问于2017-01-20
得票数 1
2
回答
无法在python
熊猫
数据
框架中正确应用where子句
、
、
嗨,
我
有下面的
数据
帧
1 a, b, c 1003 b,c 805 a 150预期答案:a 50 a
浏览 7
提问于2022-05-19
得票数 0
1
回答
将混合
数据
类型
的
转换为LibSVM格式
、
、
、
我
有一个
熊猫
数据
框架,大约有一百万行和三列。这些列有3种不同
的
数据
类型。NumberOfFollowers是一种数值
数据
类型,UserName是一种范畴
数据
类型,嵌入式是一种范畴集类型。
我
想把这个
熊猫
数据
帧
转换成LibSVM输入格式。它将输入作为NumPy数组或
稀疏
矩阵。因此,
我
知道它可以使用
稀疏
矩阵来完成,但是,
我
不知道<em
浏览 0
提问于2020-04-28
得票数 3
1
回答
如何
将SQLContext
数据
转换为向量
的
RDD?
、
我
有一个SQLContext
数据
框架,它是由几个数字列组成
的
熊猫
数据
框架。
我
想使用pyspark.mllib.stats包进行多元统计分析。统计函数期望向量
的
RDD。
我
无法将此
数据
帧
转换为向量
的
RDD。有办法转换
数据
帧
吗?代码: summary = Statistics.colStats
浏览 0
提问于2015-07-01
得票数 1
回答已采纳
1
回答
Python pandas输出浮点数而不是整数
、
、
我
想要将一个矩阵(非常
稀疏
,有数百万个零和几个其他数字)作为
熊猫
数据
帧
保存到.csv文件中,但是
数据
帧
将0保存为0.0 (浮点数而不是整数),因此文件变得非常大。所以我想将0.0保存为0,以减小输出.csv文件
的
大小。
我
正在尝试类似这样
的
东西: import pandaspd = pandas.DataFrame(table, columns = [
浏览 37
提问于2020-07-24
得票数 0
1
回答
巨蟒
熊猫
稀疏
的
数据
是失去了多索引列名,还是
我
做错了?
、
我
只想看看有没有人能看到我在做什么之前
的
错误.:现在,如果
我
用它创建一个
稀疏
矩阵并显示它,那么列级别的名称就会消失:ds如果
我
将
稀疏
版本转换回稠密版本,那么这些级别的名称仍然会消失:tf = ds.to_dense() 现在
我
知道了,显示
稀疏
版本会调用to_dense(),但是损失似乎发生在向
稀疏
转换时。
我
正在探索迁移到
稀疏</
浏览 6
提问于2015-11-13
得票数 1
回答已采纳
1
回答
SparseSeries列表
的
pandas内存使用情况
、
、
、
我
正在尝试从一个
稀疏
的
numpy矩阵创建一个SparseSeries列表。创建lil_matrix很快,并且不消耗大量内存(实际上,
我
的
维度更多
的
是数百万,即1500万个样本和400万个特征)。
我
之前读过一篇关于这方面的。但这个解决方案似乎也消耗了
我
所有的内存,冻结了
我
的
电脑。从表面上看,
熊猫
SparseSeries并不是真的
稀疏
,还是
我
做错了什么?最终目标是在此
浏览 1
提问于2015-05-21
得票数 1
2
回答
将每行10个随机非零值
的
值设置为零
、
我
有一个非常
稀疏
的
Pandas DataFrame,大约有1,000行和10,000列。大多数行只包含20-100个非零值。现在,
我
想在每一行中选择任意10个随机非零值,并将它们
的
值设置为0。这是
我
第一次尝试(对
熊猫
非常不友好): row = df.iloc[i] nonZeros = np.where(row > 0
浏览 0
提问于2018-07-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何根据数据来优化创意素材?我总结了这些技巧
如何导出我的学习进度数据?
如何批量删除Excel中的所有0值?我总结了3种最常用的方法
如何成为一名更优秀的程序员?我总结出 7 条建议
大数据的血腥:伊人已逝!滴滴还在,我当如何?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券