腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
转换
pandas
数据
帧
:
需要
更
有效
的
解决方案
、
、
我有一个按某段时间
的
日期索引
的
数据
帧
。我
的
列是对给定年份结束时变量
的
值
的
预测。我
的
原始
数据
帧
看起来像这样: 2016 2017 20182016-07-01 1.0 1 4.1我想将我
的
数据
帧
转换
为以下内容: Y_0
浏览 49
提问于2021-01-14
得票数 2
回答已采纳
1
回答
Pandas
数据
帧
的
pymongo游标
、
、
、
、
我
需要
将mongodb游标
转换
为
pandas
dataframe。我想避免使用data = list(collection.find())直接使用列表,但它会耗尽内存,占用大量内存。建议我一个使用列表
的
有效
方法或一个替代
解决方案
。data = collection.find() lst
浏览 1
提问于2019-01-02
得票数 1
3
回答
如何将DASK
数据
帧
放入MySQL
数据
表?
、
、
我从CSV文件中获取了
数据
,并将其保存在我
的
Dask
数据
帧
中并对其进行操作。然后,我
需要
将
数据
写入
数据
表。我还没有真正遇到过任何
解决方案
。
Pandas
的
to_sql函数具有内置
的
功能,所以我不确定是否
需要
首先
转换
为
Pandas
?我目前认为,将Dask
数据
帧
转换
为
Pandas
会
浏览 4
提问于2020-03-27
得票数 1
3
回答
将
数据
帧
的
行
转换
为单独
的
数据
帧
、
我
需要
从单独
的
1行
数据
帧
转换
为
数据
帧
的
行。在这里寻找最
有效
/最干净
的
方法。def get_data(filename): dataframe = pd.read_csv(filename
浏览 0
提问于2020-03-05
得票数 0
3
回答
使用gzip
数据
帧
,我如何逐行读取/解压缩此文件?
、
、
、
、
我有一个非常大
的
数据
帧
另存为gzip文件。在保存
数据
之前,还
需要
对其进行大量操作。您可以尝试将整个gzip
数据
帧
转换
为文本格式,将其保存到变量中,解析/清理
数据
,然后通过
pandas
.read_csv()保存为.csv文件。然而,这是非常耗费内存
的
。我想逐行读取/解压缩这个文件(我认为这将是最节省内存
的
解决方案
),解析它(例如,使用正则表达式r
浏览 0
提问于2016-08-12
得票数 0
1
回答
Pyspark管道在
pandas
数据
帧
上
的
应用
、
、
、
我有一个pyspark管道(包含估算和一个机器学习模型)和一个
pandas
数据
帧
。我是否可以在不将其
转换
为Pyspark dataframe
的
情况下将管道应用于此
pandas
数据
帧
?如果不可能,我如何
有效
地使用pyspark管道来生成对
pandas
数据
帧
的
预测?
浏览 3
提问于2021-09-13
得票数 1
5
回答
将Python字典重塑为
Pandas
数据
帧
、
、
我给出了一个Python字典,看起来像这样: myDict = {'A':['a','b','c','d','e'],0 B f2 B h 3
浏览 29
提问于2019-01-25
得票数 2
回答已采纳
1
回答
如何在不
转换
为潘达
的
情况下使用极地?
、
、
我想用极地代替潘达,但我无法找到如何在没有
转换
成潘达
的
情况下使用极地。我想知道是否有办法把
Pandas
完全排除在这个过程之外。考虑以下测试
数据
:import numpy as np warnings.warn("accessing series as Attribute of a DataFrame is deprecated") 利用df =
浏览 11
提问于2022-04-04
得票数 2
回答已采纳
1
回答
在python中比较多个制表符分隔
的
csv文件
首先,我想比较两个.csv文件
的
前两列,然后将这两个文件中
的
共同之处写入输出文件,例如common.csv,然后还将每个文件中
的
差异写入不同
的
输出文件,例如f1.csv和f4.csv。到目前为止,我已经尝试使用set()、difflib以及获取这两个文件,从文件创建列表,然后比较每个文件中
的
前两列。这为我提供了共同之处
的
输出,但不是每个文件在相互比较时
的
差异。我已经尝试了大多数发布
的
解决方案
,似乎问题类似于我
的
问题,
浏览 1
提问于2019-08-26
得票数 0
1
回答
Pandas
DataFrame -通过多个列值对行进行求和
、
、
、
我正在Python中处理
Pandas
数据
帧
,我想对
数据
集进行以下重新排列:我尝试使用for循环,但我想知道是否有
更
简单
的
解决方案
使用
Pandas
-我找不到更优雅
的
解决方案
。
浏览 2
提问于2019-12-05
得票数 0
1
回答
使用pyspark直接从hdfs加载
pandas
的
大
数据
、
我直接从
数据
库中获取
数据
,大约有5-1200万
的
数据
。当我尝试将其
转换
为
pandas
数据
帧
以进行分析时。由于音量太大,它总是崩溃。但这是作为csv读取,然后
转换
为
数据
帧
,否则我将直接从
数据
库获取。有没有一种
有效
的
方法可以在很短
的
时间内将这些
数据
加载为
pandas
数据
帧
浏览 7
提问于2020-06-22
得票数 0
1
回答
如何在Databricks中快速轻松地在R和
pandas
数据
帧
之间进行
转换
?
、
、
、
我得到了一个SparkR
数据
帧
(因为我不能让Base R
数据
帧
与RegisterTempTable()一起工作),并将它
转换
成一个临时表:jdbc_url <- "jdbc:sqlserver[table]) as result" ) 然后我试着把它作为一个熊猫
数据
帧
读回来:#Cell 2:
浏览 1
提问于2020-05-29
得票数 1
2
回答
在Python中
转换
pandas
数据
帧
、
、
我
需要
将自定义
转换
应用于
数据
帧
,如下所示: import
pandas
as pd 'value': ['a'], 'measure': ['b', 'c'], 'value': ['a
浏览 26
提问于2020-07-17
得票数 2
回答已采纳
1
回答
Python内存-设置和发布主
数据
帧
、
、
、
我把
Pandas
数据
帧
大
数据
帧
加载到内存中。试图更
有效
地利用记忆。出于这个目的,我不会使用这个
数据
框架,因为我将从这个
数据
框架中子集--只有我感兴趣
的
行:DF = DF[DF['A'] == 'Y'] 已经尝试过这个
解决方案
,但不确定它是否最
有效
。上面的
解决方案
对
浏览 5
提问于2016-06-01
得票数 0
回答已采纳
1
回答
如何将spark sql
数据
帧
摘要写入excel文件
、
、
我有一个非常大
的
数据
帧
,有8,000列和50000行。我想把它
的
统计信息写到excel文件中。我认为我们可以使用describe()方法。而是如何以良好
的
格式写出优秀
的
作品。谢谢
浏览 4
提问于2017-04-22
得票数 3
回答已采纳
1
回答
连接
pandas
数据
帧
的
更多pythonic方式
、
、
所以我不得不写一些程序,对现有的
pandas
数据
帧
做一些操作,然后在for循环中从该
数据
帧
到大
数据
帧
的
末尾。我已经找到了一种方法,通过将第一个
数据
帧
设置为第一次迭代
的
结束
数据
帧
,然后在以后
的
迭代中将
数据
帧
连接到这个结束
数据
帧
,但对我来说,这似乎不是最
有效
<e
浏览 7
提问于2018-08-09
得票数 0
回答已采纳
2
回答
Pandas
dataframe:按一列分组,但按其他列连接和聚合
、
如何
转换
以下输入
数据
(从Excel文件输入
的
Pandas
数据
帧
):334014 Real我尝试了
Pandas
dataframe.groupby()和.agg()
的
不同方法,但都无济于事。也许有
更
简单
的
纯Python
解决方案
?
浏览 0
提问于2018-08-01
得票数 2
1
回答
Python:可以使用带有
数据
帧
的
"as_matrix“作为scikit模型
的
输入吗
、
、
、
嗨,我见过一些机器学习实现
的
例子,它们使用带有
数据
帧
的
as_matrix作为机器学习算法
的
输入。我想知道是否可以使用元组,它是.as_matrix
的
输出,作为机器学习算法
的
输入,如下所示。
浏览 2
提问于2017-05-15
得票数 0
1
回答
在Numpy数组上执行
Pandas
函数
、
、
、
、
我有一个大约8700万行
的
Pandas
数据
帧
。为了对其进行一些处理,我将其设置为Dask
数据
帧
。问题是我
需要
做Dask不支持
的
unstack和plot。我已经将Dask
数据
帧
写入h5文件,但在尝试将其作为
Pandas
数据
帧
读取时遇到内存问题。我在将Dask DF
转换
为
Pandas
时也遇到了内存错误。从本质上讲,我尝试做
的
浏览 2
提问于2020-04-22
得票数 2
3
回答
Keras IndexError:索引越界
、
、
我是Keras
的
新手,我正在尝试对
数据
集进行二进制MLP,并且不断地在不知道原因
的
情况下获得超出界限
的
索引。65, in <listcomp> File "C:\Users\Thiru\Anaconda3\lib\site-packages\
pand
浏览 1
提问于2016-03-13
得票数 11
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
文件传输、文件同步、数据备份的有效解决方案
数据可视化除了需要编码的Python,还有更简单的方式吗?
2015全局数据白皮书:我们需要什么样更“好”的数据?
python如何透过某个字段取得集合里面的值
将PDF发票转换为excel、xml结构化数据的完美解决方案
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券