腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在spark sql中
连接
表时,有没有办法
限制
读取
的
数据
?
、
我想
通过
连接
两个
非常大
的
表来读取spark sql中
的
数据
。但我只需要从结果
数据
帧
中获得
一个
固定数字(假设是500)。employee.deptno, deptname FROM employee INNER JOIN department ON employee.deptno = department.deptno 在这里,我可以在结果
数据
帧
上使用head(500)或limit(500)函
浏览 19
提问于2020-09-17
得票数 0
回答已采纳
1
回答
通过
限制
一个
数据
帧
的
行
数来
连接
两个
数据
帧
、
、
我有
两个
数据
帧
: df1:|id_device |tracking_time |+-----------------------+--------------------+--------------------+--------------------+ 我想要
的
是用left join ordered by df2.tracking_time desc limit 1
的
结果
浏览 13
提问于2020-08-23
得票数 1
1
回答
将python列表中
的
数据
合并到
一个
dataframe中
、
我在AAMC_K.txt、AAU.txt、ACU.txt、ACY.txt中
的
一个
名为AMEX
的
文件夹中有以下文件。我正在尝试将这些文本文件合并到
一个
数据
帧
中。我曾尝试使用pd.merge()来执行此操作,但得到
一个
错误,即merge函数需要
一个
向右和向左
的
参数,并且我
的
数据
在python列表中。如何将data_list中
的
数据
合并为
一个
panda
浏览 52
提问于2019-03-02
得票数 0
1
回答
在python中将多个.csv合并为
一个
csv
、
、
、
、
晚上好, 所以我有大量
的
.csvs,我要么想在读熊猫之前在
一个
巨大
的
csv中改变它,要么直接创建
一个
包含所有.csvs
的
df。.csvs都有两列“时间戳”和“持有量”。现在我想在“时间戳”-column上合并它们,如果它们彼此匹配,并为每个“持有量”-column创建
一个
新列。到目前为止,我产生了这样
的
结果: import osimport pandas as pd
浏览 37
提问于2020-08-05
得票数 0
回答已采纳
2
回答
将
数据
帧
按
行
/列名
连接
到第三维空间上
我有任意数量
的
数据
帧
,有
行
名和列名。我
的
问题是,我不想加入他们
的
位置,而是
通过
他们
的
行
/列名。我知道我可以使用 abind ()来
连接
任何想要
的<
浏览 0
提问于2018-09-12
得票数 3
1
回答
R中矩阵
行
的
多到多比较
、
、
、
、
我试图用R将
两个
大
数据
帧
的
数据
关联起来。
数据
是这样组织
的
: 第一
数据
帧
包括~5M
行
。每一
行
都需要与第二
数据
帧
中
的
几行(通常超过1
行
)进行比较。第二个
数据
帧
约为100,000
行
,每一
行
也对应于
数据
帧
1中
的
多
浏览 3
提问于2014-11-17
得票数 0
回答已采纳
1
回答
是否可以在Pandas中构建自己
的
多变量
数据
集?
、
、
、
、
我正在努力学习更多关于多变量时间序列预测
的
知识。我想根据天气
数据
来预测难民抵达欧洲
的
情况。到达
数据
来自不同
的
来源,天气
数据
也是如此。有没有办法将这两者结合起来,以便有
一个
用于多变量时间序列预测
的
数据
集?1个时间序列:每月到达
数据
2个时间序列:天气
数据
有没有可能用天气
数据
和到达
数据
制作
一个
数据
帧
,用于多变量时间
浏览 6
提问于2021-07-05
得票数 0
2
回答
在处理pandas
数据
帧
时遇到问题
、
我偶尔会收到
一个
包含许多N/A值
的
数据
帧
。在这些情况下,会有冗余
的
行
。对于每个X值,只有
一个
Y值。因此,我希望
通过
将"example1“列与度量列名(M1、M2、..Mn)相结合,将
两个
"context”
行
合并为1
行
(如图所示)。谢谢。
浏览 1
提问于2016-11-16
得票数 0
1
回答
比较Java中使用新列打印结果
的
两个
火花
数据
格式
、
、
、
我正在使用Apache,并试图使用比较
两个
json文件。我有
两个
数据
-- 1)预期
数据
和2)实际
数据
。预期
数据
- table_1 实际
数据
- table_2 差异 我需要它对每一列进行比较,使之成为确切
的
,并获得预期
的
数据
格式,并在其中包含另一列'result‘,其中给出传递或失败。
浏览 3
提问于2021-07-26
得票数 1
1
回答
将来自
两个
熊猫
数据
帧
的
两个
切片组合在
一个
循环中
的
最快方法?
、
我有
一个
person ID列表,对于每个ID,我希望从
两个
不同
的
数据
帧
中提取所有可用
的
信息。此外,信息
的
类型也有ID,我只需要每个人ID
的
特定信息ID。pd.concat,但我尝试将
数据
帧
转换为数组,并对其进行切片和
连接
,但这比使用pd.concat更慢。在使用%lprun分析每一
行
之后,所有的时间都被循环中
的
pd.concat/logical_and操
浏览 7
提问于2018-02-27
得票数 0
回答已采纳
1
回答
如何解决pyspark Databricks中
的
GC开销
、
、
、
、
我正尝试在spark dataframe中加载
一个
100 gb
的
json文件,并在其上创建
一个
临时视图。然后我用query查询这个视图中
的
数据
。以下是我
的
集群详细信息:Databricks runtime Version : 6.1(Apache Spark 2.4.4) Worker Type
浏览 0
提问于2020-03-31
得票数 1
2
回答
根据
两个
数据
帧
中
的
三个匹配in查找值-R
我有
两个
数据
框,我想沿着三列进行匹配,以将“年金系数”值拉入下面。我试图用下面
一个
多少可以重现
的
例子来说明这一点。我使用
的
left_join如下所示,但在完整
的
dataset中,它复制
数据
中
的
每一
行
。然而,它确实引入了正确
的
年金系数。我不确定是什么原因造成
的
,也不知道是否有更好
的
替代方案。
浏览 15
提问于2021-02-09
得票数 0
2
回答
当用dplyr
连接
两个
数据
帧
时,我可以替换NAs吗?
、
我想加入
两个
数据
帧
。有些列名重叠,其中
一个
数据
帧
的
重叠列中有NA条目。下面是
一个
简化
的
示例: df1 <- data.frame(fruit = c('apples','oranges','bananas','grapes'), var1 = c(1,2,3,4), var2data.frame(fruit = c('oranges
浏览 1
提问于2016-08-23
得票数 11
回答已采纳
1
回答
连接
/合并
两个
pandas
数据
帧
和填充
、
我有
两个
pandas
数据
帧
,每个都有不规则
的
时间序列
数据
。我还想为
通过
连接
过程添加
的
任何“新”
行
向前填充frame2
的
其他列。我该怎么做呢?我试过了:但这只会留下
一个
具有匹配时间戳
行
的
<
浏览 1
提问于2014-11-14
得票数 7
回答已采纳
1
回答
两个
数据
帧
火花
连接
操作
、
当df1和df2具有相同
的
行
并且join操作df1.join(df2)
的
复杂度是多少?是否有可能对
两个
数据
帧
进行排序并使其具有更好
的
性能?
浏览 0
提问于2019-09-20
得票数 0
3
回答
Pandas/Python:如何在不重复
的
情况下
连接
两个
数据
帧
?
、
、
我想将
两个
数据
帧
A,B
连接
到
一个
没有重复
行
的
新
数据
帧
中(如果B中
的
行
已经存在于A中,则不添加): I II I II1 3 1 3 1 I II 0 1
浏览 1
提问于2014-01-24
得票数 81
回答已采纳
1
回答
在NaN
行
拆分
数据
帧
、
、
已经有了
一个
答案,可以处理
一个
相对简单
的
数据
帧
,这个
数据
帧
被赋予了。 但是,我手头
的
数据
帧
有多列和大量
行
。
一个
数据
帧
包含沿axis=0
连接
的
三个
数据
帧
。(
一个
的
底端附加到下
一个
的
顶部。)它们由一
行
浏览 1
提问于2017-02-08
得票数 4
2
回答
Python
连接
满足条件
的
列上
的
两个
数据
帧
、
、
假设我有
两个
数据
帧
A和B,每个
数据
帧
包含
两个
名为x和y
的
列。我希望
连接
这
两个
数据
帧
,但不是
连接
在
两个
数据
帧
中x和y列相等
的
行
上,而是
连接
在A
的
x列是B
的
x列
的
子字符串且y列相同
的
行
上。这
浏览 2
提问于2015-01-21
得票数 0
1
回答
Spark :如何过滤列并执行操作,最终将所有列写入文件?
、
我正在将
一个
文件读入包含许多列和
行
的
数据
帧
中,但我对单个列执行我
的
操作(重新分区、过滤等)感兴趣,所以我计划过滤不需要
的
列,但当我将最终
数据
帧
写入另
一个
输出文件时,我如何才能包括所有被过滤掉
的
列?other operations on the inputDF我只对这里<
浏览 1
提问于2019-07-28
得票数 0
1
回答
如何用其他
数据
帧
中
的
值填充缺失
的
值
、
、
、
我有
一个
数据
框,它有
一个
ID:String列、
一个
Type:Int列和
一个
Name:String列。但是我还有另外三个
数据
帧
,它们包含
一个
ID列和
一个
Name列。我想做
的
是用其他
数据
帧
中
的
值填充第
一个
Dataframe中缺少
的
值。其他
数据
<
浏览 3
提问于2016-09-24
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(五):数据连接
如何只用一行代码让 Pandas 加速四倍?
如何只用一行代码让Pandas加速四倍?
通过栈帧简述方法运行过程
计算机|37张图详解MAC地址、以太网、二层转发、VLAN
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券