如何合并两个数据帧并只保留不同的列(内容)？

在数据处理中，合并两个数据帧并只保留不同的列通常涉及到数据清洗和数据整合的工作。这里以Python中的Pandas库为例，介绍如何实现这一操作。

首先，我们需要创建两个数据帧（DataFrame），然后使用Pandas的merge函数来合并它们，并通过指定参数来保留不同的列。

以下是一个简单的示例代码：

import pandas as pd

# 创建两个示例数据帧
df1 = pd.DataFrame({
    'A': ['A0', 'A1', 'A2', 'A3'],
    'B': ['B0', 'B1', 'B2', 'B3'],
    'C': ['C0', 'C1', 'C2', 'C3']
})

df2 = pd.DataFrame({
    'A': ['A2', 'A3', 'A4', 'A5'],
    'D': ['D2', 'D3', 'D4', 'D5'],
    'E': ['E2', 'E3', 'E4', 'E5']
})

# 使用merge函数合并数据帧，只保留不同的列
merged_df = pd.merge(df1, df2, how='outer', indicator=True)

# 筛选出只在其中一个数据帧中出现的列
unique_columns_df1 = merged_df[merged_df['_merge'] == 'left_only'][['A', 'B', 'C']]
unique_columns_df2 = merged_df[merged_df['_merge'] == 'right_only'][['A', 'D', 'E']]

# 合并两个结果数据帧
result_df = pd.concat([unique_columns_df1, unique_columns_df2], axis=1).drop_duplicates()

print(result_df)

在这个例子中，df1和df2是两个不同的数据帧。我们使用pd.merge函数以outer方式合并它们，并通过indicator=True参数来标记每一行数据的来源。然后，我们筛选出只在左边数据帧(left_only)或右边数据帧(right_only)中出现的列。最后，我们将这两个结果合并成一个新的数据帧。

这种方法的优势在于它可以灵活地处理不同数据帧之间的差异，并且可以很容易地扩展到更复杂的数据集。

参考链接：

Pandas官方文档：https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html

请注意，这个方法假设你想要保留的是完全不同的列。如果你想要基于某些条件来合并列，可能需要采用不同的策略，例如使用apply函数结合自定义逻辑来处理数据。

如何合并两个数据帧并只保留不同的列(内容)？

、、

我有两个数据帧，具有相同的行大小和不同的列号，列的名称也不同，但其中一些内容可能是相似的。b“列和df2的"f”列是相等的。因此，我想要的结果是一个新的数据帧，如下所示： df3 <- data.frame("a"=c(&

浏览 34提问于2020-10-14得票数 1

回答已采纳

3回答

如何合并某些行值相等的两个数据帧？

、、、

我有两个数据帧，我想把它们合并成一个。第一个文件具有ID作为其列，而第二个文件具有相同的值，但在名为id_number的列中。我尝试了下面的代码，但最终final_df同时具有ID和id_number列及其值。如何在合并后只保留一列I？final_df = df.merge( left_on='ID'

浏览 15提问于2021-06-22得票数 0

2回答

如何合并特定列中具有相同值的行？

、、、

我已经合并了两个数据帧，并希望合并具有重复location列的值的行，但合并performances列的值，同时保留纬度和经度值。我怎么能这样做呢？ 📷

浏览 68提问于2021-11-20得票数 0

回答已采纳

2回答

在pandas中合并两个表后，如何使用fill nan()从多个列映射值来填充'nan‘值？

、、

我有两个关于建筑物资产评估的数据框架。一个数据框具有多个关于财务信息的列，而另一个数据框具有包含这些建筑物的位置信息的列。这两个数据帧具有不同的行和列长度(金融数据帧有超过60,000行，而位置数据帧有不到50,000行)。因为财务

浏览 49提问于2020-08-22得票数 0

1回答

如何在将两个Pandas数据帧的列保留在新数据帧中的同时合并两个Pandas数据帧？

、、

i.stack.imgur.com/652KT.png <br>我使用.merge()成功做到了这一点，如下所示：但是，新合并的数据帧只包含来自revenue_df的列，而不包含来自total_df的列。这阻止了我在合并的数据

浏览 2提问于2021-07-17得票数 1

1回答

如何合并两个重复行的数据框？

、、

我有两个数据帧df1和df2。df1具有重复的文本wrt列name，但列hobby发生了更改。在列name中，df2也有重复的文本。我想合并两个数据帧并保留所有内容。cricket jack chessjack vollyball pieter slee

浏览 20提问于2020-04-24得票数 1

回答已采纳

1回答

合并具有重复键的数据帧

、、

我有一个数据帧df1，格式为： df1： a b 2 y ba 我想将它与另一个数据帧df2合并，该数据帧有多行，其中列'a‘与df1的索引匹配cc dd ee3 1 dd ef ff5 2 fg fh ff 我尝试过合并，但我

浏览 18提问于2020-11-04得票数 0

1回答

如何在pandas中执行多列的内连接

、

我有2个数据帧，即accidents_data，它有15列，bad_air_quality_data数据帧，它有5列。现在我想在列‘地区名称’，‘工作日’，‘小时’，‘月’上对两个数据框进行内部连接，最后在连接后只保留来自accidents_data的数据。accidents_data：bad_air_quality_data：我尝试使用以

浏览 3提问于2019-03-08得票数 0

3回答

基于Pandas中的公共列值合并两个数据框

、

如何从具有共同列值的两个数据帧中获得合并的数据帧，使得只有那些行使得合并的数据帧在特定的列中具有共同的值。Grumpier Old Men一个公共<

浏览 6提问于2017-04-09得票数 76

回答已采纳

1回答

如何合并R中列名相同但键值不同的两个数据框

、、

浏览 4提问于2019-02-28得票数 1

1回答

Pandas外部合并列序列不固定

、

我正在尝试使用pandas合并两个数据帧。我正在进行数据帧的外部合并。我的数据框有以下列：DF2: (ID, Y, Z)DF_OUTPUT: (ID, X, Y, Z)DF_OUTPUT

浏览 2提问于2018-11-27得票数 0

1回答

在一个匹配的变量上合并两个数据帧，并只为其他不相交的变量保留一个值

、

我有两个数据帧需要合并。数据帧共享所有相同的列。我基于一个共享变量worker_ID进行合并。然而，其他变量通常是不相交的:一个数据帧将有一个"NA“，另一个数据帧将有一个给定变量的另一个值。我如何才能以这样一种方式进行合并，使输出只保留非NA值？

浏览 0提问于2019-11-10得票数 2

1回答

将数据栏中的列与熊猫合并

、

我试图在一个数据帧中合并两个不同的列。因此，如果您有A和B列，并且希望A保持默认值，除非它是空的。如果它是空的，则要使用B的值。pd.merge看起来只在合并数据帧时才能工作，而不是在现有单个数据帧中的列。

浏览 2提问于2020-06-09得票数 0

回答已采纳

1回答

在Python中合并两个数据帧

、、

如何在python中覆盖/合并两个数据帧，以便添加重叠单元格(索引、列)，而不常见的单元格保留原始数据帧中的值？df1 = 我希望输出像 

浏览 4提问于2017-02-08得票数 1

回答已采纳

1回答

比较两个数据帧并保留与特定行匹配的列

、

我有两个数据帧，它们有一个行，它们是唯一的键，并且存在于两个数据集中。我只希望在特定行值匹配的两个列中保留这些列。对于下面的数据，Data_1有第一行为1、2、3、4，而Data_2只有1、2、3。我需要比较或子集，这样Data_1只有行作为1、2、3，因为这些键只存在于两个数据</

浏览 0提问于2019-01-07得票数 1

回答已采纳

2回答

合并两个dataFrames，然后删除一个

、

我有两个DataFrames df_1 df_2，他们有共同的colmms，例如'Name'。无论如何，'Name'列下的名称可能有所不同，因此我将它们合并到df框架中，并从这两个列中创建了新的几个列。是否可以删除df_2并保留所有新创建的列和df_1？一步也没有？一行？或df_1<em

浏览 4提问于2016-12-28得票数 1

回答已采纳

1回答

按索引合并两个数据帧，并返回唯一列pandas

、、、、

我希望在索引上合并两个数据帧，并且希望在合并后只返回存在的不同列。目前，我使用- pd.merge(X_train，all_data，left_index=True，right_index=True)进行合并。但是，通过将_x和_y附加到列名的末尾以进行标识，将返回所有列。谢谢!

浏览 0提问于2018-05-21得票数 0

2回答

如何在满足条件的情况下更改dataframe中的单值？

、、

据我所知，我目前更改pandas数据框中的值的方法还远远不是最优的，并且确实损害了我的工作流程。示例:我想检查是否在另一个数据帧中找到了一个名称，如果是，使用第一个数据帧中搜索到的名称的iloc放入该数据帧中的值： for idx in id_list_of_names: namedf_two["name"].

浏览 13提问于2019-05-09得票数 1

2回答

根据公共列值在R中的公共列名下合并2个数据

我希望合并两个具有相同列名和一些类似值的数据帧。D Triangle Off我希望1)比较这两个数据报的ID，并保留发生在两个数据帧中的ID，并删除不重叠的数据报。2)使用ID<

浏览 5提问于2022-02-03得票数 1

回答已采纳

2回答

合并两个具有不同列名的数据帧，并从结果中排除等效键。

、、

我有两个熊猫数据帧，它们共享相同的密钥，但每个对象的名称不同。[600,700,800]})Index(['ID', 'Flag'])Index(['client_id', 'score'])df = pandas.merge(df, results, left_on="ID&quo

浏览 0提问于2019-08-28得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何合并两个数据帧并只保留不同的列(内容)？

相关·内容

如何合并两个数据帧并只保留不同的列(内容)？

如何合并某些行值相等的两个数据帧？

如何合并特定列中具有相同值的行？

在pandas中合并两个表后，如何使用fill nan()从多个列映射值来填充'nan‘值？

如何在将两个Pandas数据帧的列保留在新数据帧中的同时合并两个Pandas数据帧？

如何合并两个重复行的数据框？

合并具有重复键的数据帧

如何在pandas中执行多列的内连接

基于Pandas中的公共列值合并两个数据框

如何合并R中列名相同但键值不同的两个数据框

Pandas外部合并列序列不固定

在一个匹配的变量上合并两个数据帧，并只为其他不相交的变量保留一个值

将数据栏中的列与熊猫合并

在Python中合并两个数据帧

比较两个数据帧并保留与特定行匹配的列

合并两个dataFrames，然后删除一个

按索引合并两个数据帧，并返回唯一列pandas

如何在满足条件的情况下更改dataframe中的单值？

根据公共列值在R中的公共列名下合并2个数据

合并两个具有不同列名的数据帧，并从结果中排除等效键。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐