如何根据其他列的条件分配新列？

在数据处理和分析中，根据其他列的条件分配新列是一个常见的需求。这通常可以通过使用条件语句或条件表达式来实现。以下是一些常见的方法和技术：

基础概念

条件分配新列是指根据数据表中已有列的值，通过一定的逻辑判断，为每一行数据添加一个新的列，并赋予相应的值。

类型与应用场景

分类标记：根据某些条件将数据分为不同的类别。
计算字段：基于现有字段进行计算得到新的字段值。
状态指示：例如，根据日期判断订单是否过期。

示例代码

假设我们有一个简单的DataFrame，包含两列：Age 和 Salary。我们想根据年龄添加一个新列 AgeGroup。

使用Python的Pandas库

import pandas as pd

# 创建示例DataFrame
data = {'Age': [22, 33, 44, 55], 'Salary': [50000, 60000, 70000, 80000]}
df = pd.DataFrame(data)

# 根据条件分配新列
df['AgeGroup'] = df['Age'].apply(lambda x: 'Young' if x < 30 else ('Middle' if x < 50 else 'Old'))

print(df)

使用SQL

如果你的数据存储在数据库中，可以使用SQL语句来实现同样的功能。

SELECT Age, Salary,
       CASE 
           WHEN Age < 30 THEN 'Young'
           WHEN Age < 50 THEN 'Middle'
           ELSE 'Old'
       END AS AgeGroup
FROM YourTable;

遇到的问题及解决方法

问题：当数据量很大时，条件分配新列可能会导致性能问题。原因：大量的条件判断和计算可能会消耗较多的计算资源。 解决方法：

优化逻辑：尽量简化条件逻辑，减少不必要的计算。
使用向量化操作：在支持向量化的环境中（如Pandas），利用向量化操作可以提高效率。
分批处理：如果数据量极大，可以考虑分批进行数据处理。

注意事项

确保条件逻辑的正确性，避免引入错误的数据。
在添加新列前，最好先在小规模数据集上测试逻辑的正确性。

通过上述方法，你可以有效地根据其他列的条件为数据集添加新的列，以满足不同的分析和应用需求。

如何根据其他列的条件分配新列？

、、、

我尝试根据A、B、C、D中的值添加一个列"flag_column“。也就是说，如果A/B/C/D中有一个值，我想创建一个新列，'flag‘表示包含值的列名。1 0 0 0 1 A2 1 0 0 0 1 A4 0 1 0 0 1 B 注意:只有一列(np.where(df['C'] == 1,

浏览 24提问于2020-10-28得票数 0

回答已采纳

1回答

根据其他列分配新列值

我试图创建一个新的列在我的数据集基于其他国家的数据，但有一些问题，得到正确的代码。如果有人介意快速看一看，并指出我的正确方向，那就太好了。 fisheries_df$basin = "west"我原以为上面的话会奏效，但可能我错过了IF声明中的职

浏览 3提问于2022-11-15得票数 0

回答已采纳

3回答

根据其他列的条件创建新列

、

我尝试创建一个名为"Portfolio“的新列。如果价格和成交量分别小于P1和V1，则投资组合等于11。如果其他价格小于P1但成交量小于V2，则投资组合等于12，依此类推。价格和成交量有3个断点。然而，我没有得到作为第二个表的结果。这就是我在这里发布原始数据的原因。非常感谢。我尝试的代码如下所示：else if ((Price<P

浏览 4提问于2016-11-14得票数 0

2回答

根据其他列的条件创建新列

、

： type hour km_length total B 2 1 我想添加显示费率的列速率可以按两列计算，有两种情况： (1) rate = (hour x 100) / total (2) rate = (km_length x 1000000) / total 当行的值为on hour

浏览 26提问于2020-09-09得票数 1

回答已采纳

1回答

根据其他列的条件创建新列

、、、

我有一个数据，它是这样的：1 10 5 AAA3 107 AAC 5 15 10 AAE Max

浏览 3提问于2021-04-13得票数 0

回答已采纳

2回答

根据其他列的条件创建新列

、

我有一个DataFrame，列由一些值和NaN组成，其中没有为特定列分配值。1 46 15 NaN 113 12 14 12 5465 84 NaN 4452 1 我的目标是创建一个新的列(col4)，它对所有三列(col1、col2、col3)都有NaN和“referenced”的所有行都表示“原始”。我尝试了np.wher

浏览 6提问于2022-05-26得票数 1

回答已采纳

1回答

根据其他列的条件创建新列

、、、

我有如下所示的df0 2019 NaT 2018-12-12 9265299 FVYear IndexDate WorkDate ID Name 0 2019 NaT 2

浏览 10提问于2022-09-08得票数 1

回答已采纳

2回答

如何根据其他列中的条件创建新列？

、、、

我有一个dataframe，它有一个关于年龄的列和一个包含健康状况列表的列。我想要创建一个新的专栏，根据一个人的年龄和健康状况来说明一个人是否具有“高风险”。因此，任何超过40岁或至少有一种疾病的人(即肥胖、糖尿病、高血压)在新的“高危”栏中都有“是”。我使用下面的代码来筛选年龄。df['High risk'] = np.where(df['Age'] >= 40, &

浏览 10提问于2022-02-16得票数 0

1回答

根据其他分类列的条件创建新列

、

2B 23C 8A 9 我需要创建一个基于以下条件的标志列标志

浏览 14提问于2019-08-27得票数 3

回答已采纳

2回答

根据其他两列的条件创建新列

、、、

我是R的新手，我在处理我的数据集方面有一些问题。我需要根据另外两个列的条件在dataset中创建一个新列。我有一个列"is_3t_mine“，它的值为0或1，另一列"is_gold_mine”的值为0或1。我需要第三列"dfa_mine“满足条件；如果is_3t_mine == 0& is_gold_min

浏览 4提问于2021-06-14得票数 0

回答已采纳

2回答

根据其他列和日期条件条件创建新列

我希望根据第2-4列中的数据创建一个新列，如果日期列在上一行之前或之后，则对其进行条件调整。我的数据如下：2022-01-25 Paris London Berlin 2022-02-04 Paris London Berlin 2022-02-06 Pari

浏览 3提问于2022-08-14得票数 3

2回答

根据特定条件分配新列

、

我有一个数据帧，我需要一种方法来对它应用不同的条件。40 low5 150 medium我可以用一个函数和几个if条件来解决它，但我正在寻找一种更好的pandas方法。

浏览 21提问于2018-09-10得票数 0

回答已采纳

4回答

如何根据pandas中其他列的条件创建新列

、、、、

如果B列中有单词"US“，我想从C列中获取前五位数，否则从C.Required列中获取所有的数字输出在"OUTPUT”列中。

浏览 5提问于2021-11-12得票数 2

1回答

根据其他列的值分配新值

所以我有一个数据帧Fruit，它的结构如下Apple 1000Peach 400...我想创建一个新的列'Tag‘，它为销售额低于排名10 (按销售额降序排序)的水果分配值’Other‘，对于排名高于(包括)排名10的水果，将其水果名称分配给'Tag’。因此，假设Peach和Banana的销售排名低于第10位，它应该看起来像这样。并获取前1

浏览 13提问于2019-11-30得票数 0

1回答

根据列表条件分配新的DataFrame列

、

我希望根据条件将新列分配给我的DataFrame -如果row.id是bad_cat值之一。name id typeb 2 Falsed 5 False我的代码似乎不能工作

浏览 1提问于2021-02-20得票数 0

1回答

根据R中其他列的条件创建新列

我有一个如下的df，有3列。我想添加新的列code，它基于另外两个列对列action进行编码。下面是如何生成code列的sudo代码 for each user_id if action V comes before P then Code1 V2 1 P 2

浏览 11提问于2019-08-29得票数 1

回答已采纳

1回答

基于R中相等的行创建新列

、、、、

下面是一个简单的问题，介绍如何在不同列中的一个列匹配条件中创建一个以行重复为条件的新列。具体来说，如果该行是“对”列中的重复，则根据"y“列中的行(等于/不平等)创建新列" new”。在实际的数据框架中，对于其他列</e

浏览 3提问于2014-03-21得票数 0

回答已采纳

1回答

根据其他三列中的条件创建新列

有人能帮我创建一个基于一些严格标准的新专栏吗？c("50-100% target", "0-49% target", "50-100% target","Missing","50-100% target","50-100% target")新列的条件，如果所有三个都相同，例如失踪，那么如果两个缺失(例如XXX/08)，则取另一个(例如50-100%<em

浏览 3提问于2021-03-26得票数 1

4回答

根据其他列的真/假条件创建新列

、、

我手动这个数据帧，但我想知道我可以写什么代码来生成'name‘列，条件是：如果'dog‘为TRUE，而'blackfur’和'whitefur‘为FALSE，则name等于'no_dog’。如果'dog‘是真的，'blackfur’是真的，'whitefur‘是假的，那么name就等于'black_dog’。

浏览 11提问于2021-08-05得票数 1

1回答

根据其他2列熊猫的条件创建新列

、、、

我有一个连接在一起的dataframe，它有两个相同的列和两个不同的名称。它看起来是这样的：Dual Fuel 2809.0EST问题是，一个标头被称为Gen MWh，另一个标头被称为Gen MW，用于不同的</

浏览 2提问于2019-02-05得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何根据其他列的条件分配新列？

基础概念

相关优势

类型与应用场景

示例代码

使用Python的Pandas库

使用SQL

遇到的问题及解决方法

注意事项

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐