根据其他列字符串为新列赋值可以通过使用字符串处理函数和条件语句来实现。具体步骤如下:
下面是一个示例代码,以Python为例:
import pandas as pd
# 创建一个示例数据集
data = {'A': ['apple,banana', 'orange,grape', 'pear,kiwi'],
'B': ['fruit', 'fruit', 'fruit']}
df = pd.DataFrame(data)
# 根据列A和列B的字符串为列C赋值
df['C'] = ''
for index, row in df.iterrows():
# 拆分列A的字符串
fruits = row['A'].split(',')
# 根据拆分后的字符串和列B的值来判断新值
if row['B'] == 'fruit':
if 'apple' in fruits:
df.at[index, 'C'] = 'red'
elif 'orange' in fruits:
df.at[index, 'C'] = 'orange'
else:
df.at[index, 'C'] = 'unknown'
else:
df.at[index, 'C'] = 'unknown'
print(df)
在这个示例中,我们根据列A的字符串中是否包含特定水果来判断新列C的值。如果列B的值为'fruit',并且列A的字符串中包含'apple',则新列C的值为'red';如果列A的字符串中包含'orange',则新列C的值为'orange';否则,新列C的值为'unknown'。
这只是一个简单的示例,实际应用中可能需要根据具体的需求和数据进行适当的调整。
领取专属 10元无门槛券
手把手带您无忧上云