使用pandas和Python根据单元格内容组合来自不同行的数据,并基于单元格值创建新列的方法如下:
import pandas as pd
# 读取数据集
df = pd.read_csv('data.csv')
# 创建新列
df['新列名'] = ''
# 遍历每一行数据
for index, row in df.iterrows():
# 获取需要组合的单元格内容
cell1 = row['单元格1列名']
cell2 = row['单元格2列名']
# 组合数据
combined_data = cell1 + ' ' + cell2
# 将组合后的数据赋值给新列
df.at[index, '新列名'] = combined_data
# 根据单元格值创建新列
df['新列名'] = df['单元格列名'].apply(lambda x: '是' if x > 阈值 else '否')
完整的代码示例:
import pandas as pd
# 读取数据集
df = pd.read_csv('data.csv')
# 创建新列
df['新列名'] = ''
# 遍历每一行数据
for index, row in df.iterrows():
# 获取需要组合的单元格内容
cell1 = row['单元格1列名']
cell2 = row['单元格2列名']
# 组合数据
combined_data = cell1 + ' ' + cell2
# 将组合后的数据赋值给新列
df.at[index, '新列名'] = combined_data
# 根据单元格值创建新列
df['新列名'] = df['单元格列名'].apply(lambda x: '是' if x > 阈值 else '否')
# 打印结果
print(df)
这样,根据单元格内容组合来自不同行的数据,并基于单元格值创建新列的操作就完成了。请注意,代码中的'单元格1列名'、'单元格2列名'、'新列名'、'单元格列名'、阈值等需要根据实际情况进行替换。
领取专属 10元无门槛券
手把手带您无忧上云