在数据框中找到两个列A和B之间的单词交集并创建一个新列C,可以通过以下步骤实现:
import pandas as pd
# 加载数据框
df = pd.read_csv('data.csv')
def find_word_intersection(a, b):
# 将每个单元格的值拆分为单词
words_a = set(str(a).split())
words_b = set(str(b).split())
# 找到两个集合之间的交集
intersection = words_a.intersection(words_b)
return ' '.join(intersection)
# 应用函数并创建新列C
df['C'] = df.apply(lambda row: find_word_intersection(row['A'], row['B']), axis=1)
print(df)
这样,你就可以在数据框中找到两个列A和B之间的单词交集,并创建一个新列C。请注意,以上代码示例中的"data.csv"是一个示例数据文件名,你需要根据实际情况修改为你的数据文件名。
DBTalk
云+社区技术沙龙[第9期]
Elastic 实战工作坊
Elastic 实战工作坊
Elastic 中国开发者大会
DBTalk
serverless days
云+社区开发者大会(北京站)
云+社区技术沙龙[第27期]
DB TALK 技术分享会
领取专属 10元无门槛券
手把手带您无忧上云