,可以使用以下方法:
df = pd.DataFrame({'col1': ['item1, item2', 'item3, item4', 'item5, item6']})
extracted_items = [item.strip() for sublist in df['col1'].str.split(',') for item in sublist]
这将返回一个包含所有提取项的列表。使用strip()函数去除每个项的前导和尾随空格。
df = pd.DataFrame({'col1': ['item1, item2', 'item3, item4', 'item5, item6']})
extracted_items = df['col1'].apply(lambda x: [item.strip() for item in x.split(',')])
这将返回一个包含每个字符串的列表,其中每个字符串被拆分并去除了前导和尾随空格。
import re
df = pd.DataFrame({'col1': ['item1, item2', 'item3, item4', 'item5, item6']})
extracted_items = df['col1'].apply(lambda x: re.findall(r'\b\w+\b', x))
这将返回一个包含每个字符串的列表,其中每个字符串被拆分为单词并提取出来。
以上方法可以根据具体需求选择使用。在处理大型数据集时,可以考虑使用向量化操作以提高性能。
腾讯云相关产品和产品介绍链接地址:
请注意,以上链接仅供参考,具体产品选择应根据实际需求和情况进行评估。
领取专属 10元无门槛券
手把手带您无忧上云