,可以通过以下步骤实现:
import pandas as pd
import re
data = {'text': ['abc123def', '456xyz789', 'pqr987']}
df = pd.DataFrame(data)
def extract_numbers(text):
numbers = re.findall(r'\d+', text)
return numbers[0] if numbers else None
df['numbers'] = df['text'].apply(extract_numbers)
现在,dataframe中的每个文本字符串中的数字已提取并移动到了名为"numbers"的单独列中。
这种方法使用正则表达式来查找文本中的数字,并将其提取出来。如果文本中存在多个数字,只提取第一个数字。如果文本中没有数字,则在新列中显示"None"。
这个方法适用于需要从文本字符串中提取数字并进行进一步分析或处理的场景,例如数据清洗、数据转换等。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云