在包含NaNs的DataFrame列中查找小写单词的方法如下:
import pandas as pd
import numpy as np
import re
data = {'col1': ['apple', 'Banana', np.nan, 'orange', 'grape'],
'col2': ['cat', 'dog', 'elephant', np.nan, 'lion']}
df = pd.DataFrame(data)
def find_lowercase_words(text):
lowercase_words = re.findall(r'\b[a-z]+\b', str(text).lower())
return lowercase_words
df['lowercase_words'] = df['col1'].apply(find_lowercase_words)
print(df['lowercase_words'])
这将输出包含NaNs的DataFrame列中的小写单词列表。
在这个例子中,我们使用了正则表达式来匹配小写单词。首先,将列中的文本转换为小写字母,然后使用正则表达式模式\b[a-z]+\b
来匹配一个或多个小写字母组成的单词。最后,将匹配到的小写单词列表存储在新的列lowercase_words
中。
推荐的腾讯云相关产品:腾讯云数据库TencentDB、腾讯云云服务器CVM、腾讯云对象存储COS等。你可以通过访问腾讯云官方网站获取更多关于这些产品的详细信息和介绍。
领取专属 10元无门槛券
手把手带您无忧上云