| 计算 dataframe 中与预先指定的单词列表匹配的单词
在 Python 中,可以使用 pandas 库来处理 dataframe 数据。要计算 dataframe 中与预先指定的单词列表匹配的单词,可以使用以下步骤:
import pandas as pd
data = {'col1': ['apple', 'banana', 'orange', 'grape'],
'col2': ['cat', 'dog', 'elephant', 'lion']}
df = pd.DataFrame(data)
word_list = ['apple', 'banana']
str.contains()
和 any()
函数来计算匹配的单词:matching_words = df['col1'].str.contains('|'.join(word_list), case=False)
result = matching_words.any()
在上述代码中,str.contains()
方法用于检查 dataframe 列中的每个元素是否包含指定的单词列表中的任何一个单词。'|'.join(word_list)
用于将单词列表中的单词用竖线连接起来,形成一个正则表达式模式,以便在匹配时使用。case=False
参数表示不区分大小写。
matching_words
是一个布尔型的 Series,表示每个元素是否匹配。any()
函数用于检查 Series 中是否存在任何一个匹配的单词,如果存在则返回 True,否则返回 False。
print(result)
完整代码如下:
import pandas as pd
data = {'col1': ['apple', 'banana', 'orange', 'grape'],
'col2': ['cat', 'dog', 'elephant', 'lion']}
df = pd.DataFrame(data)
word_list = ['apple', 'banana']
matching_words = df['col1'].str.contains('|'.join(word_list), case=False)
result = matching_words.any()
print(result)
以上代码将输出匹配结果的布尔值,表示 dataframe 中是否存在与预先指定的单词列表匹配的单词。
推荐的腾讯云相关产品:腾讯云服务器(CVM)和腾讯云数据库(TencentDB)。您可以通过以下链接了解更多关于这些产品的信息:
领取专属 10元无门槛券
手把手带您无忧上云