如何使用NLTK删除停用词

、、、

我正面临着在NLTK中使用停止词功能的两难境地。我正在通过使用NLTK删除停用词来处理来自社交媒体平台的用户生成的内容。然而，进退两难的是，我想在用户的文本中保留人称代词，这对分类任务很重要。不幸的是，停用词函数也删除了这些单词，我需要它们存在。我该如何解决这个问题？

浏览 27提问于2020-04-27得票数 3

回答已采纳

1回答

将自定义停用词追加到nltk.corpus的默认停用词列表中，并使用lambda从数据帧中的一系列中删除停用词

、、、、

我只想从一个专栏中删除所有的英语停用词，而其他专栏则保持不变。这是我从nltk.corpus中提取停用词列表的代码： from nltk.corpus import stopwords stopWordsListEng = stopwords.words("english") 但我想添加我能想到的其他停用词： according accordingly across act actually 我还没有想出如何将它添加到现有的停用词列

浏览 18提问于2020-01-16得票数 0

回答已采纳

1回答

跳过不带属性的元组Python NLTK

、、、、

它的工作方式是使用NLTK对单个单词进行标记化和标记(分类)。如果列表中包含诸如" the "，"a"，"and“等词性冠词，它就会被分解。这些单词不会从NLTK接收标签(人员、组织、地理位置等)。 ne_tree = nltk.n

浏览 21提问于2020-05-06得票数 0

1回答

在不使用NLTK的情况下从Python中的文本中移除停用词

、、

我用Python列出了我的母语中的停用词。当我输入文本时，如何在不使用NLTK的情况下删除它们？

浏览 14提问于2021-01-23得票数 0

回答已采纳

1回答

如何使用python获取停用词列表？

、、、

我如何获取法语停用词的关键字列表，因为我的数据是法语的。stop_words=stopwords.words('french')

浏览 63提问于2019-04-23得票数 1

4回答

使用NLTK删除停止字

、、、

我试图通过使用nltk工具包删除停用词来处理用户输入的文本，但是使用停用词删除时，像'and'，'or'，'not‘这样的单词会被删除。我希望这些单词在停用词删除过程后出现，因为它们是以后将文本作为查询处理所需的运算符。我不知道哪些词可以作为文本查询的运算符，我也想从我的文本中删除不必要的词。

浏览 78提问于2013-10-02得票数 78

回答已采纳

2回答

找不到资源‘语料库/停用词’

、、

我正在尝试从nltk.corpus导入停用词。我不能使用nltk.download(‘停用词’)，因为我有代理问题。我在试着手动导入停用词。这就是我所做的。我从github.com下载了nltk_data，并使用nltk.data.path配置了适当的路径。Files\\Anaconda3\\Lib\nltk_data' 我所有的nltk数据都在上面的路径中，而且语料库文件夹中也有停<em

浏览 4提问于2017-08-02得票数 1

2回答

在nltk python中创建停用词集

、、、

我知道NLTk停用词有很多种语言，但如果我想创建自己的停用词集并在NLTK停用词中使用它们，这是可行的吗？import nltkstops=set(stopwords.words('My own set')) words=["Don't"

浏览 28提问于2019-12-23得票数 1

回答已采纳

1回答

、

我在使用NLTK删除停用词时遇到了问题。我正在使用下面的代码，它的工作没有我试图删除停用词的部分。from nltk.probability import FreqDist File "C:\Users\meris\

浏览 28提问于2021-01-29得票数 0

1回答

是否有办法对单词进行分类/删除(Exm.“哪些”、“潜在”、“这”、“是”等)使用列表中的python

、、

antimicrobial --> 0.0029Frequencey of: cameroon --> 0.0029 是否有任何库或方法可以删除常用词

浏览 3提问于2017-05-04得票数 0

3回答

下面的python代码中的错误是什么

、、

我想删除停用词。以下是我的代码from nltk.corpus import stopwordsv=v.lower() v_list=n

浏览 0提问于2012-10-03得票数 1

回答已采纳

2回答

如何消除这段代码中的停用词？

、

我已经编写了做情感分析的代码，因此我使用了两个不同的字典，其中的句子被标记为否定或积极。test_data = pos_data[3:] + neg_data[3:] 现在我想让代码从字典中的句子中删除所有Stopword，但我不知道如何在我的代码中实现这一点，因为我是Python编程的初学者。

浏览 2提问于2016-04-13得票数 0

2回答

如何转换具有相同重复字母的否定和单个单词

、、

我想从文本数据中删除没有任何意义的单词，并将"is‘t“之类的否定转换为”is not“。因为当我删除标点符号时，“I‘t”变成了“I t”，当我删除长度小于2个字母的单词时，"t“将被完全删除。所以，我想做以下3个任务- 1)将否定转换为"is not“to”is not“2)删除没有意义的单词3)删除长度小于2的字母例如，df列看起来像这样- user_id text data columnthey are not going 3

浏览 3提问于2019-03-30得票数 1

回答已采纳

1回答

在python中删除不在NLTK库中的停用词

、

我一直在尝试从csv文件中删除在NLTK库中找不到的停用词，但当我生成新的数据帧时，我仍然看到其中的一些单词，并且我不确定如何删除它们。我不确定我的代码有什么问题，但它是这样的： import nltkfrom nltk.corpus fr

浏览 12提问于2020-11-20得票数 0

1回答

将停用字典导入到python

、、

如何将特定的停用词字典(excel表格)导入Python，并将其附加到nltk停用词列表中？目前我的停用词部分看起来像这样：from nltk.corpus import stopwords stop_words = set(stopwords.words

浏览 71提问于2018-06-11得票数 1

1回答

有什么方法可以过滤出python中的单词吗？

、

我知道我可以使用过滤器和其他东西，但我需要一个包含所有单词的长长列表。已经有包含这些单词的包了吗？我需要删除这些单词，这样消耗的内存才能处理删除了这些单词的列表，这样就会更轻。谢谢

浏览 1提问于2015-03-06得票数 2

2回答

绘制文本中最常用的单词(删除停用单词)

、、

我已经使用以下代码绘制了数据： import nltkdefin text[columnText].astype('str')]) frequency = nltk.FreqDist

浏览 22提问于2020-09-12得票数 1

回答已采纳

1回答

如何加快自然语言处理中停用词去除和词汇化的计算速度

、、、

作为文本分类模型预处理的一部分，我使用NLTK库添加了停用词删除和词汇化步骤。代码如下： import pandas as pdfrom nltk.corpus import stopwords; stop =set(stopwords.words('english')) from nltk.stem import WordNetLemmati

浏览 14提问于2021-10-12得票数 0

1回答

Heroku模型部署成功，但未找到nltk.txt

、

我按照Heroku指南在app文件夹的根目录下创建了一个nltk.txt文件。内容是“停用词”(对于停用词语料库)。但是，在部署期间，观察到以下日志消息： remote: -----> Downloading NLTK corpora… remote: !Learn more: https://devcenter.h

浏览 53提问于2020-06-26得票数 1

1回答

NLP -为什么“不”是一个停用词？

、

在执行主题建模之前，我正在尝试删除停用词。我注意到一些否定词(not，nor，never，none等)通常被认为是停用词。例如，NLTK、spacy和sklearn在它们的停用词列表中包括"not“。然而，如果我们从下面的句子中删除" not“，它们就失去了重要的意义，这对于主题建模或情感分析是不准确的。谁能解释一下为什么这些否定词通常被认为是停

浏览 0提问于2016-12-16得票数 3

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Stopword消除困境

将自定义停用词追加到nltk.corpus的默认停用词列表中，并使用lambda从数据帧中的一系列中删除停用词

跳过不带属性的元组Python NLTK

在不使用NLTK的情况下从Python中的文本中移除停用词

如何使用python获取停用词列表？

使用NLTK删除停止字

找不到资源‘语料库/停用词’

在nltk python中创建停用词集