我只想从一个专栏中删除所有的英语停用词,而其他专栏则保持不变。这是我从nltk.corpus中提取停用词列表的代码: from nltk.corpus import stopwords
stopWordsListEng = stopwords.words("english") 但我想添加我能想到的其他停用词: according accordingly across act actually 我还没有想出如何将它添加到现有的停用词列
我想从文本数据中删除没有任何意义的单词,并将"is‘t“之类的否定转换为”is not“。因为当我删除标点符号时,“I‘t”变成了“I t”,当我删除长度小于2个字母的单词时,"t“将被完全删除。所以,我想做以下3个任务- 1)将否定转换为"is not“to”is not“2)删除没有意义的单词3)删除长度小于2的字母例如,df列看起来像这样- user_id text data columnthey are not going
3