假设我有一个字符串text = "A compiler translates code from a source language"。我想做两件事:
我需要使用NLTK库遍历每个单词和词干。词干的函数是PorterStemmer().stem_word(word)。我们必须把争论的“话”传递出去。我怎么才能把每个词都截住,然后把词干句拿回来呢?我需要从text字符串中删除某些停止词。包含停止词的</e
我试图从数据框架中删除某些单词:James 34 hello, my name is James.http或filter匹配的单词。我想迭代每一行,在空格上拆分字符串,然后询问单词是否包含http或<filter> (或其他单词)。如果是这样的话,那么我想用空格代替这个词。有一个 关于删除与匹配的另一个<e