它的工作方式是使用NLTK对单个单词进行标记化和标记(分类)。如果列表中包含诸如" the ","a","and“等词性冠词,它就会被分解。这些单词不会从NLTK接收标签(人员、组织、地理位置等)。
我的问题是,有一种方法可以跳过元组,这会给我一个错误,因为它们不会返回标签属性?('tokenizers/punkt/englis
我有一个PHP (index.php),它需要调用python (pos_tagger.py )并获得一个元组列表作为返回。我想将一个句子作为字符串从PHP脚本发送到python脚本。我希望python脚本向PHP脚本返回一个元组列表。我试图将元组列表作为JSON数组返回。PHP脚本index.php的代码。
$sent = "I want to get tagged&q
我目前正在处理一个句子的柠檬化,同时也应用pos_tags。/Versions/3.8/lib/python3.8/site-packages/nltk/stem/wordnet.py", line 41, in lemmatize File "/Library/Frameworks/Python.framewor