我正在尝试使用NLTK在python上创建一个默认的标记器,但我一直收到一个错误。由爱沙尼亚语单词组成的语料库,重点是标记每个单词的词性。ipython-input-26-c1ca76857fce>", line 1, in <module>
File "/Users/mmo/anaconda/lib/python</
尝试加载punkt标记器时...tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle')Please use the NLTK Downloader to obtain the resource: nltk.download().Searched in:
> - 'C:\\Users\\M
我在windows 7中的pycharm中使用python3.5.2,在导入nltk包时遇到困难。_system_import(name, *args, **kwargs)
File "C:\Python\nltk practice.py", line 7, in <module> from nltk.tokenizenltk似乎安装正确。c:\users\leee\appdata\local\programs\python\py
我正在使用NLTK来对web请求中的推文进行POS标记。如您所知,Django为每个请求实例化一个请求处理程序。我注意到这一点:对于一个请求(大约200条tweet ),第一条tweet需要大约18秒来标记,而所有后续tweet需要大约120毫秒来标记。我可以做些什么来加速这个过程?def read(self, request): #this runs for a GET request tokens = nltk.word_token