我正在尝试使用python的英文维基百科语料库()来执行一些深度学习。我正在使用gensim。
它是16‘s的,我把它放在亚马逊网络服务的一台大型EC2机器上。我给它装上
from gensim.corpora.wikicorpus import WikiCorpus
from gensim.models.doc2vec import Doc2Vec, TaggedDocument
from pprint import pprint
import multiprocessing
wiki = WikiCorpus("enwiki-latest-pages-articles.xml.b