我正在尝试Gensim和SciKit learn (Python3)中的主题建模,我想了解更多关于在这两个包中调整超参数的信息。我在GITHUB上找到了一些相关的讨论,例如"optimize hyperparameters as part of LDA training",但没有完整的文档。我甚至不确定在SciKit学习中超<
我一直在使用sklearn.decomposition.LatentDirichletAllocation模块来探索文档语料库。经过多次训练和调整模型的迭代(即添加停用词和同义词,改变主题的数量),我对提炼出的主题相当满意和熟悉。作为下一步,我想将训练好的模型应用于新的语料库。我知道这在gensim库中是可能的,在gensim库中您可以训练模型:from g