我正在使用LDA(隐狄利克雷分配)主题建模进行基于内容的图像检索。我也希望使用Python来做同样的事情。我在Python for LDA for image dataset中找不到任何库/包,包似乎只适用于文本语料库。请在Python中为图像语料库推荐任何软件包,或简要列出执行图像LDA所需的步骤。
我遇到了一个问题,那就是把大量的句子按意义聚成一组。这类似于一个问题,当你有很多句子,并想按它们的含义分组。|A \cup B \ A \cap B|/|A \cup B|这有意义吗?我正在尝试将中移算法从scikit库应用到这个距离,因为它不需要预先使用多少集群。
如果有人愿意为这个问题提供更好的方法/方法--这将是非常感谢的,因为我对这个话题还不熟悉。