我看到ImageFolder的__getitem__(index)方法可以同时获得索引的张量和类。但是,如果我想使用ImageFolder从我选择的一个类(或多个类)中随机抽取一定数量的图像,然后为__getitem__方法获取它们的索引,该怎么办?(有点像反向操作,即选择类-> get index而不是选择index -> get class)
如何做到这一点?
我使用以下对数似然公式来比较文档和集群之间的相似度: log (d| c )= sum (c(w,d) * log (w|c));c(w,d)是文档中单词的出现频率,p(w|c)是集群c生成单词w的可能性问题是,基于这种相似性,文档经常被分配到错误的聚类。有人能给我解释一下如何正确使用对数似然吗?我试着用java实现这个函数。我已经看过谷歌学者,但在文本挖掘中找不到合适的对数似然解释。提前感谢