我将使用Apriori算法实现一个个人推荐系统。我知道有三个有用的概念,分别是“支持”、“信心”和“提升”,我已经知道它们的意思,我也知道如何用支援概念来找出经常出现的项目集,但我不知道为何会有信心和提升概念,因为如果我们可以使用支援规则来找出频繁项目集?
当“支持”概念已经应用时,你可否解释为何会有“信心”和“升力”的概念?如果我已经在数据集中使用了支援概念,我又如何继续推行“信心”和“提升”的概念?
如果您能回答我的SQL查询,我将非常感激,因为我仍然是一名本科生。非常感谢
发布于 2016-04-08 06:34:13
仅仅支持就会产生许多多余的规则。
例如:
A -> B
A, C -> B
A, D -> B
A, E -> B
...取消和类似措施的目的是消除复杂的规则,这些规则并不比简单的规则好多少。在上述情况下,简单规则A -> B可能比复杂规则有更少的信心,但支持更多。其他规则可能只是这种强势模式的巧合,由于样本规模较小,信心略有增强。
同样,如果您有:
A -> B confidence: 90%
C -> D confidence: 90%
A, C -> B, D confidence: 80%那么,最后的规则甚至是坏的,尽管有很高的信心!前两条规则产生相同的结果,但有更高的信心。所以,最后一条规则不应该是80%正确,而是-10%正确,如果你假设前两个规则保持!
因此,仅仅支持和信任是不够的。
https://stackoverflow.com/questions/36473372
复制相似问题