参考博客 :
关联规则
的置信度 ,
表示 数据集
中包含
项集的事物 , 同时有多大可能性包含
项集 ,
等于 项集
的支持度 与 项集
的支持度 比值 ;
公式为 :
示例 : 数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
求关联规则
的置信度
根据上述公式
计算
置信度 ;
1 . 计算
支持度 :
指的是 数据集
中含有项集
的事务个数 ;
含有
项集的事务有 事务
, 事务
, 事务
, 得出 :
指的是 数据集
的事务总数 ; 得出
计算支持度结果 :
2 . 计算
支持度 , 项集
根据上述公式
计算支持度 ;
指的是 数据集
中含有项集
的事务个数 ;
含有
项集的事务有 事务
, 事务
, 事务
, 事务
, 得出 :
指的是 数据集
的事务总数 ; 得出
则计算支持度 :
3 . 求最终置信度
最终置信度为