Jaccard 系数 ( 非恒定相似度计算 )
VII . 二元变量 相似度 计算实例
I . 二元变量
----
1 ....二元变量 的 相似度 计算方法 : 使用 区间标度变量 求样本间距离的方式 处理二元变量 , 误差很大 , 因此这里引入 二元变量可能性表 , 来计算样本的二元变量属性的相似度 ;
II ....恒定相似度 : 对称二元变量 的相似度 , 称为恒定相似度 ;
3 . 恒定相似度特点 : 二元变量表示方式发生改变时 , 相似度的计算结果不会改变 ;
IV ....简单匹配系数 ( 恒定相似度计算 )
----
简单匹配系数 : 两个样本
i , j
之间 , 对称二元变量 的 恒定相似度 计算 , 使用 简单匹配系数 公式计算 , 公式如下 :
d(i ,...Jaccard 系数 ( 非恒定相似度计算 )
----
Jaccard 系数 : 两个样本
i , j
之间 , 不对称二元变量 的 非恒定相似度 计算 , 使用 Jaccard系数 公式计算 ,