从样本中找与预测样本距离最近的k个数据
这k个数据所属类别投票决定了预测样本的类别
距离公式:
余弦相似度:
其中,a,b为包含m个属性的样本,属性计算时要进行规范化(最大最小值规范化或零均值规范化等)
其中 n=1 时曼哈顿距离,n=2是欧式距离,n \to \infty 是切比雪夫距离
最大值最小值规范化:
其中原来取值区间L,R,映射区间l,r,原值x,映射值v
零均值规范化:
其中\mu_A均值,\sigma_A标准差,原值x,映射值v
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。