除了这个闵可夫斯基距离集合外,还有另外的距离评估体系,例如马氏距离、巴氏距离、汉明距离,这些都是和概率论中的统计学度量标准相关。而像夹角余弦、杰卡德相似系数、皮尔逊系数等都是和相似度有关的。...:夹角余弦,编码差别:汉明距离,集合近似度:杰卡德类似系数与距离,相关:相关系数与相关距离。...在应用中,k值一般选取一个比较小的数值,通常采用交叉验证法来选取最优的k值。
2.3分类决策规则
大多情况是多数表决,即由输入实例的k个近邻中的多数类决定x的类别。也可以采用别的分类决策规则。...01损失函数(CSDN)
3.k近邻算法的实现
实现k-NN算法,主要考虑的问题是如何对训练集进行快速k近邻搜索。
简单实现方式:线性搜索,对于数据量很大时,此方法是不可行的。...3.1简单实现
文件数据
hei,wei,tag
1.5,40,thin
1.5,50,fat
1.5,60,fat
1.6,40,thin
1.6,50,thin
1.6,60,fat
1.6,70,