然而它最大的一个缺点就是,太容易被破解了,是我刚破解的(其实是我在2019年,第一次知道它后没多久,无意中发现破解方法的,直到现在才有空提交代码)
破解指的是,很容易被机器识别,识别率达100%,并且不需要任何机器学习有关的知识...10959, '1172': 3543 },
w: { '2018': 7242, '2035': 3735, '2183': 3672 },
x: { '1610': 7350, '1613': 3706..., '1744': 3762 },
y: { '1274': 10830, '1380': 3490 },
z: { '1694': 11224, '1835': 3701 }
}
每个字母的值都是一个对象...根据以上的统计,有15个字母的path长度存在相同的情况,所以用这个方法的准确率应该不到50%
继续看看那些有相同path长度的字母,发现它们还有很大的不同,比如I和l都有相同的path长度(986),...但是对比一下:
image.png
左边是I,右边是l,可以看到l的最上面,要比I要高一点,虽然直接根据这个特征判断I还是l,似乎很没说服力,但是试了生成几万个I和l,这个的差别都是一样的,这样的话这个特征肯定能拿来用了