基本上,我必须实现一个布隆过滤器,并使用char 'a‘to 'z’和'A‘to 'Z’来测试它(简单且完成)。
然后我必须测试假阳性,但要求使用"aa“到"ZZ”(字符串)来计算假阳性(未完成)。
你知道那是什么意思吗?
发布于 2011-06-26 04:12:19
假阳性需要实际的数据集,我想你的教授的意思是:现在将'a'-'z','A'-'Z‘添加到过滤器(实际数据)中,检查所有字符串"aa"-"ZZ",计算假阳性的数量(所有阳性都将是假的,因为它们都不在数据中)并提取比率:#false_positives/#strings_in_range("aa","ZZ")
编辑: @Bill询问如何在"aa"-"ZZ“上迭代,下面是一个简单的代码片段。
Set<String> set = new HashSet<String>();
for (Character c = 'a';c<='z';c++) {
String lower = c.toString();
String upper = c.toString().toUpperCase();
for (Character k = 'a';k<='z';k++) {
set.add(lower + k.toString());
set.add(lower + k.toString().toUpperCase());
set.add(upper + k.toString());
set.add(upper + k.toString().toUpperCase());
}
}
https://stackoverflow.com/questions/6480172
复制相似问题