腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1049)
视频
沙龙
2
回答
bloom filter实现如何保持干净?
、
既然它们被填满了,假阳性
的
百分比也增加了,那么有哪些技术可以防止它们饱和呢?似乎您不能清空位,因为这将立即对存储在该节点中
的
数据产生负面影响。即使你有一个已知大小
的
集合,在使用像Cassandra这样
的
bloom
过滤器
的
数据存储中,让我困惑
的
是节点中
的
数据将被添加和删除,对吧?但是当您删除一个键时,您不能将其bloom filter bucket设置为0,因为这可能会对散列到一个或多个与删除
的
键相同
的
bucket<e
浏览 2
提问于2011-08-13
得票数 2
回答已采纳
1
回答
在函数数量固定
的
情况下,如何在给定误报概率
的
情况下
计算
布
隆
过滤器
的
大小?
、
我需要实现一个
布
隆
过滤器
。我找不到解决
的
办法。例如,我希望
过滤器
有10%
的
假阳性,我有number函数和集合中元素
的
数量。如何
计算
匹配误报概率
的
Bloom Filter大小?
浏览 1
提问于2011-12-19
得票数 2
1
回答
如何跨多个服务器使用Bloom Filter?
、
、
现在他们在后台使用Redis来跟踪已经被抓取
的
URL;然而,ElastiCache变得成本高昂,我一直在遇到打开太多连接
的
问题。我一直在考虑将Bloom filter作为后端实现,但我不明白如何才能让所有50台服务器共享相同
的
bloom Filter。我不希望每个人都有自己独立
的
布
隆
过滤器
,否则他们基本上都在做相同
的
任务。
浏览 4
提问于2016-01-01
得票数 1
1
回答
perl持久
布
隆
过滤器
、
我有一个运行多个perl工作进程
的
系统,所有这些进程都需要查找bloom filter。有没有一种方法可以使用在多个进程之间共享
的
bloomfilter 我甚至需要将数据持久化到磁盘上,因为每次重新启动系统时,我都可以重用bloomfilter数据
浏览 7
提问于2016-01-28
得票数 2
1
回答
如何在Scala中对bloom filter建模
、
、
、
、
逻辑本身实际上非常简单,但我正在努力弄清楚如何充分利用Scala
的
数据结构,使其更好、更实用、更实用。我
的
问题是:如果我使用一个case类,我需要构造函数来生成哈希函数和存储实际
布
隆
过滤器
数据
的
位数组。但是,在像"add“这样会更改位数组内容
的
方法中,我需要返回一个新
的
布
隆
过滤器
,而不是改变现有
布
隆
过滤器
的
内容,以便我
浏览 45
提问于2019-03-04
得票数 0
回答已采纳
1
回答
概率数据结构和草图之间
的
区别是什么?
、
、
、
根据
的
说法,概率数据结构是给出
近似
而不是精确答案
的
数据结构。特别是,它们具有非常低
的
时间和空间复杂度,并且很容易并行化,这使得它们
的
使用非常有效。提供
的
示例包括
布
隆
过滤器
、最小计数草图和HyperLogLog。 然而,所有这些数据结构也被称为“草图”数据结构-通过紧凑
的
表示来
近似
大集合
的
结构,以实现更有效(但不太精确)
的
操作。我看不出“草图”和“概率”数据结构之间
浏览 5
提问于2018-07-09
得票数 0
1
回答
假阳性数
布
隆
过滤器
、
、
、
我实现了一个带有3个哈希函数
的
布
隆
过滤器
,现在我应该
计算
该
过滤器
中
的
误报(而不是可能性)的确切数量。有没有一种有效
的
方法来
计算
?
过滤器
中
的
项数为2亿,位数组大小为4亿
浏览 36
提问于2019-11-23
得票数 0
2
回答
为什么
布
隆
过滤器
被称为“
过滤器
”?
、
为什么
布
隆
过滤器
被称为“
过滤器
”。它们
的
行为更像集合,或者至少是可以查询成员资格
的
匿名集合。
过滤器
在其中起了什么作用?
浏览 0
提问于2011-08-11
得票数 2
回答已采纳
2
回答
数据流中
的
近似
重复检测
、
、
、
我目前正在开发一个能生成大量文本内容
的
流式API。不出所料,API提供了大量重复数据,我们也有过滤接近重复数据
的
业务需求。但是,我想要识别
近似
重复项,我还查看了散列算法,如LSH和MinHash,它们用于最近邻问题和
近似
重复检测。我有点卡住了,正在寻找
浏览 1
提问于2012-04-27
得票数 6
回答已采纳
1
回答
如何检查旧分区中使用
的
Bloom Filter
、
我有一个包含一些分区
的
表,最近bloom filter发生了变化。有没有办法查看在旧数据中使用了哪种
布
隆
过滤器
? 据我所知,一旦你改变了
布
隆
过滤器
,只有新
的
数据会受到影响。 诚挚
的
问候
浏览 18
提问于2019-08-26
得票数 0
1
回答
什么是
布
隆
过滤器
的
“快速”哈希函数?
、
假设我正在研究和调整
布
隆
过滤器
的
散列函数,使用一个可能被广泛接受为“快速”
的
函数来
计算
散列所需
的
最大周期数是多少?
浏览 1
提问于2014-01-26
得票数 1
1
回答
Bloom Filter
的
最佳配置是什么?
我正在尝试找出Bloomfilter
的
最佳配置。bloomfilter值应该是什么?有没有什么公式可以根据节点、数据大小、读写频率
计算
出最优数量?
浏览 2
提问于2013-10-19
得票数 0
3
回答
位集向量和bloom
过滤器
之间
的
C-差异
、
所以我理解位集向量本质上可以为你在每个位中存储真/假集合,但是我对它和
布
隆
过滤器
之间
的
区别感到困惑,我知道
布
隆
过滤器
利用散列函数并且可以返回误报,但是它们可以存储
的
数据类型/它们可以做
的
函数
的
实际区别是什么
浏览 2
提问于2017-04-24
得票数 0
1
回答
bloom filter会在某些情况下总是返回误报吗?
、
、
假设
布
隆
过滤器
api具有2个参数- 1.
布
隆
过滤器
中
的
比特数(n)和2.插入
的
预期数量(m)。m > n是否总是会导致complete误报?通过complete,我想说
的
是,在m>n
的
条件下,是否会对“包含(元素)”方法
的
每一个测试都返回true?
浏览 1
提问于2015-03-08
得票数 0
1
回答
Bloom filter可单独存储最后50个数据内容
、
、
在我
的
系统中,将有一个主节点和n个从节点,主节点将把传入
的
请求分发给它
的
一个从节点。为了利用缓存内容,我希望跟踪从属节点已经服务
的
最后50个请求(传入请求
的
散列)(假设最后50个请求已经在缓存中,以便节点能够快速地为请求提供服务)。据我所知,在
布
隆
过滤器
中删除是很困难
的
。是否真的可以保持
布
隆
过滤器
像移动窗口一样(就像在50个请求之后,它应该从前端删除以适应新
的
请求
浏览 4
提问于2012-02-13
得票数 5
1
回答
为什么leveldb
的
bloomfilter
的
位数组需要划分为多个filterblock?
、
因为表是打开
的
,所以整个
过滤器
块都会保存在内存中,如果只有一个bloomfilter位数组,会不会更简单?
浏览 13
提问于2018-12-21
得票数 0
1
回答
C++隐藏符号会增加重定位时间
、
、
、
、
从elf直方图看,优化后存储桶
的
数量保持不变,但成功和不成功
的
查找减少了很多。
布
隆
过滤器
的
大小从8kb减少到4kb,但比特集
的
数量从19%增加到24%。尽管如此,加载时间增加了,我认为这是由于
布
隆
过滤器
中设置
的
位数比以前更高。 查看依赖项,我可以看到大约有400.000个符号在重定位时被查找到我
的
库中,但没有成功。bloom
过滤器
用于过滤其中
的
大
浏览 1
提问于2015-10-12
得票数 4
2
回答
如何在Python中有效地
计算
非常大
的
数据集
的
基数?
、
、
、
、
我一直在使用一些非常非常大
的
数据集,通常是数十亿个元素,这些数据都保存在云中,并定期转储到文件中,对于我
的
一项任务,我会尝试
计算
这些数据集
的
基数。我可以有50%
的
数据集是唯一
的
,或者我也可以有100%。这是以固定
的
时间间隔动态生成
的
,并根据许多因素( example)Dataset大小为100亿
的
一天中
的
时间)而变化。以64进制编码
的
每个项目是20字节,乘以100亿平均是几百千兆字节。不幸
的
浏览 27
提问于2012-04-16
得票数 16
回答已采纳
1
回答
Java中
的
Bloom filter
、
、
基本上,我必须实现一个
布
隆
过滤器
,并使用char 'a‘to 'z’和'A‘to 'Z’来测试它(简单且完成)。 然后我必须测试假阳性,但要求使用"aa“到"ZZ”(字符串)来
计算
假阳性(未完成)。
浏览 0
提问于2011-06-26
得票数 6
3
回答
leveldb/Cassandra
的
bloom
过滤器
对范围查询有帮助吗?
、
、
、
我知道leveldb/cassandra将他们
的
记录存储在SSTable中,并在执行精确
的
键查询时使用bloom filter来选择SSTable,他们
的
bloom filter对键范围查询有帮助吗?
浏览 1
提问于2013-04-20
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
亿级数据之过滤器布隆过滤器
应用 5:层峦叠嶂——redis布隆过滤器
缓存实战(3)让你彻底搞懂布隆过滤器!实现一个自己的BloomFilter
漫画:高效的布隆算法
HBase高级用法之行键设计、高级模式、辅助索引、搜索集成、事务、布隆过滤器以及版本管理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券