-
条件:1、经常判断一个元素是否存在(网站黑名单) 2、数据量很大,如果使用哈希表会浪费很大的空间,希望用比较少的内存空间3、允许有一定的误判率但是比较难删除元素
-
通过一串二进制向量实现、以及N个哈希函数,通过哈希函数计算出生成的索引,在一串二进制数将索引的位置的值置为1。
-
二进制向量以及哈希函数的个数由公式计算而出(M为二进制向量的长度,K为哈希函数的个数,N为数据规模,P为误判率)。
-
-
由于哈希碰撞,所以当布隆过滤器返回true的时候,N个数据中不一定确实存在该元素,因为不同元素的哈希值计算出的索引的位置可能是相同的。
时间复杂度为O(K),K为数目规模
布隆过滤器简单实现原理
于 2022-07-18 21:10:42 首次发布