Redis 在 2.8.9 版本添加了 HyperLogLog 結(jié)構(gòu)。
Redis HyperLogLog 是用來做基數(shù)統(tǒng)計的算法,HyperLogLog 的優(yōu)點(diǎn)是,在輸入元素的數(shù)量或者體積非常非常大時,計算基數(shù)所需的空間總是固定 的、并且是很小的。
在 Redis 里面,每個 HyperLogLog 鍵只需要花費(fèi) 12 KB 內(nèi)存,就可以計算接近 2^64 個不同元素的基 數(shù)。這和計算基數(shù)時,元素越多耗費(fèi)內(nèi)存就越多的集合形成鮮明對比。
但是,因?yàn)?HyperLogLog 只會根據(jù)輸入元素來計算基數(shù),而不會儲存輸入元素本身,所以 HyperLogLog 不能像集合那樣,返回輸入的各個元素。
比如數(shù)據(jù)集 {1, 3, 5, 7, 5, 7, 8}, 那么這個數(shù)據(jù)集的基數(shù)集為 {1, 3, 5 ,7, 8}, 基數(shù)(不重復(fù)元素)為5。 基數(shù)估計就是在誤差可接受的范圍內(nèi),快速計算基數(shù)。
以下示例演示了 HyperLogLog 的工作過程:
redis 127.0.0.1:6379> PFADD nhoookey "redis" 1) (integer) 1 redis 127.0.0.1:6379> PFADD nhoookey "mongodb" 1) (integer) 1 redis 127.0.0.1:6379> PFADD nhoookey "mysql" 1) (integer) 1 redis 127.0.0.1:6379> PFCOUNT nhoookey (integer) 3
下表列出了 redis HyperLogLog 的基本命令:
序號 | 命令及描述 |
---|---|
1 | PFADD key element [element ...] 添加指定元素到 HyperLogLog 中。 |
2 | PFCOUNT key [key ...] 返回給定 HyperLogLog 的基數(shù)估算值。 |
3 | PFMERGE destkey sourcekey [sourcekey ...] 將多個 HyperLogLog 合并為一個 HyperLogLog |