
以 QQ 在线状态统计为例,其典型特征包括:数据量大、内存占用高、实时性要求高。传统的解决方案(如在数据库中为每个用户添加一个在线状态字段,上线设为 1,下线设为 0)在这种场景下显得力不从心。原因如下:
因此,我们需要寻找更高效、更适合大规模场景的解决方案。
针对亿级用户在线状态统计,常见的解决方案可分为两类:
通过维护一个总在线人数计数器,用户上线时计数器加 1,下线时减 1,从而实现在线人数的统计。
将用户的标识(如 QQ 号)和在线状态存储在集合中,通过集合操作实现统计。
以下是两种方案的具体实现方式:
基于总数的统计可以通过以下两种方式实现:
incr 和 decr 操作使用 Redis 的 incr(加 1)和 decr(减 1)操作来维护在线人数计数器。用户上线时调用 incr,下线时调用 decr。
Redis 的 HyperLogLog(HLL)是一种高性能的基数(去重)统计数据结构,适用于大规模数据的去重统计。其优点是空间占用率极低(仅需 12KB 空间即可统计约 18 亿数据),但缺点是存在极低的误差率(约 0.81%)。HLL 的特点如下:
基于用户标识(如 QQ 号),可以使用 Redis 的 Bitmap(位数组) 来实现。Bitmap 的结构如下:
SETBIT 命令将对应位置设为 1。SETBIT 命令将对应位置设为 0。GETBIT 命令。BITCOUNT 命令。在 Spring Boot 项目中,可以使用 RedisTemplate 实现用户的上、下线设置以及在线人数统计。具体代码如下:
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.redis.core.RedisTemplate;
import org.springframework.stereotype.Service;
@Service
public class BitmapService {
@Autowired
private RedisTemplate<String, Object> redisTemplate;
/**
* 设置 Bitmap 中的位
* @param key 键
* @param offset 偏移量
* @param value 值(0 或 1)
*/
public void setBit(String key, long offset, boolean value) {
redisTemplate.opsForValue().setBit(key, offset, value);
}
/**
* 获取 Bitmap 中的位
* @param key 键
* @param offset 偏移量
* @return 位的值(0 或 1)
*/
public boolean getBit(String key, long offset) {
return redisTemplate.opsForValue().getBit(key, offset);
}
/**
* 计算 Bitmap 中值为 1 的位的数量
* @param key 键
* @return 值为 1 的位的数量
*/
public Long bitCount(String key) {
return redisTemplate.opsForValue().bitCount(key);
}
}在处理亿级用户在线状态统计时,选择合适的方案至关重要。基于总数的统计方案虽然简单高效,但缺乏精准性;而基于用户标识的统计方案虽然精准,但内存占用较大。结合实际需求,可以选择以下路径: 如果对实时性和性能要求极高,且可以容忍少量误差,可以选择基于 Redis 的 HyperLogLog 或 Bitmap 方案。 如果需要精准查询用户的在线状态,且对内存占用和效率要求较低,可以选择基于用户标识的集合方案。