【Redis实战篇】基于Redis的功能实现附近商铺查询（Geo），用户签到与统计(Bitmap),网站UV统计（HyperLogLog）

文章目录

- 附近商铺
- - GEOSEARCH 实现
  - - 语法
    - - 参数解释
  - GEORADIUS 实现
  - 基本语法
  - 参数详解
  - - 必选参数
    - 可选参数
    - 参数详解
    - - 必选参数
  - 代码实现
- 用户签到
- - Bitmap
  - Redis 中 Bitmap 基本操作
  - - 1. 设置位值
    - 2. 获取位值
    - 3. 统计位值为 1 的数量
    - 4. 位图运算
  - Spring Data Redis 中操作 Bitmap
  - - 1. 操作示例
    - (1) 设置某一位的值
    - (2) 获取某一位的值
    - (3) 统计位图中值为1的位数
    - (4) 位运算（AND/OR/XOR/NOT）
  - 实现签到
  - 实现签到统计
  - - 另一种实现方法
- UV统计
- - 基本定义
  - HyperLoglog
  - 应用场景
  - 基本原理
  - Redis 中 HyperLogLog 命令
  - - 1. `PFADD`
    - 2. `PFCOUNT`
    - 3. `PFMERGE`
  - Spring Data Redis 操作 HyperLogLog
  - - add
    - size
    - union
  - HyperLogLog的优势
  - - 内存占用极少
    - 计算速度快
    - 近似精度可控

附近商铺

GEOSEARCH 实现

GEOSEARCH 是 Redis 6.2 及以上版本引入的一个命令，用于在有序集合（ZSet）中根据地理位置信息进行搜索。它可以基于给定的经纬度坐标和半径范围，查找符合条件的元素，同时还能按距离排序并返回距离信息。

语法

GEOSEARCH key 
[FROMLONLAT longitude latitude | FROMMEMBER member] 
[BYRADIUS radius m|km|ft|mi | BYBOX width height m|km|ft|mi] 
[ASC|DESC] 
[COUNT count [ANY]] 
[WITHDIST] 
[WITHCOORD] 
[WITHHASH]

参数解释

key：包含地理位置信息的有序集合的键名。
FROMLONLAT longitude latitude：指定搜索的中心点经纬度。
FROMMEMBER member：指定搜索的中心点为有序集合中的某个成员。
BYRADIUS radius m|km|ft|mi：以中心点为圆心，指定半径范围进行搜索，单位可以是米（m）、千米（km）、英尺（ft）或英里（mi）。
BYBOX width height m|km|ft|mi：以中心点为中心，指定矩形区域进行搜索。
ASC|DESC：指定结果按距离升序或降序排列。
COUNT count [ANY]：限制返回结果的数量，ANY 表示在找到 count 个结果后立即返回，不继续遍历。
WITHDIST：返回结果中包含元素与中心点的距离。
WITHCOORD：返回结果中包含元素的经纬度坐标。
WITHHASH：返回结果中包含元素的 Geohash 值。

GEORADIUS 实现

GEORADIUS 是 Redis 中用于基于地理位置信息进行范围查询的命令，它可以找出以给定经纬度为圆心、指定半径范围内的所有地理位置元素。下面详细分析其参数。

基本语法

GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count] [STORE key] [STOREDIST key]

参数详解

必选参数

key
- 描述：存储地理位置信息的有序集合的键名。在 Redis 里，地理位置信息是以有序集合（ZSet）的形式存储的，每个元素代表一个地理位置，其成员是地理位置的名称，分数是对应的 Geohash 值。
- 示例：shops:geo 表示存储店铺地理位置信息的有序集合。
longitude 和 latitude
- 描述：查询的中心点的经纬度。经度范围是 -180 到 180，纬度范围是 -85.05112878 到 85.05112878。
- 示例：116.404 和 39.915 表示北京的大致经纬度。
radius
- 描述：查询的半径大小。
- 示例：2 表示半径为 2 个单位。
m|km|ft|mi
- 描述：半径的单位，可选项有米（m）、千米（km）、英尺（ft）、英里（mi）。
- 示例：km 表示半径单位为千米。

可选参数

WITHCOORD
- 描述：返回结果中包含元素的经纬度信息。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km WITHCOORD，返回结果会包含每个店铺的经纬度。
WITHDIST
- 描述：返回结果中包含元素与中心点的距离，距离单位和查询半径的单位一致。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km WITHDIST，返回结果会包含每个店铺与中心点的距离。
WITHHASH
- 描述：返回结果中包含元素的 Geohash 值。Geohash 是一种将经纬度编码为字符串的方法。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km WITHHASH，返回结果会包含每个店铺的 Geohash 值。
ASC|DESC
- 描述：指定返回结果按距离升序（ASC）或降序（DESC）排列。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km WITHDIST ASC，返回结果按距离中心点由近到远排列。
COUNT count
- 描述：限制返回结果的数量，count 是一个正整数。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km WITHDIST ASC COUNT 5，只返回距离最近的 5 个店铺。
STORE key
- 描述：将查询结果的元素名称存储到指定的有序集合中，存储的分数是元素与中心点的距离。原查询结果不会返回，而是返回存储的元素数量。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km STORE nearby_shops，将符合条件的店铺名称存储到 nearby_shops 有序集合中。
STOREDIST key
- 描述：将查询结果的元素名称和距离存储到指定的有序集合中，存储的分数是元素与中心点的距离。原查询结果不会返回，而是返回存储的元素数量。
- 示例：GEORADIUS shops:geo 116.404 39.915 2 km STOREDIST nearby_shops_with_dist，将符合条件的店铺名称和距离存储到 nearby_shops_with_dist 有序集合中。

在 Spring Data Redis 里，GEORADIUS 命令通过 stringRedisTemplate.opsForGeo().radius() 方法实现，下面详细分析相关参数。

radius() 方法重载形式
主要有两种重载形式：

GeoResults<RedisGeoCommands.GeoLocation<String>> radius(String key, Circle within);
GeoResults<RedisGeoCommands.GeoLocation<String>> radius(String key, Circle within, RedisGeoCommands.GeoRadiusCommandArgs args);

参数详解

必选参数

key
含义：存储地理位置信息的有序集合的键名，对应 Redis GEORADIUS 命令中的 key。
示例：
String key = “shops:geo”;
Circle within
含义：定义查询范围，包含中心点和半径。Circle 由 Point 和 Distance 组成，Point 表示中心点经纬度，Distance 表示半径及单位。对应 Redis GEORADIUS 命令中的 longitude、latitude、radius 和 m|km|ft|mi。

代码实现

@Override
public Result queryShopByType(Integer typeId, Integer current, Double x, Double y) {// 1.判断是否需要根据坐标查询if (x == null || y == null) {// 不需要坐标查询，按数据库查询// 根据类型分页查询Page<Shop> page = query().eq("type_id", typeId).page(new Page<>(current, SystemConstants.DEFAULT_PAGE_SIZE));// 返回数据return Result.ok(page.getRecords());}// 2.计算分页参数int begin = (current - 1) * SystemConstants.MAX_PAGE_SIZE;int end = begin + SystemConstants.MAX_PAGE_SIZE;// 3.查询redis、按照距离排序、分页。结果：shopId、distanceString key = SHOP_GEO_KEY + typeId;// GEOSEARCH key BYLONLAT x y BYRADIUS 10 WITHDISTANCE// 构建GEO查询参数RedisGeoCommands.GeoRadiusCommandArgs args = RedisGeoCommands.GeoRadiusCommandArgs.newGeoRadiusArgs().includeDistance().sortAscending().limit(end);// 查询店铺信息GeoResults<RedisGeoCommands.GeoLocation<String>> results = stringRedisTemplate.opsForGeo().radius(key, new Circle(new Point(x, y), new Distance(5000)), args);// 结果为空返回空集合if (results == null) {return Result.ok(Collections.emptyList());}// 解析出distance,跳过begin以前Map<Long,Distance> distanceMap = results.getContent().stream().skip(begin).collect(Collectors.toMap(result ->Long.valueOf(result.getContent().getName()),GeoResult::getDistance,(existing, replacement) -> existing,LinkedHashMap::new));if (distanceMap.size() == 0) {return Result.ok(Collections.emptyList());}// 解析出id// keySet<Long> ids = distanceMap.keySet();String idsStr = StrUtil.join(",", ids);// 根据id查询店铺// sql: select * from tb_shop where id in (?, ?, ?) order by field(id, ?, ?, ?)List<Shop> shops = query().in("id", ids).last("ORDER BY FIELD(id," + idsStr + ")").list();// 遍历店铺，设置距离for (Shop shop : shops) {shop.setDistance(distanceMap.get(shop.getId()).getValue());}return Result.ok(shops);
}

用户签到

Bitmap

Bitmap 即位图，在 Redis 里是一种特殊的数据类型，它借助字符串类型来实现位操作，本质上是二进制数组。每个位只能存储 0 或 1，非常适合处理大量的布尔值，如用户签到、在线状态等场景。下面介绍 Redis 中 Bitmap 的基本用法，同时给出 Spring Data Redis 里操作 Bitmap 的示例。

Redis 中 Bitmap 基本操作

1. 设置位值

使用 SETBIT 命令可以设置指定偏移量上的位值。

SETBIT key offset value

key：位图的键名。
offset：位的偏移量，从 0 开始。
value：位的值，只能是 0 或 1。

示例：

SETBIT user:sign:1 0 1

上述命令将 user:sign:1 这个位图在偏移量 0 处的值设置为 1。

2. 获取位值

使用 GETBIT 命令可以获取指定偏移量上的位值。

GETBIT key offset

key：位图的键名。
offset：位的偏移量，从 0 开始。

示例：

GETBIT user:sign:1 0

该命令会返回 user:sign:1 位图在偏移量 0 处的值。

3. 统计位值为 1 的数量

使用 BITCOUNT 命令可以统计位图中值为 1 的位的数量。

BITCOUNT key [start end]

key：位图的键名。
start 和 end（可选）：指定字节范围，用于统计该范围内值为 1 的位的数量。

示例：

BITCOUNT user:sign:1

此命令会统计 user:sign:1 位图中值为 1 的位的总数。

4. 位图运算

使用 BITOP 命令可以对多个位图进行逻辑运算，支持 AND、OR、XOR 和 NOT 操作。

BITOP operation destkey key [key ...]

operation：逻辑运算类型，如 AND、OR、XOR、NOT。
destkey：存储运算结果的位图键名。
key [key ...]：参与运算的位图键名。

示例：

BITOP AND result:and user:sign:1 user:sign:2

该命令对 user:sign:1 和 user:sign:2 两个位图进行逻辑与运算，并将结果存储在 result:and 位图中。

Spring Data Redis 中操作 Bitmap

1. 操作示例

(1) 设置某一位的值

@Autowired
private RedisTemplate<String, Object> redisTemplate;// 设置指定偏移量（offset）的位为 1 或 0
public void setBit(String key, long offset, boolean value) {redisTemplate.opsForValue().setBit(key, offset, value);
}// 示例：用户ID=1001在2023-10-01签到（标记为1）
setBit("sign:2023-10:1001", 0, true); // 第0位表示某一天

(2) 获取某一位的值

public Boolean getBit(String key, long offset) {return redisTemplate.opsForValue().getBit(key, offset);
}// 示例：检查用户ID=1001在2023-10-01是否签到
Boolean isSigned = getBit("sign:2023-10:1001", 0);

(3) 统计位图中值为1的位数

public Long bitCount(String key) {return redisTemplate.execute((RedisCallback<Long>) conn -> conn.bitCount(key.getBytes()));
}// 示例：统计用户ID=1001在2023-10月的签到总天数
Long signCount = bitCount("sign:2023-10:1001");

(4) 位运算（AND/OR/XOR/NOT）

public void bitOp(RedisStringCommands.BitOperation op, String destKey, String... srcKeys) {redisTemplate.execute((RedisCallback<Long>) conn -> conn.bitOp(op, destKey.getBytes(), Arrays.stream(srcKeys).map(k -> k.getBytes()).toArray(byte[][]::new)));
}// 示例：计算两个用户签到记录的交集（AND）
bitOp(RedisStringCommands.BitOperation.AND, "sign:result", "sign:user1", "sign:user2");

通过以上操作，你可以在 Redis 和 Spring Data Redis 中使用 Bitmap 处理布尔值相关的业务场景。

实现签到

@Override
public Result sign() {// 获取当前登录用户Long userId = UserHolder.getUser().getId();// 当前日期LocalDateTime now = LocalDateTime.now();// keyString key = USER_SIGN_KEY + userId + ":" + now.getYear() + ":" + now.getMonth();// 获取今天是本月的第几天int dayOfMonth = now.getDayOfMonth();// 签到，写入redisstringRedisTemplate.opsForValue().setBit(key, dayOfMonth - 1, true);return Result.ok();
}

实现签到统计

@Override
public Result signCount() {// 获取当前登录用户Long userId = UserHolder.getUser().getId();// 当前日期LocalDateTime now = LocalDateTime.now();// keyString key = USER_SIGN_KEY + userId + ":" + now.getYear() + ":" + now.getMonth();// 获取今天是本月的第几天int dayOfMonth = now.getDayOfMonth();// 签到，写入redis// BITFIELD key u4 0List<Long> result = stringRedisTemplate.opsForValue().bitField(key,BitFieldSubCommands.create().get(BitFieldSubCommands.BitFieldType.unsigned(dayOfMonth)).valueAt(0));if (result == null || result.isEmpty()){return Result.ok(0);}Long num = result.get(0);if (num == null || num == 0) {return Result.ok(0);}int count = 0;while(num!=0){if((num&1)==1){count++;}num>>=1;}return Result.ok(count);
}

另一种实现方法

@Override
public Result signCount() {// 获取当前登录用户Long userId = UserHolder.getUser().getId();// 当前日期LocalDateTime now = LocalDateTime.now();// keyString key = USER_SIGN_KEY + userId + ":" + now.getYear() + ":" + now.getMonth();// 获取今天是本月的第几天int dayOfMonth = now.getDayOfMonth();// 签到，写入redis// BITFIELD key u4 0Long cnt = stringRedisTemplate.execute((RedisCallback<Long>) conn -> conn.bitCount(key.getBytes()));return cnt;
}

UV统计

UV 是 Unique Visitor 的缩写，即独立访客，UV 统计是互联网领域中用于衡量网站、应用程序或特定页面访问量的重要指标，用于统计在一定时间内访问某个站点或应用的不同用户数量。下面从多个方面详细介绍 UV 统计的相关概念。

基本定义

独立访客指的是在特定时间段内，访问某一网站或应用的不同自然人。同一用户在该时间段内多次访问，仅计算为一个独立访客。比如，在一天内，用户 A 访问了某网站 5 次，用户 B 访问了 3 次，此时该网站当天的 UV 为 2。

HyperLoglog

在 Spring Data Redis 中使用 HyperLogLog (HLL) 进行 UV 统计，可以通过以下步骤实现。HyperLogLog 提供了一种高效且内存友好的方式来处理大规模独立访客统计，尽管存在约 0.81% 的误差，但适用于大多数场景。

HyperLogLog 是一种概率型数据结构，由 Philippe Flajolet 及其同事在 2007 年提出，2011 年被集成到 Redis 中。它主要用于在牺牲一定精度的前提下，以极小的空间复杂度来统计海量数据的基数（集合中不同元素的个数）。下面从多个方面详细介绍 HyperLogLog。

应用场景

在互联网场景中，很多时候需要统计独立访客数（UV）、独立 IP 数、搜索关键词数量等，这些数据量可能非常庞大。若使用传统数据结构（如 Set）来统计，随着数据量增长，内存占用会急剧上升。而 HyperLogLog 能在保证一定精度的情况下，用极少的内存完成基数统计。

基本原理

HyperLogLog 基于伯努利试验和概率统计原理。简单来说，它把元素通过哈希函数映射为二进制串，记录每个二进制串中从第一个位开始连续 0 的最大个数。根据这些最大 0 个数的统计信息，运用概率公式估算出集合的基数。

Redis 中 HyperLogLog 命令

1. `PFADD`

用于向 HyperLogLog 中添加元素。

PFADD key element [element ...]

key：HyperLogLog 的键名。
element [element ...]：要添加的元素。

示例：

PFADD myhyperloglog user1 user2 user3

2. `PFCOUNT`

用于获取 HyperLogLog 中元素的基数估计值。

PFCOUNT key [key ...]

key [key ...]：要统计的 HyperLogLog 键名，可以指定多个键，此时会返回这些键对应 HyperLogLog 合并后的基数估计值。

示例：

PFCOUNT myhyperloglog

3. `PFMERGE`

用于将多个 HyperLogLog 合并为一个。

PFMERGE destkey sourcekey [sourcekey ...]

destkey：合并后的 HyperLogLog 键名。
sourcekey [sourcekey ...]：要合并的 HyperLogLog 键名。

示例：

PFMERGE mergedhyperloglog myhyperloglog1 myhyperloglog2

Spring Data Redis 操作 HyperLogLog

add

/*** 向 HyperLogLog 中添加元素* @param key HyperLogLog 键名* @param elements 要添加的元素*/
public void addElements(String key, String... elements) {stringRedisTemplate.opsForHyperLogLog().add(key, elements);
}

size

/*** 获取 HyperLogLog 中元素的基数估计值* @param keys 要统计的 HyperLogLog 键名* @return 基数估计值*/
public Long getCount(String... keys) {return stringRedisTemplate.opsForHyperLogLog().size(keys);
}

union

/*** 合并多个 HyperLogLog* @param destKey 合并后的 HyperLogLog 键名* @param sourceKeys 要合并的 HyperLogLog 键名*/
public void mergeHyperLogLogs(String destKey, String... sourceKeys) {stringRedisTemplate.opsForHyperLogLog().union(destKey, sourceKeys);
}

测试结果显示997593条数据，HyperLoglog统计存在误差，但是可以极大减少储存空间的消耗同时增加查询的性能。

HyperLogLog的优势

内存占用极少

固定内存开销：无论要统计的数据量有多大，HyperLogLog 在 Redis 中最多只需要 12KB 的内存空间。相比传统的数据结构，如 Set 或 List，随着数据量的增加，它们的内存占用会线性增长。而 HyperLogLog 能够以恒定的内存来处理海量数据，例如统计每天访问网站的独立用户数，即使访问量达到百万甚至千万级别，内存占用也不会大幅上升。
空间效率高：在需要统计大量基数的场景下，使用 HyperLogLog 能显著减少内存使用。例如，统计一个大型电商平台的日活用户数，若使用 Set 存储每个用户的唯一标识，当用户量达到亿级时，内存占用会非常巨大；而使用 HyperLogLog 仅需 12KB，大大节省了内存资源。

计算速度快

操作复杂度低：HyperLogLog 的插入和查询操作的时间复杂度都是 O(1)。插入元素时，只需对元素进行哈希计算并更新相应的统计信息；查询基数时，直接根据统计信息进行估算，无需遍历整个数据集。这使得在处理大量数据时，操作速度极快，能满足高并发场景下的实时统计需求。
高效处理大数据：在高并发的互联网应用中，需要实时统计大量的独立元素，如实时统计在线用户数、实时计算搜索关键词的数量等。HyperLogLog 能够快速完成插入和查询操作，不会成为系统的性能瓶颈。

近似精度可控

合理的误差范围：HyperLogLog 虽然是概率型数据结构，返回的是基数的近似值，但误差是可控的。在 Redis 中，HyperLogLog 的标准误差约为 0.81%，在大多数实际应用场景下，这个误差是可以接受的。例如，在统计网站的 UV 时，少量的误差不会影响对网站流量整体趋势的判断。
满足业务需求：对于一些对精度要求不是特别高的场景，如宏观的流量统计、大致的用户行为分析等，HyperLogLog 能在保证一定精度的前提下，提供高效的基数统计方案，满足业务对数据快速获取和分析的需求。