面试官：如何遍历 Redis 中的海量数据？

2023-08-28 11:36 由 Java技术栈发表于 #后端开发

来源：https://www.toutiao.com/article/6697540366528152077/

前言

有时候我们需要知道线上的redis的使用情况，尤其需要知道一些前缀的key值，让我们怎么去查看呢？今天给大家分享一个小知识点！

事故产生

因为我们的用户token缓存是采用了【user_token:userid】格式的key，保存用户的token的值。我们运维为了帮助开发小伙伴们查一下线上现在有多少登录用户。

直接用了keys user_token*方式进行查询，事故就此发生了。导致redis不可用，假死。

分析原因

我们线上的登录用户有几百万，数据量比较多；keys算法是遍历算法，复杂度是O(n)，也就是数据越多，时间复杂度越高。

数据量达到几百万，keys这个指令就会导致 Redis 服务卡顿，因为 Redis 是单线程程序，顺序执行所有指令，其它指令必须等到当前的 keys 指令执行完了才可以继续。

解决方案

那我们如何去遍历大数据量呢？这个也是面试经常问的。我们可以采用redis的另一个命令scan。我们看一下scan的特点

1、复杂度虽然也是 O(n)，但是它是通过游标分步进行的，不会阻塞线程

2、提供 count 参数，不是结果数量，是redis单次遍历字典槽位数量(约等于)

3、同 keys 一样，它也提供模式匹配功能;

4、服务器不需要为游标保存状态，游标的唯一状态就是 scan 返回给客户端的游标整数;

5、返回的结果可能会有重复，需要客户端去重复，这点非常重要;

6、单次返回的结果是空的并不意味着遍历结束，而要看返回的游标值是否为零

推荐一个开源免费的 Spring Boot 实战项目：

https://github.com/javastacks/spring-boot-best-practice

一、scan命令格式

SCAN cursor [MATCH pattern] [COUNT count]

二、命令解释：scan 游标 MATCH <返回和给定模式相匹配的元素> count 每次迭代所返回的元素数量

SCAN命令是增量的循环，每次调用只会返回一小部分的元素。所以不会让redis假死

SCAN命令返回的是一个游标，从0开始遍历，到0结束遍历

三、举例

redis > scan 0 match user_token* count 5 
 1) "6"
 2) 1) "user_token:1000"
 2) "user_token:1001"
 3) "user_token:1010"
 4) "user_token:2300"
 5) "user_token:1389"

从0开始遍历，返回了游标6，又返回了数据，继续scan遍历，就要从6开始

redis > scan 6 match user_token* count 5 
 1) "10"
 2) 1) "user_token:3100"
 2) "user_token:1201"
 3) "user_token:1410"
 4) "user_token:5300"
 5) "user_token:3389"

总结

这个是面试经常会问到的，也是我们小伙伴在工作的过程经常用的，一般小公司，不会有什么问题，但数据量多的时候，你的操作方式不对，你的绩效就会被扣哦，哈哈。谢谢！！！

近期热文推荐：

1.1,000+ 道 Java面试题及答案整理(2022最新版)

2.劲爆！Java 协程要来了。。。

3.Spring Boot 2.x 教程，太全了！

4.别再写满屏的爆爆爆炸类了，试试装饰器模式，这才是优雅的方式！！

5.《Java开发手册（嵩山版）》最新发布，速速下载！

觉得不错，别忘了随手点赞+转发哦！

线程方法接收参数示例，Java的两种线程实现方式区别

# The difference beteen two way 总所周知，Java实现多线程有两种方式，分别是继承Thread类和实现Runable接口，那么它们的区别是什么？ **继承 Thread 类：** 通过继承 Thread 类，你可以创建一个直接表示线程的类。你可以覆盖 Thread 类 ...阅读全文

删数问题

## 问题描述现有$n$个正整数组成的序列$a$，从中删除一个数，得分是其本身同左、右相邻的数的乘积，然后再在剩余的整数中继续删除，注意**序列两端的数字a1和an是不能删除的**，求这样删除$n-2$个整数后的最大得分。例如有四个数$3 、4、5、6$，按照先$4$后$5$的删除顺序，其得分 ...阅读全文

Spring Boot 3 大版本齐发，Java 8 版本马上要退出历史舞台了！

Spring Boot 太狠了，今天一次性发布了三个主要版本，三条版本线同时更新： - Spring Boot 3.1.3 - Spring Boot 3.0.10 - Spring Boot 2.7.15 ![](https://img2023.cnblogs.com/other/1218593/ ...阅读全文

Netty源码学习3——Channel ，ChannelHandler，ChannelPipeline

[系列文章目录和关于我](https://www.cnblogs.com/cuzzz/p/16609728.html) ## 零丶引入在[Netty源码学习2——NioEventLoop的执行](https://www.cnblogs.com/cuzzz/p/17641482.html)中，我们学 ...阅读全文

C++初识

## 1.1 注释 **作用**：在代码中加一些说明和解释，方便自己或其他程序员程序员阅读代码 **两种格式** 1. **单行注释**：`// 描述信息` - 通常放在一行代码的上方，或者一条语句的末尾，==对该行代码说明== 2. **多行注释**： `/* 描述信息 */` - 通常放在一段代 ...阅读全文

【教程分享】Docker搭建Zipkin，实现数据持久化到MySQL、ES

## 1 拉取镜像指定版本，在git查看相应版本，参考： https://github.com/openzipkin/zipkin 如2.21.7 ```bash docker pull openzipkin/zipkin:2.21.7 ``` ## 2 启动 Zipkin默认端口为9411。启动 ...阅读全文

nacos集群搭建

# Nacos集群搭建 # 1.集群结构图官方给出的Nacos集群图： ![image-20210409210621117](https://img2023.cnblogs.com/blog/3014273/202308/3014273-20230827184442168-301140741.pn ...阅读全文

【pandas小技巧】--花哨的DataFrame

最近github上发现了一个库（`plottable`），可以用简单的方式就设置出花哨的 `DataFrame` 样式。 github上的地址：[https://github.com/znstrider/plottable](https://github.com/znstrider/plottabl ...阅读全文

Kafka为什么这么快？

Kafka 是一个基于发布-订阅模式的消息系统，它可以在多个生产者和消费者之间传递大量的数据。Kafka 的一个显著特点是它的高吞吐率，即每秒可以处理百万级别的消息。那么 Kafka 是如何实现这样高得性能呢？本文将从七个方面来分析 Kafka 的速度优势。 - 零拷贝技术 - 仅可追加日志结构 - ...阅读全文

gRPC with JWT

在 gRPC 中使用 JWT（JSON Web Tokens）进行身份验证是一种常见的做法，它可以帮助你确保请求方的身份和权限。下面是一种使用 gRPC 和 JWT 进行身份验证的步骤： 1. **生成和签发 JWT：** 在用户登录成功后，你需要生成一个 JWT 并将其签发给用户。JWT 中可以包 ...阅读全文