快速分页实现热点功能-索引和order by

需求:

分页求出进三天的发布视频的权重

热度 = 权重 / 衰减时间
衰减时间 = 当前时间 - 视频发布时间 小根堆来实现

这个公式可以很好的利用半衰期来进行解决

难点:

如果一次性加载太多到springBoot服务器里面会造成堆内存占用过多,

分页又有可能造成深分页问题,因此选择使用主键(雪花id)作为游标的快速分页算法

流程:

1:找出当前时间-三天的最大视频id

2:利用视频id作为游标每次选择1000个视频计算热度

3:插入到小根堆当中去

@Scheduled(cron = "30 * * * * ?")  // 每分钟的第30秒执行public void findTopK() { //更新增量表//应该优化一下,选择三天之内最小发布的String tag = "0";Double lambda = 0.001;int K = 15;PriorityQueue<VideoInfo> minHeap = new PriorityQueue<>(Comparator.comparingDouble(v -> calculateWeight(v, lambda)));List<VideoInfo> videoList = videoInfoMapper.selectByGreaterThanVideoIdLimit1000(tag);while(videoList != null && videoList.size() != 0){for (VideoInfo video : videoList) {minHeap.offer(video);if (minHeap.size() > K) {minHeap.poll(); // 移除权重最小的视频}}tag = videoList.get(videoList.size() - 1).getVideoId();videoList = videoInfoMapper.selectByGreaterThanVideoIdLimit1000(tag);}List<VideoInfo> topK = new ArrayList<>(minHeap);topK.sort((a, b) -> Double.compare(calculateWeight(b, lambda), calculateWeight(a, lambda)));cacheVideo.setHotVideos(topK);}/*** 计算半衰期权重* 权重 = (播放量 + 点赞量) * e^(-λ * 时间差)*/private static double calculateWeight(VideoInfo video, double lambda) {long currentTime = System.currentTimeMillis();long createTime = video.getCreateTime().getTime();long timeDiffSeconds = (currentTime - createTime) / 1000; // 转为秒double decayFactor = Math.exp(-lambda * timeDiffSeconds);return (video.getPlayCount() + video.getLikeCount()) * decayFactor;}

雪花id介绍:

Mysql使用索引和order by

注意:using index表示 使用到了索引 , 并且所取的数据完全在索引中就能拿到

返回Using where 说明用户要的字段不完全覆盖,server层要进行过滤,或者进行了回表

  • "Using where" 表示 MySQL 服务器层需要对存储引擎返回的行进行额外的过滤检查

  • 这种检查可能发生在两种情况下:
    a) 存储引擎返回的行不完全符合 WHERE 条件(需要二次过滤)
    b) 需要从存储引擎获取完整行数据(即回表)

没有索引的动用都是using where

-- 假设有索引 (a, b)
EXPLAIN SELECT a, b FROM table ORDER BY a, b;

排序和索引使用的一样,因此会使用索引,不会再进行排序

-- 假设有索引 (a, b)
EXPLAIN SELECT a, b FROM table ORDER BY b, a;

会显示"Using index; Using filesort",因为排序顺序与索引不完全匹配

-- 假设有索引 (a, b)
EXPLAIN SELECT a, b FROM table ORDER BY b, a;

会显示"Using index; Using filesort",因为排序顺序与索引不完全匹配

深分页问题:

MySQL必须读取并丢弃大量不需要的数据才能到达目标分页位置。

SELECT * FROM table INNER JOIN (SELECT id FROM table ORDER BY id LIMIT 10000, 20
) AS tmp USING(id);

优化1:

SELECT * FROM table INNER JOIN (SELECT id FROM table ORDER BY id LIMIT 10000, 20
) AS tmp USING(id);

优化2:

-- 记住上一页最后一条记录的ID
SELECT * FROM table 
WHERE id > 上一页最后ID 
ORDER BY id 
LIMIT 20;

优化3:

索引覆盖

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/93552.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/93552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HAProxy(高可用性代理)

1 HAProxy 简介 HAProxy&#xff08; High Availability Proxy&#xff09;是一个高性能的负载均衡器和代理服务器&#xff0c;为基于 TCP 和 HTTP 的应用程序提供高可用性、负载平衡和代理&#xff0c;广泛应用于提高 web 应用程序的性能和可靠性。它支持多种协议&#xff0c…

Vulnhub靶场:ica1

一、信息收集nmap扫描一下IP。&#xff08;扫不出来的可以看一下前面几篇找ip的步骤&#xff09;下面给了框架的版本是9.2的&#xff0c;我们去kali里搜一下有没有已经公开的漏洞。searchsploit qdPM 9.2 locate 50176.txt more /usr/share/exploitdb/exploits/php/webapps/50…

【Dv3admin】ORM数据库无法查询的问题

Django 运行过程中&#xff0c;数据库连接的健康状态直接影响应用的稳定性和数据访问准确性。长时间空闲的数据库连接经常因外部机制被回收&#xff0c;进而引发数据查询异常和返回无效结果。 本文围绕 Django 中数据库连接长时间空闲导致的连接失效问题&#xff0c;介绍相关的…

使用 Flownex 对机械呼吸机进行建模

当患者无法独立呼吸时&#xff0c;机械呼吸机通过气管插管将富氧空气输送到患者的肺部。肺是敏感而复杂的器官&#xff0c;因此在无法忍受的压力和体积范围内提供空气&#xff0c;根据每分钟所需的呼吸次数计时&#xff0c;并适当加湿和加热。机械呼吸机的精确建模对于其安全有…

力扣刷题日常(7-8)

力扣刷题日常(7-8) 第7题: 整数反转(难度: 中等) 原题: 给你一个 32 位的有符号整数 x ,返回将 x 中的数字部分反转后的结果. 如果反转后整数超过 32 位的有符号整数的范围 [−231, 231 − 1] ,就返回 0. 假设环境不允许存储 64 位整数&#xff08;有符号或无符号&#xff09;.…

串口接收数据包(协议带帧头帧尾)的编程实现方法:1、数据包格式定义结构体2、使用队列进行数据接收、校验解包

这种带帧头帧尾的数据包处理流程可以简单概括为 “识别边界→提取有效数据→验证完整性” 三个核心步骤&#xff0c;具体操作如下&#xff1a;1. 数据包格式定义&#xff08;先约定规则&#xff09;首先明确一个 “合格数据包” 的结构&#xff0c;比如&#xff1a; 帧头&#…

JSON 对象封装教程

JSON 对象封装方法在 Java 中封装 JSON 对象通常使用第三方库&#xff0c;如 org.json、Gson 或 Jackson。以下是几种常见的方法&#xff1a;使用 org.json 库添加 Maven 依赖&#xff1a;<dependency><groupId>org.json</groupId><artifactId>json<…

【WRF-Chem】EDGAR 排放数据处理:分部门合并转化为二进制(Python全代码)

目录 process.py process_biofl.py process_fossil.py process_micro.py process_sector.py 参考 process.py 读取 EDGAR 排放数据库中 2000 至 2023 年间不同行业的甲烷(CH₄)排放数据,进行合并处理,并将总排放以二进制格式保存到文件中。 导入必要的库 import numpy as n…

【学习过程记录】【czsc】1、安装

文章目录 背景 安装 安装python 安装czsc 功能测试 附录 奇葩的报错 背景 详见: https://github.com/waditu/czsc 安装 安装python !重要!作者强调,python必须是大于等于3.8 为此呢,我也是花了一点时间装了一个python3.13。 安装czsc 关于czsc的安装呢,官方也是给出…

Python批量生成N天前的多word个文件,并根据excel统计数据,修改word模板,合并多个word文件

1&#xff0c;需求 根据word模板文件&#xff0c;生成多个带日期后缀的word文件根据excel-每日告警统计数量&#xff0c;逐个修改当日的文档2&#xff0c;实现 shell脚本&#xff1a;根据word模板文件&#xff0c;生成多个带日期后缀的word文件 #!/bin/bash # 生成近一年日期 …

基于uni-app的血糖血压刻度滑动控件

想要做一个基于uni-app的血糖血压刻度滑动控件&#xff0c;hbuilder市场没有好的&#xff0c;参照别人的写了一个。如图&#xff1a;源码&#xff0c;自己放入components里面。<!-- 刻度滑动选择 --> <template><view><view class"slide-title"…

C语言(02)——标准库函数大全(持续更新)

想要了解更多的C语言知识&#xff0c;可以订阅下面的专栏&#xff0c;里面也有很多品质好文&#xff1a; 打怪升级之路——C语言之路_ankleless的博客-CSDN博客 还在持续更新中&#xff0c;以下是学习过程中遇到的一些库函数&#xff08;排序不分先后&#xff09;&#xff1a…

永磁同步电机无速度算法--静态补偿电压模型Harnefors观测器

一、原理介绍本文基于Harnefors教授提出的静态补偿电压模型&#xff0c;可以实现带载零速启动、正反转切换等功能&#xff0c;原理清晰&#xff0c;实现简便。二、仿真模型在MATLAB/simulink里面验证所提算法&#xff0c;搭建仿真。采用和实验中一致的控制周期1e-4&#xff0c;…

[SKE]Python gmssl库的C绑定

Python gmssl库的C绑定 摘要:本文展示gmssl库的C绑定,并给出完整代码。将参考模型从Python脚本迁移到纯C代码中使用gmssl库(TongSuo项目,支持国密算法如SM4,同时兼容AES、DES、3DES、RSA等)。这样,UVM(SystemVerilog)可以通过DPI-C直接调用C函数,而无需嵌入Py…

4.方法的使用

方法是指一段具有独立功能的代码块&#xff0c;只有被调用时才会执行方法的主要作用体现在&#xff1a;代码组织&#xff1a;将原本挤在一起的臃肿代码按照功能进行分类管理例如&#xff1a;将用户注册的验证逻辑、数据库操作、结果返回等分离成不同方法提高复用性&#xff1a;…

day21-Excel文件解析

目录 1. 概述 2. Apache POI 3. XSSF解析Excel文件 3.1. 添加Jar包依赖 3.2. Workbook&#xff08;Excel文件&#xff09; 3.2.2. 加载&#xff08;解析&#xff09;Excel文件 3.3. Sheet &#xff08;工作簿&#xff09; 3.3.1. 创建工作簿 3.3.2. 获取工作簿 3.3.3.…

与 TRON (波场) 区块链进行交互的命令行工具 (CLI): tstroncli

源码仓库 一个基于 Node.js 和 TypeScript 构建的&#xff0c;用于与 TRON (波场) 区块链进行交互的命令行工具 (CLI)。 本项目旨在提供一个简单、可扩展的框架&#xff0c;让开发者可以轻松地通过命令行调用 TRON 的 HTTP API&#xff0c;实现查询链上信息、发送交易等操作。…

rabbitmq--默认模式(点对点)

导入包&#xff1a;<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-amqp</artifactId> </dependency>application.yml springrabbitmq:host: localhostport: 5672username: guestpassword: gue…

外网访问文档编辑器Docsify(Windows版本),内网穿透技术应用简便方法

如果你正在为项目写文档&#xff0c;但又不想折腾复杂的构建流程&#xff0c;也不想维护一堆静态 HTML 文件&#xff0c;那你一定要试试 docsify。docsify 是一个基于 JavaScript 的开源文档生成工具&#xff0c;它最大的特点就是“无构建”&#xff1a;你只需要写 Markdown 文…

第4章唯一ID生成器——4.5 美团点评开源方案Leaf

Leaf是美团点评公司基础研发平台推出的一个唯一ID生成器服务&#xff0c;其具备高可靠性、低延迟、全局唯一等特点&#xff0c;目前已经被广泛应用于美团金融、美团外卖、美团酒旅等多个部门。Leaf根据不同业务的需求分别实现了Leaf-segment和Leaf-snowflake两种方案&#xff0…