推荐系统基础 --ShusenWang

学习b站up主的ShusenWang的推荐系统笔记

指标

任何系统/算法/模型都需要评估,对于推荐系统的指标有消费指标和北极星指标,消费指标是衡量用户对产品的使用情况,使用频率广度和深度,用于了解用户的使用习惯,北极星指标是企业用于评估业务增长和成功的指标

消费指标

点击率,收藏率,转发率,点赞率,阅读完成率,诸如此类不同的场景对应的消费指标不同

北极星指标

用户规模,日活(DAU)月活(MAU)

实验流程

离线测试 小流量A/B测试 全流量上线
离线测试与用户没有交互,仅使用历史数据进行训练
小流量A/B测试与小范围的用户进行交互
全流量上线就是推全给所有人使用该推荐算法

推荐流程

在这里插入图片描述
推荐往往要求时间比较短,因此用这样类似筛选的模式减少在线计算量。

召回

在这里插入图片描述

召回通道

召回通道就是召回的方式,如图召回有很多方式,后续会一一讲解
在这里插入图片描述

粗排,精排

在这里插入图片描述
两种架构几乎相同,但是精排往往架构更加复杂,输入特征,提取特征都大于粗排

小结

召回就是通过各种召回通道取出几千条文章,粗排就是通过小型神经网络选出几百份,精排就是从几百份中通过深度神经网络再选出几十份,重排就是做多样性抽取,结构打散,插入广告等(因为用户不希望得到同质化严重的内容)。

A/B测试

A/B测试的作用,在离线测试上的算法不一定在在线测试取得好的效果,而不好的效果会对用户造成恶劣的体验,因此在小范围的测试是有必要的,另一方面也可以调整推荐算法的参数。
假设该团队实现了GNN召回通道,在离线测试中取得了正向的效果,下一步就是在小范围用户进行A/B测试考察新的召回通道对在线指标的影响。
GNN的深度为{1,2,3}

随机分桶

假设所有用户为b个,将所有用户随机分成n个筒,用户量足够大的情况下,这n个桶中各项指标应该是一样的。
假设n=10
在这里插入图片描述
使用4个桶,1,2,3作为实验组,GNN深度分别为1,2,3,如果2号桶各项指标相对对照组有显著提升,证明深度为2的GNN召回通道对在线指标有积极作用,值得推全。

流量使用

对于一个公司来说,有很多团队都需要做实验,对于每个桶做什么实验就有一定要求,不能随便给哪个桶安排哪种召回,粗排等。

分层实验

分层实验是将一个推荐流程分为多层,召回层,粗排层,精排层…

同层互斥

相同层中同一个同不能进行多个实验,因为多个实验并行造成的效果有可能是抵消导致1+1<2,也可能是互促导致1+1>2,这样的结果导致不能评估某种召回或实验是有效果还是没有效果,因此同层互斥

不同层正交

不同层正交,意味着不同层的各个实验的效果都是互不影响的,所以每一层都可以使用100%用户

对照 --HoldOut机制

在这里插入图片描述
取10%的用户作为对照组,计算每一层的各项指标与对照组的差距(diff),用于评估各层的成效,一段考核结束后,将推荐系统推全,再随机选择10%的用户作为holdout,刚开始时holdout与其他90%差距不大。
在一个项目中,有的指标是推荐系统刚上线就可以看到变化的,例如点击率,点赞率,有的是长期以往才能看到效果的,比如页面留存率等,但是考核期往往时间较短,为解决这个问题就需要反转实验。

反转实验

反转实验就是在新开的桶里保存一个旧策略来观察他的长期指标变化
在这里插入图片描述

小结

  • 分层实验:同层互斥,不同层正交
  • Holdout:保留10%的用户作为对照组,不受任何实验影响,考察整个部门对项目的贡献
  • 实验推全:将实验作用于100%的用户,推全层与其他层正交
  • 反转实验:在推全层保留一部分使用旧策略,以此观察长期指标的变化,长期观察新旧策略diff

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913619.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux wsl2 docker 镜像复用快速方法

GitHub项目中的devcontainer.json、Dockerfile构建了一个A项目的镜像环境&#xff0c;现在我有一个文件夹&#xff0c;文件夹中只有一个b.py文件&#xff0c;此时我希望使用A项目的环境&#xff0c;如何实现&#xff1f;注意&#xff1a; 建议使用下面的方法2 解决方案&#xf…

(生活比喻-图文并茂)http2.0和http3.0的队头阻塞,http2.0应用层解决,TCP层存在,3.0就是彻底解决,到底怎么理解区别???

说明一下&#xff1a; http属于应用层协议&#xff0c;TCP和udp属于传输层协议 文章目录阶段一&#xff1a;HTTP/1.1 的情况&#xff08;单车道收费站&#xff0c;一次过一辆&#xff09;阶段二&#xff1a;HTTP/2 的情况&#xff08;多车道收费站&#xff0c;但出口只有一条路…

ARM环境openEuler2203sp4上部署19c单机问题-持续更新

问题01、报错如下orcl:/home/oracledb15> export CV_ASSUME_DISTIDRHEL8 orcl:/home/oracledb15> $ORACLE_HOME/runInstaller -applyPSU /soft/37642901 Exception in thread "main" java.lang.UnsatisfiedLinkError: /u01/app/oracle/product/19.0.0/db_1/oui…

php成绩分析系统单科分数分布分析202507

提交二维数据表&#xff0c;识别成绩科目显示科目选择&#xff0c;选择科目后显示样本数,平均分,最高分,最低分,中位数,柱状图图表显示各分值人数分布&#xff0c;表格显示统计数据。 技术&#xff1a;html5css3ajaxphp 原生代码实现。 效果图&#xff1a; 下载&#xff1a; …

Redis Cluster 与 Sentinel 笔记

目录 Redis 集群&#xff08;Cluster&#xff09;概述 Cluster 的工作原理 Cluster 配置与部署 Cluster 常见问题与限制 Redis Sentinel&#xff08;哨兵&#xff09;机制概述 Sentinel 的工作机制 Sentinel 配置与部署 Sentinel vs Cluster 总结 Redis 集群&#xff…

LLM视觉领域存在模型视觉识别不准确、细粒度视觉任务能力不足等科学问题

LLM视觉领域存在模型视觉识别不准确、细粒度视觉任务能力不足等科学问题 除了前面提到的数据集,还有一些用于评估视觉推理等能力的经典数据集。目前关于LLM视觉领域经典提示词方面的名校或大公司论文较少,以下是相关科学问题、数据集及部分相关论文介绍: 科学问题 视觉推理…

Node.js worker_threads:并发 vs 并行

一、核心结论 Node.js 的 worker_threads 模块实现的是 并行计算 &#xff0c;而非传统意义上的“并发”。其通过操作系统级线程实现多核 CPU 的并行执行&#xff0c;同时保留 Node.js 单线程事件循环的并发模型。 二、关键概念解析 1. 并发&#xff08;Concurrency&#xff09…

gloo 多卡训练

我们遇到了分布式训练中的通信超时问题&#xff08;Connection closed by peer&#xff09;。根据错误信息&#xff0c;问题发生在梯度同步的屏障&#xff08;barrier&#xff09;操作时。以下是针对此问题的优化措施和代码修改&#xff1a; 优化措施&#xff1a; 增强通信稳…

【Docker】在银河麒麟ARM环境下离线安装docker

1、前言 采用离线安装的方式。 关于离线安装的方式官网有介绍&#xff0c;但是说的很简单&#xff0c;网址&#xff1a;Binaries | Docker Docs 官网介绍的有几种主流linux系统的安装方式&#xff0c;但是没有kylin的&#xff0c;所以在此记录一下。 在安装过程中也遇到了些…

AUTOSAR进阶图解==>AUTOSAR_SWS_SOMEIPTransformer

AUTOSAR SOME/IP 转换器规范详解 基于AUTOSAR标准的SOME/IP转换器协议解析与实现指南目录 1. 介绍与功能概述2. SOME/IP架构 2.1 SOME/IP转换器架构2.2 组件解释2.3 层级说明 3. SOME/IP通信流程 3.1 客户端/服务器通信序列3.2 通信流程解释 4. SOME/IP消息结构 4.1 消息结构类…

Python 机器学习核心入门与实战进阶 Day 5 - 模型调参与交叉验证技巧(GridSearchCV、KFold)

✅ 今日目标 理解模型调参的重要性&#xff08;避免欠拟合/过拟合&#xff09;掌握 GridSearchCV 的使用方法学习 K 折交叉验证的基本流程与意义对比不同参数组合的表现使用 Pipeline 简化流程&#xff08;进阶&#xff09;&#x1f4d8; 一、调参思路方法描述Grid Search穷举所…

Python打卡:Day47

复习日 浙大疏锦行

ACE-Step:AI音乐生成基础模型

ACE-Step是什么 ACE-Step 是 ACE Studio 和 StepFun 联合推出的一款开源音乐生成基础模型&#xff0c;专为高效、连贯、可控的音乐创作而设计。它融合了扩散模型、深度压缩自编码器&#xff08;DCAE&#xff09;和轻量级线性变换器&#xff0c;生成速度比传统大模型快约 15 倍…

Web前端: :is(通用选择器)

:is(通用选择器)CSS中的 :is() 选择器是⼀个功能强⼤的伪类选择器&#xff0c;它⽤于简化复杂的选择器&#xff0c;特别是在处理多个相似的选择器时。:is() 选择器接受 ⼀个选择器列表作为参数&#xff0c;然后匹配列表中任何⼀个选择器所选中的元素。:is() 选择器核心概念基本…

【学习笔记】网络设备(华为交换机)基础知识 24 —— 以太网子接口基础知识

**总结&#xff1a;分享华为交换机以太网子接口基础知识&#xff1a;包含子接口的简介、功能、分类以及二层以太网子接口配置终结子接口、三层以太网子接口配置终结子接口和检查配置结果的相关命令 ** 一、子接口的概念 1、子接口的简介以太网子接口&#xff1a;‌是通过协议和…

在Docker中安装nexus3(作为maven私服)

1. 为什么我不推荐安装nexus2&#xff1f; 有两个原因&#xff1a;&#xff08;1&#xff09;nexus2安装麻烦&#xff0c;nexus3安装更方便 &#xff08;2&#xff09;Nexus 3相对于Nexus 2进行了一些重要的改进和增强。它引入了新的存储引擎、更多的仓库类型支持、改进的权限…

一、MySQL 8.0 之《EXPLAIN ANALYZE 执行计划》

文章目录一、MySQL EXPLAIN ANALYZE 执行计划指南主要功能实际执行性能分析详细的执行统计性能瓶颈识别与普通 EXPLAIN 的区别使用场景查询优化问题诊断总结二、EXPLAIN ANALYZE 执行计划样例分析执行顺序解读逐行详细解释第 7 行 (最内层)第 6 行第 5 行第 4 行第 3 行第 2 行…

Google I/O Extended :2025 Flutter 的现状与未来

大家好&#xff0c;我是 Flutter GDE 郭树煜&#xff0c;Github GSY 项目的维护人&#xff0c;今天主要分享的内容是「Flutter 的现状与未来」&#xff0c;可能今天更多会是信息科普类型的内容&#xff0c;主要是分享关于 Flutter 的现状与未来 现状 其实 Flutter 从开源到现在…

软考(软件设计师)数据库原理:事务管理,备份恢复,并发控制

数据库事务管理与备份恢复 事务&#xff08;Transaction&#xff09; 是数据库管理系统中执行的一个不可分割的工作单元&#xff0c;它包含一组 SQL 操作&#xff0c;这些操作要么全部成功执行&#xff0c;要么全部不执行。 事务的四大特性&#xff08;ACID&#xff09;&…

【牛客刷题】相遇

文章目录 一、题目介绍1.1 题目描述1.2 输入描述1.3 输出描述1.4 示例二、解题思路2.1 核心算法设计2.2 性能优化关键2.3 算法流程图三、解法实现3.1 解法一:基础实现3.1.1 初级版本分析3.2 解法二:优化版本(推荐)3.2.1 优化版本分析一、题目介绍 1.1 题目描述 街道可以看…