论文笔记:Large language model augmented narrative driven recommendations

RecSys 2023

代码:iesl/narrative-driven-rec-mint: Mint: A data augmentation method for narrative driven recommendation.

1 intro

  • 尽管基于历史交互的数据能够有效地提供推荐,但用户在请求推荐时,往往只是对目标物品有一个模糊的概念,或者希望推荐结果能够根据其使用情境而变化,而这些上下文信息通常在历史交互数据中缺失
    • 用户常常会通过长篇叙述式查询(long-form narrative queries)来描述他们的广泛兴趣和情境,从而请求推荐。这类信息访问任务被称为叙述驱动推荐(Narrative-Driven Recommendation, 简称 NDR)
    • 这类叙述性请求在讨论论坛和某些 Reddit 子版块中非常常见,但现有推荐系统对这种复杂自然语言查询的支持仍然严重不足
  • 相较于传统的搜索接口,用户使用自然语言表达复杂主观需求的情况正在显著增加
  • 具有强大语言理解能力的大语言模型(LLMs)的出现,也为满足此类复杂请求带来了可能
  • 论文探索如何将传统用于协同过滤推荐器训练的历史用户-物品交互数据集,重新利用于支持 NDR 任务

2 问题定义

3 方法

  • 核心思想是重新利用丰富的用户-物品交互数据集 I,借助大语言模型(LLM)生成叙述式查询 qu​,从而构造训练数据
  • 3.1 使用 LLM 生成叙述式查询

  • 为了为用户-物品交互数据集 I中的每位用户生成叙述式查询 qu,使用InstructGPT 模型作为查询生成器 Qgen

  • 将用户与项目交互所得的文本\{d_i\}_{i=1}^{N_u}作为 QGen 的 prompt,并指示模型生成一个叙述式查询

LLM根据用户的偏好和评论,模拟这位用户可能在 Reddit 上发出的请求性帖文

3.2 为合成查询筛选项目

  • 核心意思是:生成出来的叙述式查询(narrative query)可能无法代表用户所有兴趣,所以需要对用户的项目集合进行筛选,只保留那些与生成的查询最相关的项目,来训练检索模型
    • 如果你用用户的全部项目\{d_i\}_{i=1}^{N_u}来训练模型,会加入很多与当前查询无关的项目,这会增加噪声、降低训练效果。
  • ——>

3.3 检索模型训练

  • 基于上述合成数据训练了 bi-encodercross-encoder 两种模型
    • Bi-encoder 通常作为第一阶段排序器,能够从大规模项目集合中高效检索
    • Cross-encoder 则允许更丰富的查询-项目交互,常用于 reranking 阶段。
    • 在这两种模型中均使用了一个参数规模为 110M 的预训练 Transformer 模型 MPNet,其结构类似于 BERT。
  • 在 bi-encoder 中,查询和项目分别编码为高维向量:
    • 通过L2 距离对项目进行排序
  • 在 cross-encoder 中,模型同时接收查询和项目作为输入,输出一个打分:
  • 损失函数
  • 测试阶段
    • 先用训练好的 bi-encoder 检索前 200 个项目,再用 cross-encoder 对其重新排序。
    • 实验中对这两个阶段分别评估,分别命名为 BiEnc-MintCrEnc-Mint

4 实验

4.1 数据

  • 使用Pointrec进行评估
    • 包含 112 个真实的叙述式查询
    • 这些项目由众包工人和/或论坛成员进行了分级相关性标注,并经数据集作者进一步验证
    • 目前这是唯一公开的、带人工标注和候选池的 NDR 测试集
  • 项目集合 CCC 包含约 70 万个 POI,每个 POI 提供元信息(如类别、城市)和从 Bing 搜索引擎抓取的简略描述
    • 仅对与查询相关城市与类别(如“餐厅”)中的候选项目进行排序,遵循先前工作中避免无关项目干扰的做法
  • 使用 Yelp 的用户-物品交互数据生成合成查询用于训练
    • 排除所有评论数少于 10 的用户和 POI,确保所选用户为高活跃度用户
      • 这一筛选步骤参考了用户-物品推荐系统中常见的预处理流程
    • 保留评分平均值大于 3/5 且有 10-30 条高于平均值评论的用户,以偏向那些更擅长表达喜好(而非厌恶)的用户
      • 这些用户的兴趣也更适合通过生成器建模。最终筛选后,Yelp 数据集中保留了 45,193 个用户
    • 从中随机选出 10,000 位用户生成合成查询。对每位用户,我们从其 10 条评论中随机选一句话,组成 prompt
    • 最终生成约 60,000 条训练样本
      • 生成所有查询的成本约为 230 美元

4.2  结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86514.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86514.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

兴达易控Modbus TCP转Profibus DP网关与安科瑞多功能电表的快速通讯

兴达易控Modbus TCP转Profibus DP网关与安科瑞多功能电表的快速通讯 在工业自动化领域,不同设备之间的通信连接至关重要。兴达易控Modbus TCP转Profibus DP网关接APM810/MCE安科瑞多功能电表与300plc通讯,这一过程涉及到多个关键技术和环节,…

epoll实现理解

根据前文高性能网络设计推演中,epoll作为一个“大杀器”为网络开发提供强大的支持。Linux系统上IO多路复用方案有select、poll、epoll。其中epoll的性能表现最优,且支持的并发量最大。本文大概介绍epoll的底层实现。 一、示例引入 了解epoll开发&#…

协议转换赋能光伏制造:DeviceNET转PROFINET网关的通信质检实践

协议转换赋能光伏制造:DeviceNET转PROFINET网关的通信质检实践 某光伏电池片生产线创新性地将网关作为计算节点,通过搭载DeviceNET-PROFINET智能网关-稳联技术WL-PN-DVNM,在协议转换层直接运行AI质检模型。DeviceNET端采集的高清图像数据经网…

学习永无止境

已掌握以下每个,有属于自己的一套架构方式: vue.element-ui:后台管理 vue.uni-app:H5,小程序,Android,IOS php:​​RESTful,服务,业务逻辑(如电商…

永磁无刷电机旋转原理

目录 1. 磁场的基本知识 2. 角速度,线速度,工程转速 3.力和力矩 4. 惯量,转动惯量 5. 电机的四种状态 5.1 空载 5.2 带载 5.3 满载 5.4 堵转 6. 功和功率 1. 磁场的基本知识 无头无尾,转了一圈,就叫有旋…

Ubuntu 物理桌面远程访问教程(基于 RealVNC / mstsc)

Ubuntu 物理桌面远程访问教程(基于 RealVNC / mstsc) 适用对象:任意安装了 GNOME GDM 的 Ubuntu 系统 目标:远程连接系统默认物理桌面 :0,无虚拟桌面、无 Xfce,真实 GNOME 桌面环境 1. 准备条件 Ubuntu 系…

Vue3 工程化实战

Vue3 工程化实战 引言:构建工具的演进与选择 在前端工程化领域,构建工具的选择直接影响开发效率与项目性能。随着Vue3的普及,构建工具生态也发生了显著变化:传统vue-cli逐渐进入维护模式,而新一代构建工具Vite凭借其…

调用phantomjs(前端)插件生成ECharts图片

package com.demo.common.utils; //json格式化工具,可以其他工具类 import cn.hutool.json.JSONUtil; import lombok.extern. public class FileUtil { /** * 调用phantomjs(前端)插件生成ECharts图片 * @param path 根路径 * @param option ECharts配置J…

React Hooks详解

React Hooks 常考内容 React Hooks 是 React 16.8 引入的重要特性,用于在函数组件中使用状态和其他 React 特性。以下是面试中常考的核心内容: 基础 Hook useState: 用于管理组件内部状态,返回状态变量和更新状态的函数。useEffect: 处理副…

c++17标准std::filesystem常用函数

std::filesystem 是 C17 引入的标准库&#xff0c;用于处理文件系统操作&#xff0c;提供了跨平台的文件和目录操作能力。以下是一些常用的函数和类&#xff1a; 一、路径操作&#xff08;std::filesystem::path&#xff09; cpp 运行 #include <filesystem> namespa…

非结构化文档的自动化敏感标识方法技术解析

在数字化时代&#xff0c;企业与组织面临的数据形态正发生深刻变革。据统计&#xff0c;非结构化数据占企业数据总量的 80% 以上&#xff0c;涵盖文本、邮件、PDF、日志、社交媒体内容等多种形式。这些数据中往往蕴含着大量敏感信息&#xff0c;如个人身份信息、商业机密、医疗…

c语言中的字符类型

字符类型 char char是一种整数&#xff0c;也是一种特殊的类型&#xff1a;字符。 #include <stdio.h> int main(){char c,d;c 1; //把整数1赋值给变量cd 1; //把字符‘1’赋值给变量dif (c d){printf("相等");}else{printf("不相等\n");…

Cribl stream 管道对时间的改变时区

先说一下时区的重要性&#xff0c;要是cribl 时区是UTC&#xff0c;但是过来数据是GTM8 就是中国时区&#xff0c;那么数据过来&#xff0c;就可能在后端的Splunk 没有显示&#xff0c;那么解决这个问题&#xff0c;cribl 管道引入了auto timestamp 的功能&#xff1a; 注意到&…

深度学习:PyTorch卷积神经网络(1)

本文目录&#xff1a; 一、CNN概述二、CNN日常应用三、CNN的卷积层&#xff08;一 &#xff09;基本介绍&#xff08;二&#xff09;卷积层计算1.对输入数据的要求2.卷积核核心参数3.计算过程4.特征图尺寸计算5.1、多通道卷积计算5.2、多卷积核计算6.PyTorch卷积层API 前言&…

linux网络编程socket套接字

套接字概念 Socket本身有“插座”的意思&#xff0c;在Linux环境下&#xff0c;用于表示进程间网络通信的特殊文件类型。本质为内核借助缓冲区形成的伪文件。 既然是文件&#xff0c;那么理所当然的&#xff0c;我们可以使用文件描述符引用套接字。与管道类似的&#xff0c;L…

Python 数据分析与可视化 Day 5 - 数据可视化入门(Matplotlib Seaborn)

&#x1f3af; 今日目标 掌握 Matplotlib 的基本绘图方法&#xff08;折线图、柱状图、饼图&#xff09;掌握 Seaborn 的高级绘图方法&#xff08;分类图、分布图、箱线图&#xff09;熟悉图像美化&#xff08;标题、标签、颜色、风格&#xff09;完成一组学生成绩数据的可视化…

CephFS “Client Failing to Respond to Cache Pressure“ 告警分析

告警含义 当出现 Client failing to respond to cache pressure 警告时,表明: 元数据服务器 (MDS) 要求客户端释放缓存的元数据(如 inode Capabilities)客户端未能及时响应 释放请求核心触发机制 MDS 通过以下周期性流程管理缓存 阶段操作触发条件Cache Trim 周期每隔 mds…

生成式人工智能实战 | 生成对抗网络(Generative Adversarial Network, GAN)

生成式人工智能实战 | 生成对抗网络 0. 前言1. 生成对抗网络2. 模型构建2.1 生成器2.2 判别器 3. 模型训练3.1 数据加载3.2 训练流程 0. 前言 生成对抗网络 (Generative Adversarial Networks, GAN) 是一种由两个相互竞争的神经网络组成的深度学习模型&#xff0c;它由一个生成…

缓存与加速技术实践-MongoDB数据库应用

一.什么是MongoDB MongoDB 是一个文档型数据库&#xff0c;数据以类似 JSON 的文档形式存储。 MongoDB 的设计理念是为了应对大数据量、高性能和灵活性需求。 MongoDB 使用集合&#xff08;Collections&#xff09;来组织文档&#xff08;Documents&#xff09;&#xff0…

声网对话式AI把“答疑机器人”变成“有思维的助教”

作为一家专注初高中学生的线上教育平台&#xff0c;我们精心打磨的系统化课程收获了不少认可&#xff0c;但课后无人答疑的难题却始终横亘在前。学生课后遇到疑惑&#xff0c;要么只能默默憋在心里&#xff0c;要么就得苦苦等待下一节课&#xff0c;家长们也频繁抱怨 “花了钱&…