[论文阅读] 人工智能 | 大语言模型计划生成的新范式:基于过程挖掘的技能学习

#论文阅读#

大语言模型计划生成的新范式:基于过程挖掘的技能学习

论文信息

Skill Learning Using Process Mining for Large Language Model Plan Generation
Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin
Cite as: arXiv:2410.12870 [cs.CL] (or arXiv:2410.12870v1 [cs.CL] for this version)
https://doi.org/10.48550/arXiv.2410.12870

研究背景:当LLMs遇到复杂任务的“绊脚石”

想象你让AI规划一场跨国会议,传统大语言模型(LLMs)可能会生成一个线性步骤列表:先订会议室、再发邮件、最后准备资料。但现实中,这些步骤可能可以并行进行(比如订会议室的同时预约咖啡),而LLMs却因缺乏“结构化控制流模型”,只能按顺序执行,效率低下且难以复用类似场景的经验。

这就像用简单的菜谱列表做满汉全席:每个步骤孤立执行,无法发现“预处理食材”和“调制酱汁”可以同时进行,也无法将“宴会流程”作为通用技能复用到其他活动中。现有文本规划器的核心痛点在于:

  • 线性思维限制效率:只能生成扁平动作序列,无法识别并行任务(如同时预订会议室和发送邀请)。
  • 缺乏结构导致“失忆”:相似任务需从头规划,无法复用历史技能(如重复生成“安排会议”的步骤)。
  • 黑箱决策难解释:用户难以理解为什么AI选择某一步骤,调试和优化困难。

创新点:给LLMs装上“流程显微镜”

论文的核心突破是将**过程挖掘(Process Mining)**技术引入LLMs,让AI从历史生成的动作序列中提取“技能模型”,就像从大量烹饪记录中总结出标准化菜谱流程:

  • 技能发现:用过程挖掘算法(如归纳矿工)从LLM生成的动作序列中提炼结构化控制流模型,例如将“安排会议”的不同执行痕迹整合成包含并行步骤(预订房间+准备资料)的流程模型。
  • 技能存储与检索:将模型存入“技能库”,通过“一致性检查”(Conformance Checking)匹配当前任务需求,确保检索的技能在结构上与目标任务对齐,而非仅靠文本语义相似性。
  • 并行执行与可解释性:结构化模型允许AI识别可并行的任务分支,缩短执行时间,同时让用户直观看到步骤间的逻辑关系。

研究方法和思路:三步搭建智能规划系统

1. 从“流水账”到“流程图”:过程发现提取技能

  • 输入:LLM生成的动作序列(如“预订会议室→发送邮件→准备资料”)。
  • 处理:使用归纳矿工算法分析序列,识别动作间的顺序、并行关系,生成BPMN或Petri网格式的流程模型。例如,发现“预订会议室”和“准备资料”可并行执行,合并为“会议准备”技能。
  • 输出:结构化技能模型,存入技能库。

2. 技能库:让LLMs“记住”历史经验

  • 存储形式:每个技能是一个包含控制流结构的模型,记录动作间的依赖关系和并行可能。
  • 复用机制:当新任务与历史任务相似时,LLM无需从头生成计划,直接从技能库检索匹配模型,像调用函数一样复用经验。

3. 精准匹配:一致性检查提升检索质量

  • 单阶段方法:仅用一致性检查,通过“对齐适应度”指标衡量生成计划与技能模型的结构匹配度,避免因文本表述差异导致的误匹配(如“安排会议”和“组织会谈”可能对应同一模型)。
  • 两阶段方法:先通过文本语义嵌入(如ada-002)快速过滤候选技能,再用一致性检查重新排序,平衡效率与准确性。

实验验证:结构化模型真的有用吗?

  • 数据集:使用ProcessTBench(含LLM生成的532个任务轨迹)和TaskBench(533个多语言重述任务)。
  • 关键发现
    • 过程挖掘能有效从LLM轨迹中提取高保真模型,平均“重放适应度”0.96,“对齐适应度”0.94,表明模型与真实流程高度吻合。
    • 在技能检索中,两阶段方法(ada-002+一致性检查)的F1分数达0.90,MRR达0.93,接近纯语义模型(ada-002),但在规划器准确率≥0.7时表现更优,且更具可解释性。

主要贡献:让LLMs从“新手”变“专家”

  1. 填补文本规划与代码规划的鸿沟:赋予文本型LLMs类似代码规划器的结构化控制流能力,无需依赖代码生成即可实现技能复用和并行执行。
  2. 提升效率与透明度
    • 并行执行可缩短任务时间,如TaskBench中查询响应速度提升1.43倍。
    • 结构化模型让用户清晰看到AI决策逻辑,便于调试和优化自动化流程。
  3. 开创过程挖掘与LLMs的交叉应用:首次将过程挖掘技术用于LLM的技能学习,为自动化规划提供了可解释、可复用的新框架。

总结:未来已来,但仍需探索

论文通过实验证明,过程挖掘与LLMs的结合能有效提升复杂任务的规划效率和可解释性,为企业自动化、智能代理等场景提供了新路径。然而,当前研究仍基于合成数据集,未来需在真实场景中验证,同时探索更复杂的规划器设计和开放集技能检索。

一句话总结:给LLMs一套“流程建模工具”,让它学会从历史经验中提炼可复用的结构化技能,像人类一样高效规划复杂任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/82697.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C文件操作2

五、文件的随机读写 这些函数都需要包含头文件 #include<stdio.h> 5.1 fseek 根据文件指针的位置和偏移量来定位文件指针&#xff08;文件内容的光标&#xff09; &#xff08;重新定位流位置指示器&#xff09; int fseek ( FILE * stream, long int offset, int or…

react私有样式处理

react私有样式处理 Nav.jsx Menu.jsx vue中通过scoped来实现样式私有化。加上scoped&#xff0c;就属于当前组件的私有样式。 给视图中的元素都加了一个属性data-v-xxx&#xff0c;然后给这些样式都加上属性选择器。&#xff08;deep就是不加属性也不加属性选择器&#xff09; …

【信创-k8s】海光/兆芯+银河麒麟V10离线部署k8s1.31.8+kubesphere4.1.3

❝ KubeSphere V4已经开源半年多&#xff0c;而且v4.1.3也已经出来了&#xff0c;修复了众多bug。介于V4优秀的LuBan架构&#xff0c;核心组件非常少&#xff0c;资源占用也显著降低&#xff0c;同时带来众多功能和便利性。我们决定与时俱进&#xff0c;使用1.30版本的Kubernet…

单片机内部结构基础知识 FLASH相关解读

一、总线简单说明 地址总线、控制总线、数据总线 什么是8位8051框架结构的微控制器&#xff1f; 数据总线宽度为8位&#xff0c;即CPU一次处理或传输的数据量为8位&#xff08;1字节&#xff09; 同时还有一个16位的地址总线&#xff0c;这个地方也刚好对应了为什么能看到内存…

HTTPS加密的介绍

HTTPS&#xff08;HyperText Transfer Protocol Secure&#xff0c;超文本传输安全协议&#xff09;是HTTP协议的安全版本。它在HTTP的基础上加入了SSL/TLS协议&#xff0c;用于对数据进行加密&#xff0c;并确保数据传输过程中的机密性、完整性和身份验证。 在HTTPS出现之前&a…

【freertos-kernel】stream_buffer

文章目录 补充任务通知发送处理ulTaskGenericNotifyTakexTaskGenericNotifyWait 清除xTaskGenericNotifyStateClearulTaskGenericNotifyValueClear 结构体StreamBufferHandle_tStreamBufferCallbackFunction_t 创建xStreamBufferGenericCreatestream buffer的类型 删除vStreamB…

在word中点击zotero Add/Edit Citation没有反应的解决办法

重新安装了word插件 1.关掉word 2.进入Zotero左上角编辑-引用 3.往下滑找到Microsoft Word&#xff0c;点重新安装加载项

新华三H3CNE网络工程师认证—Easy IP

Easy IP 就是“用路由器自己的公网IP&#xff0c;给全家所有设备当共享门牌号”的技术&#xff01;&#xff08;省掉额外公网IP&#xff0c;省钱又省配置&#xff01;&#xff09; 生活场景对比&#xff0c;想象你住在一个小区&#xff1a;普通动态NAT&#xff1a;物业申请了 …

算法打开13天

41.前 K 个高频元素 &#xff08;力扣347题&#xff09; 给你一个整数数组 nums 和一个整数 k &#xff0c;请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。 示例 1: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2]示例 2: 输入: nums [1], k 1 输出: …

LabVIEW与PLC液压泵测控系统

针对液压泵性能测试场景&#xff0c;采用LabVIEW与西门子 PLC 控制系统&#xff0c;构建高精度、高可靠性的智能测控系统。通过选用西门子 PLC、NI 数据采集卡、施耐德变频电机等&#xff0c;结合LabVIEW 强大的数据处理与界面开发能力&#xff0c;实现液压泵压力、流量、转速等…

应急响应靶机-web2-知攻善防实验室

题目&#xff1a; 前景需要&#xff1a;小李在某单位驻场值守&#xff0c;深夜12点&#xff0c;甲方已经回家了&#xff0c;小李刚偷偷摸鱼后&#xff0c;发现安全设备有告警&#xff0c;于是立刻停掉了机器开始排查。 这是他的服务器系统&#xff0c;请你找出以下内容&#…

Python制作史莱姆桌面宠物!可爱的

史莱姆桌面宠物 一个可爱的桌面史莱姆宠物&#xff0c;它会在您的任务栏上移动并提供可视化设置界面。 这里写目录标题 史莱姆桌面宠物功能特点安装与运行直接运行方式创建可执行文件 使用说明自定义GIF说明打包说明开源地址 功能特点 可爱的史莱姆在任务栏上自动移动支持…

vue3 自动导入自己的js文件中的函数

vue3 自动导入自己的js文件中的函数 vite.config.js import AutoImport from unplugin-auto-import/viteexport default defineConfig({resolve: {alias: {: fileURLToPath(new URL(./src, import.meta.url))}},plugins: [vue(),AutoImport({imports: [vue, vue-router, pini…

Mobile App UI自动化locator

在开展mobile app UI层自动化测试时&#xff0c;编写目标元素的locator是比较耗时的一个环节&#xff0c;弄清楚locator背后的逻辑&#xff0c;可以有效降低UI层测试维护成本。此篇博客以webdriverioappium作为UI自动化工具为例子&#xff0c;看看有哪些selector方法&#xff0…

44、web实验-后台管理系统基本功能

44、web实验-后台管理系统基本功能 “44、web实验-后台管理系统基本功能”通常指的是在Web开发学习过程中&#xff0c;关于构建后台管理系统的实践环节&#xff0c;主要涉及实现一个具备基本功能的后台管理系统。以下是该实验的主要内容&#xff1a; #### 实验目标 - 掌握后台管…

【Flask】:轻量级Python Web框架详解

什么是Flask&#xff1f; Flask是一个用Python编写的轻量级Web应用框架。它被称为"微框架"(microframework)&#xff0c;因为它核心简单但可扩展性强&#xff0c;不强制使用特定的项目结构或库。Flask由Armin Ronacher开发&#xff0c;基于Werkzeug WSGI工具包和Jin…

MAC电脑怎么通过触摸屏打开右键

在Mac电脑上&#xff0c;通过触摸屏打开右键菜单的方法如下&#xff1a; 法1:双指轻点&#xff1a;在触控板上同时用两根手指轻点&#xff0c;即可触发右键菜单。这是Mac上常用的右键操作方法。 法2:自定义触控板角落&#xff1a;可以设置触控板的右下角或左下角作为右键区域…

AI炼丹日志-26 - crawl4ai 专为 AI 打造的爬虫爬取库 上手指南

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; Java篇&#xff1a; MyBatis 更新完毕目前开始更新 Spring&#xff0c;一起深入浅出&#xff01; 大数据篇 300&#xff1a; Hadoop&…

java32

1.反射 获取类&#xff1a; 获取构造方法&#xff1a; 获取权限修饰符&#xff1a; 获取参数信息&#xff1a; 利用反射出来的构造器来创建对象&#xff1a; 获取成员变量&#xff1a; 获取成员方法&#xff1a; 综合练习&#xff1a; 动态代理&#xff1a;

OpenStack组件:放置服务(Placement)安装

OpenEuler的安装_openeuler5.1.0-249-CSDN博客 OpenStack云计算平台基础环境准备_openstack基础环境配置-CSDN博客 OpenStack组件&#xff1a;镜像服务&#xff08;Glance&#xff09;安装-CSDN博客 OpenStack组件&#xff1a;认证服务&#xff08;Keystone&#xff09;安装…