《Password Guessing Using Large Language Models》——论文阅读

1.研究背景

LLM在文本生成和理解方面表现出色,但直接用于密码猜测存在以下问题:

  • 密码与自然语言的差异(短、无语法、需精确匹配)

  • 生成效率低、重复率高

  • 伦理限制(如GPT-4拒绝生成大量密码)

2.本文研究

        提出PASSLLM框架,它通过“少量高效微调 + 专用生成算法 + 知识蒸馏”三步走策略。

  • 将LoRA(低秩适应)微调技术引入LLM密码猜测,构建通用框架,支持trawling(广撒网)和三种targeted(精准)攻击场景(基于个人信息,密码重用,结合PII和密码重用)。
  • 同时为trawling场景设计两阶段BFS算法,支持大规模并行生成。为targeted场景设计动态beam search算法,提高生成效率。
  • 将知识蒸馏技术用于LLM密码猜测,压缩模型参数,在不损耗性能的情况下,提升推理速度。

3.相关知识

LoRA(低秩适应):是一种“只改一点点,就能让大模型学会新任务”的参数高效微调技术,其核心思想为:冻结原模型,外挂“小补丁”——用极少量可训练参数,近似全参数微调的效果。

4.具体步骤

(1)数据处理与模型输入构建

        数据格式

  • 每条训练数据是一个序列:seq_i = [INFO_i, pw_i]。

  • INFO_i:可用的辅助信息(如PII、姊妹密码)。pw_i:目标密码。

        双词汇表设计

  • 辅助信息部分:使用LLM原有的词汇表(通常包含数万个token)进行编码,以保留其语言理解能力。

  • 密码部分:使用一个自定义的字符级词汇表,仅包含95个可打印ASCII字符和一个EOS(End-of-Sequence) token,共96个符号。

(2)基于LoRA的高效模型微调

        LoRA注入:在Transformer的自注意力层中的Query, Key, Value投影矩阵上注入LoRA模块。

        训练目标:标准的下一个token预测(自回归)。损失函数仅计算密码部分的交叉熵,而不计算辅助信息部分。

(3)针对不同场景的密码生成算法

  ①trawling场景的两阶段生成算法

        前缀生成:使用一个优先队列(最大堆),从初始提示开始,基于累积概率广度优先地生成一系列互不为前缀的字符序列。

        并行子字典生成:将第一阶段得到的前缀集合中的每一个前缀,与初始提示词组合,形成新的输入;对每个新输入,并行地使用带概率剪枝的BFS算法生成以该前缀开头的密码子字典;最后将所有子字典合并,按概率排序,得到最终的拖网密码字典。

        优势:该设计将一个大任务分解为大量可并行执行的子任务,极大提高了生成效率,易于在消费级GPU上实现大规模密码生成。

targeted场景的动态束搜索算法

        动态束宽:允许在不同生成长度(深度)设置不同的束宽(beam width),更灵活地平衡资源。

        EOS终止阈值:引入一个阈值 ε,只有当模型生成EOS token的概率大于 ε时,才认为该密码序列完成并被输出。

        KV缓存共享:关键性能优化,辅助信息 INFO的KV缓存只需计算一次,然后在所有beam中共享。只需为不断增长的密码前缀维护KV缓存。

(4)模型蒸馏

        教师模型:训练好的 7B参数 PAssLLM (Mistral)

        学生模型:一个更小号的模型(如 0.5B参数的 Qwen2.5)

        训练目标:学生模型的训练损失是两种损失的加权和,蒸馏损失(让学生模型的输出分布尽可能接近教师模型的输出分布)和任务损失(标准的交叉熵损失,让学生模型也能直接学习到正确的下一个字符

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/96772.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/96772.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# 使用OPCUA 与CODESYS进行标签通讯

目录 1.导出的标签 识别标签名称 2.引用OPCUA的包 3.读写方法的封装 4.完整的业务模块封装 1.导出的标签 识别标签名称 从CODESYS导出使用标签通讯的模块文档 大概是这样子的 <?xml version"1.0" encoding"utf-8"?> <Symbolconfiguratio…

C++ 中 `std::map` 的 `insert` 函数

1. 函数的概念与用途 std::map::insert 是 C 标准模板库&#xff08;STL&#xff09;中 map 容器的一个核心成员函数。它的核心任务很明确&#xff1a;向 map 中插入一个新的键值对&#xff08;key-value pair&#xff09;。 核心用途&#xff1a; 数据构建&#xff1a;初始化一…

【机器学习学习笔记】机器学习引言

前言本文章是拨珠自己的学习笔记&#xff0c;自用为主&#xff0c;学习请移步专门教程&#xff0c;若有错误请大佬轻喷&#xff0c;也欢迎同好交流学习。本文将阐述三个问题。什么是机器学习&#xff1f;监督学习、无监督学习到底在干什么&#xff1f;分类、回归、聚类又是怎么…

程序设计---状态机

在软件工程、嵌入式开发、自动化控制等领域&#xff0c;状态机&#xff08;State Machine&#xff09;是一种描述系统行为的强大工具。它通过抽象“状态”“事件”“转换”和“动作”四大核心要素&#xff0c;将复杂的逻辑流程转化为可视化、可验证的状态流转规则&#xff0c;广…

GaussDB 数据库架构师修炼(十八) SQL引擎-分布式计划

1 分布式架构GaussDB基于MPP &#xff08;Massively Parallel Processing&#xff09; 并行架构Streaming流式计算框架2 分布式计划CN轻量化&#xff08;light proxy&#xff09; FQS&#xff08; fast query shipping &#xff09; STREAM计划 XC计划计划类型场景原理CN…

微前端架构核心要点对比

1. 样式隔离 常见的隔离方式有以下几种,还是根据自身业务来确定: 1.1. shadowDOM 目前相对来说使用最多的样式隔离机制。 但shadowDOM并不是银弹,由于子应用的样式作用域仅在 shadow 元素下,那么一旦子应用中出现运行时“翻墙”跑到外面构建 DOM 的场景,必定会导致构建…

VMware 17.6安装包下载与保姆级图文安装教程!

软件下载 [软件名称]&#xff1a;VMware 17.6 [软件大小]&#xff1a;226.66MB [系统环境]&#xff1a;win 7/8/10/11或更高&#xff0c;64位操作系统 VMware合集&#xff0c;软件下载&#xff08;夸克网盘需手机打开&#xff09;&#xff1a;&#xff1a;VMware合集丨夸克网…

关于微服务下的不同服务之间配置不能通用的问题

问题引入现有两个服务&#xff0c;一个是 A 服务&#xff0c;一个是 B 服务&#xff0c;并且这两个服务都需要使用 mysql。现 B 服务中引入了 A 服务的依赖&#xff0c;在 A 服务中添加了 mysql 的相关配置&#xff0c;那么这时就有一个问题&#xff1a;既然 B 已经引入了 A 的…

【机器学习项目 心脏病预测】

文章目录心脏病预测导入数据集数据集介绍理解数据数据处理机器学习K近邻分类器逻辑回归支持向量分类器&#xff08;SVC&#xff09;决策树分类器随机森林分类器结论心脏病预测 在这个机器学习项目中&#xff0c;我们使用UCI心脏病数据集 UCI &#xff0c;并将使用机器学习方法…

【论文阅读 | arXiv 2025 | WaveMamba:面向RGB-红外目标检测的小波驱动Mamba融合方法】

论文阅读 | arXiv 2025 | WaveMamba&#xff1a;面向RGB-红外目标检测的小波驱动Mamba融合方法​​1&&2. 摘要&&引言3. 方法3.1. 预备知识3.2. WaveMamba3.3. WaveMamba融合块&#xff08;WMFB&#xff09;3.3.1. 低频Mamba融合块&#xff08;LMFB&#xff09;…

DevExpress发布PowerPoint Presentation API库,支持跨平台与 PDF 导出

DevExpress专注于为 .NET、JavaScript、VCL 等多种平台提供高性能 UI 控件、报表工具、数据可视化组件及开发框架&#xff0c;产品覆盖桌面、Web、移动及跨平台应用开发领域。凭借稳定的性能、丰富的功能与优质的技术支持&#xff0c;DevExpress 的解决方案已广泛应用于金融、制…

Vue3使用 DAG 图(AntV X6)

参考文档 AntV X6 文档 可自定义设置以下属性 容器宽度&#xff08;width&#xff09;&#xff0c;类型&#xff1a;number | string&#xff0c;默认 ‘100%’容器高度&#xff08;height&#xff09;&#xff0c;类型&#xff1a;number | string&#xff0c;默认 ‘100%’…

【数据结构】跳表的概率模型详解与其 C 代码实现

文章目录介绍关键组成部分读者可以比对这张图片去理解跳表 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/c5704b6276a14c3f9facdc3e55015bcc.jpeg#pic_center) 核心操作原理算法的概率模型跳表的 C代码实现初始化跳跃表的节点、跳跃表本身跳表插入节点查找元素更新…

Verilog实现除法器

文章目录基本原理确定除数最高位移位相减基本原理 若想得到yx\frac{y}{x}xy​的商和余数&#xff0c;一种最直观的想法就是不断地用yyy减掉xxx&#xff0c;直到y<xy< xy<x为止&#xff0c;写成伪代码如下 z 0 while y<x:y - xz 1这种算实在是太低效了&#xff…

EasyLive的一些疑问

目录 一、pinia是什么 二、html的代码片段又失效&#xff1f; 三、Request.js 四 、状态管理库 五、main.js:19 Uncaught SyntaxError: The requested module /src/utils/Api.js?t1745328489985 does not provide an export named default (at main.js:19:8)​编辑 六、…

C++(String):

目录 string与C中字符串的区别&#xff1a; C字符串&#xff1a; string字符串&#xff1a; string的定义和初始化&#xff1a; 输入字符串&#xff1a; 方式1&#xff1a; 方式2&#xff1a; 字符串的拼接的操作&#xff1a; 方式1&#xff1a;使用“” 方式2&#…

【Linux】Java线上问题,一分钟日志定位

【Linux】Java线上问题&#xff0c;一分钟日志定位1. 查看异常堆栈2. 实时叮新日志3. 翻历史/压缩日志4. 统计异常数量5. 多种异常一起查6. 反向过滤7. 同时满足多个关键字查询8. 定位最近一次异常9. 异常排行榜1. 查看异常堆栈 # 在 a.log 文件中查找包含 NullPointerExcepti…

智慧农业温室大棚远程监控物联网系统解决方案

一、方案背景与目标随着现代农业向智能化、精准化转型&#xff0c;传统温室大棚管理面临效率低、响应慢、成本高等痛点。本方案通过部署御控农业物联网系统&#xff0c;实现温室环境参数实时监测、设备远程控制、数据智能分析及预警决策&#xff0c;助力农户降低人工成本&#…

【剖析高并发秒杀】从流量削峰到数据一致性的架构演进与实践

一、 挑战&#xff1a;三高背景下的数据库瓶颈秒杀场景的核心挑战可以归结为“三高”&#xff1a;高并发、高性能、高可用。而系统中最脆弱的一环&#xff0c;往往是我们的关系型数据库&#xff08;如MySQL&#xff09;。它承载着最终的数据落地&#xff0c;其连接数、IOPS和CP…

Redisson最新版本(3.50.0左右)启动时提示Netty的某些类找不到

文章目录一、写在前面二、解决方案1、解决方案2、一劳永逸3、确定redisson依赖netty的版本一、写在前面 Redisson最新版本&#xff0c;大概3.47.0&#xff0c;在JDK8环境下&#xff08;实测JDK17也一样&#xff09;会提示Netty的某些类找不到&#xff1a; Exception in threa…