LLaMA-Factory 中配置文件或命令行里各个参数的含义

常见参数分类 & 含义对照表:

🔹模型相关

参数含义
model_name_or_path基础模型的路径(本地或 HuggingFace Hub 上的名字,如 meta-llama/Llama-2-7b-hf)
adapter_name_or_pathLoRA/Adapter 权重路径(如果要在已有权重上继续训练或推理)
cache_dir模型缓存路径
use_fast_tokenizer是否使用 fast tokenizer(基于 tokenizers 的实现,速度快)
resize_vocab是否根据新增的 special tokens 扩充词表

🔹 数据集相关

参数含义
dataset使用的数据集名称(框架内置如 alpaca_gpt4,也可以自定义)
dataset_dir数据集目录路径
templatePrompt 模板(例如 alpaca、vicuna,会决定输入拼接格式)
cutoff_len每条样本的最大 token 长度(超出会被截断)
max_samples限制训练时使用的最大样本数(调试时用)

🔹 训练相关

参数含义
do_train是否进行训练
do_eval是否进行评估
output_dir模型保存目录
num_train_epochs训练的总 epoch 数
max_steps如果指定,训练到该步数后停止(优先级高于 num_train_epochs)
per_device_train_batch_size每张 GPU 的训练 batch size
gradient_accumulation_steps梯度累计步数,用于模拟更大 batch
learning_rate学习率
lr_scheduler_type学习率调度器(linear, cosine, constant等)
warmup_steps / warmup_ratio学习率预热步数/比例
weight_decay权重衰减系数
max_grad_norm梯度裁剪阈值
logging_steps日志打印间隔
save_steps模型保存间隔(步数)
save_total_limit只保留最近的多少个 checkpoint

🔹 PEFT / LoRA 参数

参数含义
finetuning_type微调方式:lora, full, freeze, qlora
lora_rankLoRA 低秩矩阵维度 r
lora_alphaLoRA 缩放系数 α
lora_dropoutLoRA dropout 比例
target_modules应用 LoRA 的模块(默认 q_proj,k_proj,v_proj,o_proj)

🔹 推理/生成相关

参数含义
do_predict是否运行预测/推理
max_new_tokens生成时最大新 token 数
temperature生成时温度(越高越随机)
top_k采样时 top-k
top_pnucleus sampling 概率阈值
repetition_penalty重复惩罚系数

🔹 量化相关

参数含义
quantization_bit量化比特数(4, 8等)
bnb_4bit_use_double_quant是否使用双重量化
bnb_4bit_quant_type量化类型(如 nf4、fp4)
bnb_4bit_compute_dtype计算时数据类型(float16/bfloat16)

🔹 其他常用参数

参数含义
seed随机数种子(保证可复现)
report_to日志上报方式(wandb, tensorboard, none)
ddp_find_unused_parameters分布式训练时是否查找未用参数(DDP 必要选项)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/94324.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/94324.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript 性能优化实战技术文章大纲

一、引言1.1 背景阐述在当今 Web 应用高度交互化、复杂化的趋势下,JavaScript 作为核心脚本语言,其性能优劣直接决定了用户体验的好坏。从单页应用(SPA)的流畅运行,到复杂数据可视化的实时交互,JavaScript …

正点原子【第四期】Linux之驱动开发学习笔记-2.1LED灯驱动实验(直接操作寄存器)

前言: 本文是根据哔哩哔哩网站上“正点原子【第四期】手把手教你学Linux系列课程之 Linux驱动开发篇”视频的学习笔记,该课程配套开发板为正点原子alpha/mini Linux开发板。在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内…

【GM3568JHF】FPGA+ARM异构开发板 测试命令

本章节的命令操作均在板卡的终端执行 1 初探/sys目录 与/proc目录类似,/sys目录下的文件/文件夹向用户提供了一些关于设备、内核模块、文件系统以及其他内核组件的信息, 如子目录block中存放了所有的块设备;子目录bus中存放了系统中所有的总…

【Win】Motrix+Aria2浏览器下载加速

系统安装Motrix Motrix官网下载,推荐下载NSIS Installer 安装版 浏览器安装Aria2 下载Aria2插件,然后开发者模式安装到浏览器 Aria2扩展选项的配置如下: 端口号需要改成Motrix的,默认是16800

SpringBoot applicationContext.getBeansOfType获取某一接口所有实现类,应用于策略模式

本文介绍了如何在Springboot项目中通过ApplicationContext获取接口的实现类,并通过枚举策略模式避免if/else,展示了如何使用getBeansOfType获取TrafficModeService的实现,以及如何在实际场景中应用,如查询交通方式费用 1 在实际工…

大模型问题:幻觉分类+原因+各个训练阶段产生幻觉+幻觉的检测和评估基准

1. 什么是幻觉?大模型出现幻觉,简而言之就是“胡说八道”。 用《A Survey on Hallucination in Large Language Models》1文中的话来讲,是指模型生成的内容与现实世界事实或用户输入不一致的现象。 研究人员将大模型的幻觉分为事实性幻觉&…

智慧冷库物联网解决方案——实现降本增效与风险可控的冷库管理新范式

一、冷库管理痛点设备孤岛化:冷库品牌、型号分散,缺乏统一接入标准,数据互通难,依赖人工巡检,故障响应滞后。能耗黑洞:制冷系统能耗占冷库总运营成本的60%以上,传统管理粗放,缺乏动态…

太空生活的八种要素

数代以来,科学家们一直在银河系中搜寻地外行星存在生命的证据。他们试图找到一组特定的环境条件与化学物质,在恰当的时间、恰当的地点交汇融合。 通过研究人类、植物、动物及微生物在地球上的生存与繁衍方式,科学家们已识别出生命演化所需的关…

Flutter 小技巧之有趣的 UI 骨架屏框架 skeletonizer

很久没有更新过小技巧系列,今天简单介绍一个非常好用的骨架屏框架 skeletonizer ,它主要是通过将你现有的布局自动简化为简单的骨架,并添加动画效果来实现加载过程,而使用成本则是简单的添加一个 Skeletonizer 作为 parent &…

基于SpringBoot的宠物用品系统【2026最新】

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

MongoDB 分片集群修改管理员密码

记得关注一下博主,博主每天都会更新IT技术,让你有意想不到的小收获哦^_^ 文章目录*记得关注一下博主,博主每天都会更新IT技术,让你有意想不到的小收获哦^_^*一、注释MongoDB分片集群认证参数(三台主机都要操作&#xf…

C++函数重载与引用详解

一、函数重载:同名函数的 “差异化生存”​1. 概念定义​函数重载(Function Overloading)是 C 的重要特性,指在同一作用域内,允许存在多个同名函数,但要求这些函数的参数列表必须不同。(参数个数…

2025-08-17 李沐深度学习16——目标检测

文章目录1 介绍1.1 实际应用1.2 边界框1.3 数据集2 锚框2.1 什么是锚框2.2 交并比2.3 分配标签2.4 非极大值抑制3 经典目标检测网络3.1 R-CNN3.1.1 R-CNN (原始版本)3.1.2 Fast R-CNN3.1.3 Faster R-CNN3.1.4 Mask R-CNN3.2 单阶段检测器:SSD 和 YOLO3.2.1 SSD (Sin…

Bluedroid vs NimBLE

🔹 对比:Bluedroid vs NimBLE 1. 协议栈体积 & 内存占用 Bluedroid:体积大,RAM 占用也大(几十 KB 到上百 KB)。NimBLE:轻量级,内存占用大概是 Bluedroid 的一半甚至更少。 &…

(纯新手教学)计算机视觉(opencv)实战八——四种边缘检测详解:Sobel、Scharr、Laplacian、Canny

边缘检测详解:Sobel、Scharr、Laplacian、Canny边缘检测是图像处理和计算机视觉中的重要步骤,主要用于发现图像中亮度变化剧烈的区域,即物体的轮廓、边界或纹理特征。OpenCV 提供了多种常用的边缘检测算子,本教程将通过四种方法带…

PyTorch 环境配置

目录一、安装 CUDA二、安装 PyTorch1. 创建虚拟环境2. 安装 PyTorch三、在 PyCharm 上创建一个 PyTorch 项目参考文章: 【2025年最新PyTorch环境配置保姆级教程(附安装包)】 【超详细 CUDA 安装与卸载教程(图文教程)】…

鸿蒙中冷启动分析:Launch分析

启动的分类(热身环节) 启动动类型触发条件系统开销 & 速度主要优化方向冷启动应用进程不存在(首次启动或进程被杀后启动)最高,需创建进程、加载资源、初始化所有组件主要优化目标,减少主线程任务&…

告别盲目排查,PolarDB+DAS Agent智能运维新突破

1.概述 周五下午6点正准备下班,数据库CPU突然爆满,业务告警响成一片,DBA却要手动翻查CPU/内存/负载等多个监控指标,还要查询是否有新增慢SQL,死锁等问题?” 这可能是数据库DBA最闹心的场景了,…

Linux------《零基础到联网:CentOS 7 在 VMware Workstation 中的全流程安装与 NAT 网络配置实战》

(一)Linux的发行版Centos安装与配置 下载Linux发行版本Centos:centos-7-isos-x86_64安装包下载_开源镜像站-阿里云点击CentOS-7-x86_64-DVD-2009.torrent ,CentOS-7-x86_64-DVD-2009.torrent是官方提供的 BT 种子文件(176.1 KB&a…

iOS App 混淆工具实战,教育培训类 App 的安全保护方案

随着在线教育、企业培训、知识付费平台的兴起,越来越多的 iOS 应用需要保护自己的课程资源和核心逻辑。然而,教育类 App 面临的最大风险并非传统的外挂或刷分,而是 视频盗链、题库数据泄露、源码逻辑被二次利用。 在这种场景下,合…