LLaMA-Factory 中配置文件或命令行里各个参数的含义

LLaMA-Factory 中配置文件或命令行里各个参数的含义

bicheng/2025/8/24 7:01:57/文章来源:https://blog.csdn.net/u013798595/article/details/150565017

常见参数分类 & 含义对照表：

🔹模型相关

参数	含义
model_name_or_path	基础模型的路径（本地或 HuggingFace Hub 上的名字，如 meta-llama/Llama-2-7b-hf）
adapter_name_or_path	LoRA/Adapter 权重路径（如果要在已有权重上继续训练或推理）
cache_dir	模型缓存路径
use_fast_tokenizer	是否使用 fast tokenizer（基于 tokenizers 的实现，速度快）
resize_vocab	是否根据新增的 special tokens 扩充词表

🔹 数据集相关

参数	含义
dataset	使用的数据集名称（框架内置如 alpaca_gpt4，也可以自定义）
dataset_dir	数据集目录路径
template	Prompt 模板（例如 alpaca、vicuna，会决定输入拼接格式）
cutoff_len	每条样本的最大 token 长度（超出会被截断）
max_samples	限制训练时使用的最大样本数（调试时用）

🔹 训练相关

参数	含义
do_train	是否进行训练
do_eval	是否进行评估
output_dir	模型保存目录
num_train_epochs	训练的总 epoch 数
max_steps	如果指定，训练到该步数后停止（优先级高于 num_train_epochs）
per_device_train_batch_size	每张 GPU 的训练 batch size
gradient_accumulation_steps	梯度累计步数，用于模拟更大 batch
learning_rate	学习率
lr_scheduler_type	学习率调度器（linear, cosine, constant等）
warmup_steps / warmup_ratio	学习率预热步数/比例
weight_decay	权重衰减系数
max_grad_norm	梯度裁剪阈值
logging_steps	日志打印间隔
save_steps	模型保存间隔（步数）
save_total_limit	只保留最近的多少个 checkpoint

🔹 PEFT / LoRA 参数

参数	含义
finetuning_type	微调方式：lora, full, freeze, qlora
lora_rank	LoRA 低秩矩阵维度 r
lora_alpha	LoRA 缩放系数 α
lora_dropout	LoRA dropout 比例
target_modules	应用 LoRA 的模块（默认 q_proj,k_proj,v_proj,o_proj）

🔹 推理/生成相关

参数	含义
do_predict	是否运行预测/推理
max_new_tokens	生成时最大新 token 数
temperature	生成时温度（越高越随机）
top_k	采样时 top-k
top_p	nucleus sampling 概率阈值
repetition_penalty	重复惩罚系数

🔹 量化相关

参数	含义
quantization_bit	量化比特数（4, 8等）
bnb_4bit_use_double_quant	是否使用双重量化
bnb_4bit_quant_type	量化类型（如 nf4、fp4）
bnb_4bit_compute_dtype	计算时数据类型（float16/bfloat16）

🔹 其他常用参数

参数	含义
seed	随机数种子（保证可复现）
report_to	日志上报方式（wandb, tensorboard, none）
ddp_find_unused_parameters	分布式训练时是否查找未用参数（DDP 必要选项）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/bicheng/94324.shtml
繁体地址，请注明出处：http://hk.pswp.cn/bicheng/94324.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

JavaScript 性能优化实战技术文章大纲

JavaScript 性能优化实战技术文章大纲

一、引言1.1 背景阐述在当今 Web 应用高度交互化、复杂化的趋势下，JavaScript 作为核心脚本语言，其性能优劣直接决定了用户体验的好坏。从单页应用（SPA）的流畅运行，到复杂数据可视化的实时交互，JavaScript …

阅读更多...

正点原子【第四期】Linux之驱动开发学习笔记-2.1LED灯驱动实验（直接操作寄存器）

正点原子【第四期】Linux之驱动开发学习笔记-2.1LED灯驱动实验（直接操作寄存器）

前言： 本文是根据哔哩哔哩网站上“正点原子【第四期】手把手教你学Linux系列课程之 Linux驱动开发篇”视频的学习笔记，该课程配套开发板为正点原子alpha/mini Linux开发板。在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内…

阅读更多...

【GM3568JHF】FPGA+ARM异构开发板测试命令

【GM3568JHF】FPGA+ARM异构开发板测试命令

本章节的命令操作均在板卡的终端执行 1 初探/sys目录与/proc目录类似，/sys目录下的文件/文件夹向用户提供了一些关于设备、内核模块、文件系统以及其他内核组件的信息， 如子目录block中存放了所有的块设备；子目录bus中存放了系统中所有的总…

阅读更多...

【Win】Motrix+Aria2浏览器下载加速

【Win】Motrix+Aria2浏览器下载加速

系统安装Motrix Motrix官网下载，推荐下载NSIS Installer 安装版浏览器安装Aria2 下载Aria2插件，然后开发者模式安装到浏览器 Aria2扩展选项的配置如下： 端口号需要改成Motrix的，默认是16800

阅读更多...

SpringBoot applicationContext.getBeansOfType获取某一接口所有实现类，应用于策略模式

SpringBoot applicationContext.getBeansOfType获取某一接口所有实现类，应用于策略模式

本文介绍了如何在Springboot项目中通过ApplicationContext获取接口的实现类，并通过枚举策略模式避免if/else，展示了如何使用getBeansOfType获取TrafficModeService的实现，以及如何在实际场景中应用，如查询交通方式费用 1 在实际工…

阅读更多...

大模型问题：幻觉分类+原因+各个训练阶段产生幻觉+幻觉的检测和评估基准

大模型问题：幻觉分类+原因+各个训练阶段产生幻觉+幻觉的检测和评估基准

1. 什么是幻觉？大模型出现幻觉，简而言之就是“胡说八道”。用《A Survey on Hallucination in Large Language Models》1文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。研究人员将大模型的幻觉分为事实性幻觉&…

阅读更多...

智慧冷库物联网解决方案——实现降本增效与风险可控的冷库管理新范式

智慧冷库物联网解决方案——实现降本增效与风险可控的冷库管理新范式

一、冷库管理痛点设备孤岛化：冷库品牌、型号分散，缺乏统一接入标准，数据互通难，依赖人工巡检，故障响应滞后。能耗黑洞：制冷系统能耗占冷库总运营成本的60%以上，传统管理粗放，缺乏动态…

阅读更多...

太空生活的八种要素

太空生活的八种要素

数代以来，科学家们一直在银河系中搜寻地外行星存在生命的证据。他们试图找到一组特定的环境条件与化学物质，在恰当的时间、恰当的地点交汇融合。通过研究人类、植物、动物及微生物在地球上的生存与繁衍方式，科学家们已识别出生命演化所需的关…

阅读更多...

Flutter 小技巧之有趣的 UI 骨架屏框架 skeletonizer

Flutter 小技巧之有趣的 UI 骨架屏框架 skeletonizer

很久没有更新过小技巧系列，今天简单介绍一个非常好用的骨架屏框架 skeletonizer ，它主要是通过将你现有的布局自动简化为简单的骨架，并添加动画效果来实现加载过程，而使用成本则是简单的添加一个 Skeletonizer 作为 parent &…

阅读更多...

基于SpringBoot的宠物用品系统【2026最新】

基于SpringBoot的宠物用品系统【2026最新】

作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：…

阅读更多...

MongoDB 分片集群修改管理员密码

MongoDB 分片集群修改管理员密码

记得关注一下博主，博主每天都会更新IT技术，让你有意想不到的小收获哦^_^ 文章目录*记得关注一下博主，博主每天都会更新IT技术，让你有意想不到的小收获哦^_^*一、注释MongoDB分片集群认证参数（三台主机都要操作&#xf…

阅读更多...

C++函数重载与引用详解

C++函数重载与引用详解

一、函数重载：同名函数的 “差异化生存”1. 概念定义函数重载（Function Overloading）是 C 的重要特性，指在同一作用域内，允许存在多个同名函数，但要求这些函数的参数列表必须不同。（参数个数…

阅读更多...

2025-08-17 李沐深度学习16——目标检测

2025-08-17 李沐深度学习16——目标检测

文章目录1 介绍1.1 实际应用1.2 边界框1.3 数据集2 锚框2.1 什么是锚框2.2 交并比2.3 分配标签2.4 非极大值抑制3 经典目标检测网络3.1 R-CNN3.1.1 R-CNN (原始版本)3.1.2 Fast R-CNN3.1.3 Faster R-CNN3.1.4 Mask R-CNN3.2 单阶段检测器：SSD 和 YOLO3.2.1 SSD (Sin…

阅读更多...

Bluedroid vs NimBLE

Bluedroid vs NimBLE

🔹 对比：Bluedroid vs NimBLE 1. 协议栈体积 & 内存占用 Bluedroid：体积大，RAM 占用也大（几十 KB 到上百 KB）。NimBLE：轻量级，内存占用大概是 Bluedroid 的一半甚至更少。 &…

阅读更多...

（纯新手教学）计算机视觉（opencv）实战八——四种边缘检测详解：Sobel、Scharr、Laplacian、Canny

（纯新手教学）计算机视觉（opencv）实战八——四种边缘检测详解：Sobel、Scharr、Laplacian、Canny

边缘检测详解：Sobel、Scharr、Laplacian、Canny边缘检测是图像处理和计算机视觉中的重要步骤，主要用于发现图像中亮度变化剧烈的区域，即物体的轮廓、边界或纹理特征。OpenCV 提供了多种常用的边缘检测算子，本教程将通过四种方法带…

阅读更多...

PyTorch 环境配置

PyTorch 环境配置

目录一、安装 CUDA二、安装 PyTorch1. 创建虚拟环境2. 安装 PyTorch三、在 PyCharm 上创建一个 PyTorch 项目参考文章： 【2025年最新PyTorch环境配置保姆级教程（附安装包）】【超详细 CUDA 安装与卸载教程（图文教程）】…

阅读更多...

鸿蒙中冷启动分析：Launch分析

鸿蒙中冷启动分析：Launch分析

启动的分类（热身环节） 启动动类型触发条件系统开销 & 速度主要优化方向冷启动应用进程不存在（首次启动或进程被杀后启动）最高，需创建进程、加载资源、初始化所有组件主要优化目标，减少主线程任务&…

阅读更多...

告别盲目排查，PolarDB+DAS Agent智能运维新突破

告别盲目排查，PolarDB+DAS Agent智能运维新突破

1.概述周五下午6点正准备下班，数据库CPU突然爆满，业务告警响成一片，DBA却要手动翻查CPU/内存/负载等多个监控指标，还要查询是否有新增慢SQL，死锁等问题？” 这可能是数据库DBA最闹心的场景了，…

阅读更多...

Linux------《零基础到联网：CentOS 7 在 VMware Workstation 中的全流程安装与 NAT 网络配置实战》

Linux------《零基础到联网：CentOS 7 在 VMware Workstation 中的全流程安装与 NAT 网络配置实战》

（一）Linux的发行版Centos安装与配置下载Linux发行版本Centos:centos-7-isos-x86_64安装包下载_开源镜像站-阿里云点击CentOS-7-x86_64-DVD-2009.torrent ，CentOS-7-x86_64-DVD-2009.torrent是官方提供的 BT 种子文件（176.1 KB&a…

阅读更多...

iOS App 混淆工具实战，教育培训类 App 的安全保护方案

iOS App 混淆工具实战，教育培训类 App 的安全保护方案

随着在线教育、企业培训、知识付费平台的兴起，越来越多的 iOS 应用需要保护自己的课程资源和核心逻辑。然而，教育类 App 面临的最大风险并非传统的外挂或刷分，而是视频盗链、题库数据泄露、源码逻辑被二次利用。在这种场景下，合…

阅读更多...

最新文章