【大模型】使用llama.cpp 进行模型转换和量化

【大模型】使用llama.cpp 进行模型转换和量化

web/2025/6/13 16:11:10/文章来源:https://blog.csdn.net/wss794/article/details/148566487

目录

1 相关知识

■llama.cpp

■GGUF 格式

■量化

2 详细步骤

克隆 llama.cpp 仓库

安装依赖

配置 CMake 构建

构建项目

验证安装

转换 safetensors 为 FP16 GGUF

量化模型 (Q4_K_M)

测试量化模型

1 相关知识

■llama.cpp

llama.cpp是一个开源的 C/C++ 库，旨在通过最小的设置和最先进的性能，在各种硬件上实现大型语言模型（LLMÿ

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.pswp.cn/web/83366.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

大数据学习（133）-Hive数据分析2

大数据学习（133）-Hive数据分析2

🍋🍋大数据学习🍋🍋 🔥系列专栏： 👑哲学语录: 用力所能及，改变世界。 💖如果觉得博主的文章还不错的话，请点赞👍收藏⭐️留言&#x1f4…

阅读更多...

IDEA 连接 Docker 一键打镜像

IDEA 连接 Docker 一键打镜像

首先，检查 IDEA 是否安装了 Docker 插件： 版本比较新的 IDEA 默认都安装了这个插件，如果没有安装，安装一下。确保我们虚拟机上安装了 Docker 和 Docker-compose，并启动了 Docker。找到 IDEA 下方的 Services tab 栏…

阅读更多...

第六讲——一元函数微分学的应用之中值定理、微分等式与微分不等式

第六讲——一元函数微分学的应用之中值定理、微分等式与微分不等式

文章目录连续函数性质定理定理1 有界与最值定理定理2 介值定理定理3 平均值定理定理4 零点定理定理5 费马定理导数介值定理(达布定理) 中值定理罗尔定理拉格朗日中值定理柯西中值定理泰勒公式讨论方程的根问题——微分等式证明不等式问题使用函数的性质(单调性、凹凸性、最值…

阅读更多...

2025.06.11【Ribo-seq】|用CPAT预测sORF序列的编码潜能

2025.06.11【Ribo-seq】|用CPAT预测sORF序列的编码潜能

文章目录前言一、准备工作1. 安装CPAT2. 下载物种特异性模型二、准备sORF核酸序列1. 获取sORF的拼接核酸序列示例脚本（假设已获得外显子fasta）： 三、运行CPAT预测编码潜能1. 准备CPAT模型和hexamer表2. 运行CPAT 四、结果解读五、常见问题与…

阅读更多...

Hive面试题汇总

Hive面试题汇总

一、hive架构相关遇到这类问题，可以灵活的去回答，比如可以结合平时使用hive的经验作答，也可以结合下图从数据的读入、解析、元数据的管理，数据的存储等角度回答： 二、hive的特点本题主要为了考察对hive的整体使用…

阅读更多...

树莓派超全系列教程文档--(57)如何设置 Apache web 服务器

树莓派超全系列教程文档--(57)如何设置 Apache web 服务器

如何设置 Apache web 服务器设置 Apache web 服务器安装 Apache测试 web 服务器更改默认网页为 Apache 安装 PHP 文章来源： http://raspberry.dns8844.cn/documentation 原文网址设置 Apache web 服务器 Apache 是一款流行的 web 服务器应用程序，您…

阅读更多...

（九）现代循环神经网络（RNN）：从注意力增强到神经架构搜索的深度学习演进

（九）现代循环神经网络（RNN）：从注意力增强到神经架构搜索的深度学习演进

现代循环神经网络的内容，将介绍几种先进的循环神经网络架构，包括门控循环单元（GRU）、长短期记忆网络（LSTM）的变体，以及注意力机制等。这些内容将帮助你更深入地理解循环神经网络的发展和应用。 …

阅读更多...

牛市与熊市：市场周期的双面镜

牛市与熊市：市场周期的双面镜

牛市推动资产增值与风险积累，熊市挤压泡沫并孕育机会，两者交替循环，构成市场自我调节机制。 1、概念对比：情绪与趋势的博弈牛市（Bull Market）：指资产价格持续上涨（通常涨幅超20%&a…

阅读更多...

web程序设计期末复习-填空题

web程序设计期末复习-填空题

常用标签块级标记行内标记等一、块级元素特点： 独占一行可以设置宽度、高度、内外边距默认情况下会从上到下垂直排列常见标签： 标签含义 <div> 最常用的通用块级容器 <p> 段落 <h1>到<h6> 标题（一级…

阅读更多...

go全局配置redis，全局只需要连接一次，然后全局可以引用使用

go全局配置redis，全局只需要连接一次，然后全局可以引用使用

创建redis文件夹、创建dadeRedis.go package redisimport ("context""github.com/go-redis/redis/v8""log""time" )var (client *redis.Clientctx context.Background() )// 初始化Redis连接（建议在程序启动时调用&am…

阅读更多...

缓冲区（C语言缓冲区+内核缓冲区）一个例子解释他们的关系和作用！！！

缓冲区（C语言缓冲区+内核缓冲区）一个例子解释他们的关系和作用！！！

首先提出问题： 为什么以下代码是先sleep三秒后，屏幕才显示"XXXXXXX"。 #include<stdio.h> #include<unistd.h>int main() {printf("XXXXXXX");sleep(3);return 0; } 为什么以下代码是先显示"XXXXXXX"&#xf…

阅读更多...

【2025版】Java 工程师学习路线图 —— 掌握程度描述版

【2025版】Java 工程师学习路线图 —— 掌握程度描述版

✅【2025版】Java 工程师学习路线图 💡 目标：成为合格的 Java 工程师（前后端都要会） 📝 结构清晰 | 阶段明确 | 掌握程度分级 | 适合自学或转行 🔹 阶段一：编程基础计算机通识模块内容推荐掌…

阅读更多...

从零实现一个红队智能体

从零实现一个红队智能体

从零实现一个红队智能体(持续更新) 2025-06-09 背景：最近学了基础些东西和工具基础使用，发现一套流程下来太多需要手工要做的，就像自己能不能结合自己的技术栈实现小工具 🥇 第一步：从实用性开始分析目标场景希望…

阅读更多...

Uniapp实现多选下拉框

Uniapp实现多选下拉框

文章目录前言一、效果展示1.1 下拉效果图1.2 下拉选择效果图1.3 选择显示效果图二、组件源码2.1.CustomCheckbox.vue源码2.2.niceui-popup-select.vue源码三、demo.vue代码演示前言之前在使用Uniapp时，一直都是下拉框单选。今天某个项目需求需要使用Uniapp实现…

阅读更多...

JavaScript-Array.from

JavaScript-Array.from

Array.from() 是 JavaScript 中用于将类数组对象（array-like）或可迭代对象（iterable）转换为真实数组的一个非常有用的方法。 📌 一、基本语法 Array.from(arrayLike, mapFn?, thisArg?)参数说明： 参数类…

阅读更多...

二刷苍穹外卖 day02

二刷苍穹外卖 day02

新增员工 DTO 将前端传递的参数列表通过对应的实体类接收当前端提交的数据和实体类中对应的属性差别较大时，使用DTO来封装数据 Data public class EmployeeDTO implements Serializable {private Long id;private String username;private String name;private…

阅读更多...

通过Heron Handoff 插件我们在figma设计中可以像sketch导出离线标注

通过Heron Handoff 插件我们在figma设计中可以像sketch导出离线标注

一、设计交付的历史困境与破局契机在数字产品开发的全流程中，设计标注的高效传递始终是连接创意与实现的关键纽带。传统设计工具如 Sketch 凭借 Bluebeam、Sketch Measure 等插件构建了成熟的离线标注体系，设计师可将标注文件打包交付，开发…

阅读更多...

SSE 数据的传输无法流式获取

SSE 数据的传输无法流式获取

问题调试过程中发现SSE数据返回的时间都是一样的，怀疑是接口问题。参考 EventSource数据一次性出来，并未流式输出的原因_sourceevent为什么结果一下全部返回了-CSDN博客处理 EventStream 不能流式返回的问题：Nginx 配置优化解决方案 …

阅读更多...

markdown文本转换时序图

markdown文本转换时序图

好久没更新了~这篇是markdown文本转换时序图的常用方法文章目录前言一、Mermaid语法示例二、PlantUML语法示例三、在线工具快速转换总结前言使用专业工具如Mermaid或PlantUML可以直接在Markdown中绘制时序图。这些工具支持简洁的语法，生成可嵌入文档的图表&…

阅读更多...

谷粒商城-分布式微服务 -集群部署篇[一]

谷粒商城-分布式微服务 -集群部署篇[一]

十九、k8s 集群部署 19.1 k8s 快速入门 19.1.1 简介 Kubernetes 简称 k8s。是用于自动部署，扩展和管理容器化应用程序的开源系统。中文官网中文社区官方文档社区文档概述 | Kubernetes 传统部署时代： 早期，各个组织是在物理服务器上…

阅读更多...

最新文章