大模型的部署简单搭建

大模型的部署搭建

真的好久没有进行博客的写作了,原因,最近的自己生活有点小波动,

最近想想还是有空写一篇文章,这篇文章的描述是学习的当下热门AI

本期,介绍的也是AI相关的LLM(大语言模型)

这个好多人应该都是模糊的,包括我一开始没有学习,就感觉牛逼的不行,今天我们亲自部署实践下

第一步:Ollama安装

首先我们需要下载一个管理大模型的软件Ollama

Ollama下载的地址:有的小伙伴下载不下来,可以私我,给你发离线exe

在这里插入图片描述

在这里插入图片描述

接下来,我们静等安装成功就可以了

在这里插入图片描述

检测是否安装成功: 在浏览器输入:localhost:11434 如果出现如下图所示说明已经成功Ollama is running
在这里插入图片描述

2.打开命令行终端

win+r键弹出窗口,输入cmd,打开cmd窗口,输入命令ollama,可以看到所有的命令

在这里插入图片描述

接下来,我们下载大模型

输入命令:ollama run llama3.2 我们下载的llama3.2的模型

在这里插入图片描述

下载需要一些时间,我们静静的等待就行,直到出现下图所示,表示安装成功,接下来,我们进行第二步:

第二步: 安装和配置UI界面

目的: 为了和本地的模型进行交互,我们也不能一直在黑窗口里面干活啊!哈哈哈!~

安装可视化界面的软件: MaxKB: 是基于大语言模型和RAG的知识库问答系统

当中的RAG我解释下:

  • 就是Retrieval检索+ Argument增强+Generation生成这三个词组成

在安装之前,我们本地要先安装dockerDesktop,安装好deskstop,我们要打开Hyper
在这里插入图片描述

然后我们打开cmd窗口,输入如下命令:

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb
##解释说明
docker run:启动一个新容器
-d:以后台(守护进程)模式运行容器
--name=maxkb:给容器命名为"maxkb"
-p 8080:8080:将主机的8080端口映射到容器的8080端口
-v ~/.maxkb:/var/lib/postgresql/data:将主机的~/.maxkb目录挂载到容器的/var/lib/postgresql/data目录
1panel/maxkb:使用的Docker镜像名称

等待下载
在这里插入图片描述

第二种方法:直接一键安装

# Linux 操作系统
docker run -d --name=maxkb --restart=always -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data -v ~/.python-packages:/opt/maxkb/app/sandbox/python-packages registry.fit2cloud.com/maxkb/maxkb# Windows 操作系统
docker run -d --name=maxkb --restart=always -p 8080:8080 -v C:/maxkb:/var/lib/postgresql/data -v C:/python-packages:/opt/maxkb/app/sandbox/python-packages registry.fit2cloud.com/maxkb/maxkb

下载好后:

我们在浏览器输入localhost:8080,输入用户密码: admin(MaxKB@123..)

在这里插入图片描述

登录后,我们进入模型设置选项

在这里插入图片描述

详细信息

在这里插入图片描述

选择好之后,我们,就看到如下图所示的ollama的模型

在这里插入图片描述

选择应用:

在这里插入图片描述

到这就是可以了,你自己本地的模型就搭建好了,可以自己去用了

在这里插入图片描述

比如我们输入个简单的hello

在这里插入图片描述

OK ,这就可以了,不过docker那块要好好安装下

下期我来写一篇自己搭建一个AI视频生成器的文章,让大家对网上博主弄得收费网站啥的,就是套壳儿!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85904.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85904.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于ssm英语学习交流平台微信小程序源码数据库文档

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了英语学习交流平台小程序的开发全过程。通过分析英语学习交流平台小程序管理的不足,创建了一个计算机管理英语学习交流平台小程序的方案。文章介绍了英…

华为云Flexus+DeepSeek征文|在Dify-LLM平台中开发童话故事精灵工作流AI Agent

华为云FlexusDeepSeek征文|在Dify-LLM平台中开发童话故事精灵工作流AI Agent 🌟嗨,我是LucianaiB! 🌍 总有人间一两风,填我十万八千梦。 🚀 路漫漫其修远兮,吾将上下而求索。 目录…

从实践出发谈如何开发一款好用的RTMP播放器

近几年,RTMP 播放器市场涌现出大量“宣传型”产品。各种“低延迟”“不卡顿”“跨平台”几乎成为标配口号,宣传文案看起来精彩纷呈,实际项目落地时却屡屡暴露问题:启动缓慢、黑屏、音画不同步,甚至连基本的稳定播放都无…

STM32F1\F4\H7 CubeMx 定时器配置

目录 1 定时器使用 1.1 CubeMX 配置 1.1.1 创建工程 1.1.2 时钟配置 1.1.3 定时器配置 1.1.4 GPIO 配置 1.1.5 工程管理 1.2 keil5 配置 1.2.1 添加代码 1.2.2 修改配置 1.2.3 下载程序 2 PWM使用 2.1 CubeMX 配置 2.1.1 PWM 配置 2.1.2 周期\频率计算方法 2.2…

2025中科院2区SCI-状态优化算法Status-based Optimization-附Matlab免费代码

近年来,现实世界的优化问题变得越来越复杂,挑战了传统确定性方法的有效性。本文介绍了基于状态的优化(SBO),这是一种受人类对地位提升的渴望启发的高效算法。通过模拟个人如何接近、学习或从高地位人物那里获得资源&am…

MySQL 启动报错 “The server quit without updating PID file“ 的全面解决方案(适用于 5.7/8.0 全版本)

摘要 在 MySQL 数据库运维中,"The server quit without updating PID file" 是常见且棘手的启动错误。本文结合 MySQL 官方文档及实战经验,系统梳理该错误的 10 大核心成因与解决方案,覆盖权限、配置、磁盘、SELinux 等多维度&…

运行时安全引擎RSE

安全之安全(security)博客目录导读 目录 一、RSE 通信层 1.1 消息结构 1.2 源代码文件 1.3 MHU 通信的 API 二、RSE 提供的运行时服务 2.1 运行时服务 API 2.2 软件与 API 层次结构 三、基于 RSE 的 Measured Boot(度量启动) 3.1 Measured Boo…

Elasticsearch、Faiss、Milvus在向量索引实现上的核心差

Faiss、Elasticsearch(ES)和Milvus在向量索引实现上的核心差异主要体现在架构定位、索引技术、扩展性及适用场景上,具体对比如下: 一、架构设计与定位‌ ‌维度‌‌Faiss‌‌Elasticsearch‌‌Milvus‌‌核心定位‌单机向量索引…

iot-dc3 项目windows本地运行保姆喂奶级教程

一.源码拉取 当前时间:2025年06月18日12点02分 后台接口服务:https://gitee.com/pnoker/iot-dc3.git 前端:https://gitee.com/pnoker/iot-dc3-web.git 请自行拉取至本地。 二.本地环境准备 其他基础环境先不讲了,如有需要请留言。 idea + VS Code。 IntelliJ IDEA 2024.2.…

内部网关协议配置实验

一:静态路由 简述:在华为路由器中,使用ip route-static命令配置静态路由。一条静态路由主要包含以下要素。 目的地址:数据包要到达的目标IP地址 子网掩码:用于指定目的地址的网络部分和主机部分 下一跳地址&#xff08…

大模型应用:如何使用Langchain+Qwen部署一套Rag检索系统

一、TL;DR 从0-1使用qwen chat model langchain的链式架构搭建一套rag系统详细介绍了Langchain的工具链的调用流程简单介绍了可能会出现什么问题 二、方法 参考开源链接:https://github.com/Aphasia0515/self_llm/ 2.1 硬件和软件依赖 类型需求备注…

决策树:化繁为简的智能决策利器

本文来自「大千AI助手」技术实战系列,专注用真话讲技术,拒绝过度包装。 想象一个相亲决策过程: 对方收入 > 30万? → 是 → 见面否 → 颜值高? → 是 → 先聊聊否 → 放弃 这种层层递进的判断结构,正是…

html中的盒子标签div标签,有序列表,无序列表

div标签 div标签对于分析数据很重要&#xff0c;因为数据在页面中展示是以区域的形式展示的&#xff0c;而查找数据需要先找到盒子名称在继续向下找。前端页面布局中有两种布局方式&#xff0c;一种是通过表格布局&#xff0c;一种是通过divcss来布局。 <!DOCTYPE html>…

【Redis】解码Redis中hash类型:理解基础命令,以及内部编码方式和使用场景

&#x1f4da;️前言 &#x1f31f;&#x1f31f;&#x1f31f;精彩读导 本次我们将全面剖析Redis的核心技术要点&#xff0c;包括其丰富的数据类型体系、高效的编码方式以及秒级响应的性能奥秘。对于渴望深入理解Redis底层机制的技术爱好者&#xff0c;这是一次难得的学习机会…

AI工具在学术写作中的伦理边界与诚信规范的平衡

AI写作助手的兴起与争议 人工智能技术的飞速发展&#xff0c;学境思源&#xff0c;ChatGPT、Grok、Claude 等AI写作工具逐渐走入高校师生的视野。一键生成论文初稿&#xff01;从课程作业到毕业论文&#xff0c;不少学生已经尝试让AI参与写作过程&#xff0c;希望借此提升效率…

课程专注度分析系统项目

前端代码: <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>课堂专注度分析系统 - 科技…

区块链是什么

区块链的本质与机制 1. 核心定义 区块链 加密的分布式记账技术&#xff0c;融合密码学、网络学、金融学三大学科。 去中心化&#xff1a;数据存储于全网节点&#xff08;如百万台计算机&#xff09;&#xff0c;而非单一数据库。不可篡改&#xff1a;修改数据需控制全网51%以…

用可观测工具高效定位和查找设计中深度隐藏的bug

软件仿真拥有最佳的信号可见性和调试灵活性,被大多数工程师熟练使用,能够高效捕获很多显而易见的常见错误。 然而,由软件实现的数字仿真过程运行速度有限,很难做到100%代码覆盖。导致那些深度隐藏的设计问题,将不可避免的逃逸,只能以FPGA在线调试方式解决。 01 为什么全…

华为OD-2024年E卷-字符串化繁为简[200分] -- python

问题描述&#xff1a; 给定一个输入字符串&#xff0c;字符串只可能由英文字母(a~z、A~Z) 和左右小括号((、))组成。当字符串里存在小括号时&#xff0c;小括号是成对的&#xff0c;可以有一个或多个小括号对&#xff0c;小括号对不会嵌套&#xff0c;小括号对内可以包含1个或…

使用sealos安装k8s

一、准备工作&#xff08;所有节点需执行&#xff09;​ 1、系统要求 操作系统&#xff1a;本文为Ubuntu 20.0.4 配置&#xff1a;不同主机名、时间同步、SSH 免密互通、关闭防火墙/SELinux/swap。 资源&#xff1a;建议 ≥2核 CPU、2GB 内存&#xff08;生产环境需更高&am…