【Ollama】open-webui部署模型

目录

一、本地部署Ollama

1.1 进入官网复安装命令

1.2 执行安装命令

 1.3 验证是否安装成功

二、启动Ollama服务

三、运行模型

方法一:拉取模型镜像

方法二:拉取本地模型

四、使用Open WebUI 部署模型

4.1 创建虚拟环境

4.2 安装依赖

4.3 运行 open-webui

4.4 启动浏览器



前言

安装前说明

 本教程主要演示的是Linux环境部署


一、本地部署Ollama

1.1 进入官网复制安装命令

Ollama官网:Ollama

说明:个人电脑显存如果低于16GB不推荐安装,因为跑不动模型,可以去租服务器。

以下是部署在服务器Linux环境下部署的。

 

▲因为部署的环境是Linux,这里选择Linux的安装命令;

▲复制命令,在服务器的数据盘中安装

curl -fsSL https://ollama.com/install.sh | sh


1.2 执行安装命令

在服务器的数据盘中运行

说明:不同服务器的数据盘会有所不同,这里一定得选好适合自己的。 


 1.3 验证是否安装成功

#查看Ollama版本
ollama --version

 显示样例: 


二、启动Ollama服务

#启动Ollama服务
ollama serve

显示样例: 

说明:ollama运行后会在本地端口暴露一个 openai API 服务,我们后面使用 open-webui 来连接就可以了。


三、运行模型

3.1 方法一:拉取ollama模型镜像

#拉取在线模型deepseek-r1:1.5b
ollama run deepseek-r1:1.5b

拉取成功后可以直接和大模型进行对话。

  

(可选)选择模型:这里选择deepseek-r1:1.5b

要下载那个模型,点进去就有它的安装命令; 


3.2  方法二:拉取本地模型

前提要求:本地需要要一个gguf格式的模型,可以去魔塔社区或Huggingface上下载;

这里以魔塔社区为例:

可以搜索gguf后缀的模型下载现成的

3.2.1 选择模型

这里我选择一个已经训练后,转成gguf个格式的模型【Qwen2.5-7B-Instruct-f16.gguf】。


3.2.2 创建ModelFile

创建一个 Ollama 模型的 meta 文件(ModelFile),目的是让 Ollama 能加载你本地的 GGUF 文件。

1、选择创建ModelFile的路径

#进入模型路径
cd /mnt/workspace/model/qwen

/mnt/workspace/model/qwen:表示我存放模型文件的路径,这里选择自己存放模型的路径即可。

2、创建一个名为 Modelfile 的文件

nano Modelfile

或者用 vi

vi Modelfile

按“i”写入以下内容。复制模型路径,写入以下内容,创建名为“ModelFile”的meta文件,内容如下:

#GGUF文件路径
FROM /mnt/workspace/model/qwen/Qwen2.5-7B-Instruct-q8_0.gguf

说明:/mnt/workspace/model/qwen/Qwen2.5-7B-Instruct-q8_0.gguf:表示转换为gguf格式的模型路径。

【说明】

成功写入后,会在当前目录下创建一个Modelfile的文件


3.2.3 创建自定义模型 

使用ollama create命令创建自定义模型

ollama create qwen2.5-7b-f16 -f ./Modelfile

qwen2.5-7b-f16:表示注册进Ollama的自定义模型名称;

./Modelfile:表示上一步创建的Modelfile文件路径;

这会把模型注册进 Ollama 的本地模型库,名字叫 qwen2.5-7b-f16


3.2.4 查看是否注册成功
ollama list


四、使用Open WebUI 部署模型

open webui适合小型快速的应用做部署,但在现阶段这个框架是存在一定缺陷的:不适合微调之后的模型,在【三、运行模型】这一步介绍了2种方法,一种是直接从Ollama中拉取模型,一种则是训练后的gguf格式的模型文件。经过测试,直接在Ollama上拉取的模型可以正常去做一些回答,而微调后的模型拉取到Ollama上,会不停地输出内容

4.1 创建虚拟环境

#创建虚拟环境
conda create -n ollama-open-webui python=3.11#激活虚拟环境
conda create -n ollama-open-webui
这里选用 python 3.11 版本是因为 open-webui 的要求,一定要根据官方指定的python版本,不然后面安装依赖过程中可能会报错。
仓库:https://github.com/open-webui/open-webui
文档:https://docs.openwebui.com/

4.2 安装依赖

pip install -U open-webui

注意:这里安装的过程会比较长,耐心等待;


4.3 运行 open-webui

# 激活名为 open-webui 的 Conda 环境
conda activate open-webui  # 设置 Hugging Face 模型仓库的镜像地址为 https://hf-mirror.com,通常用于加速从 Hugging Face 下载模型
export HF_ENDPOINT=https://hf-mirror.com  # 启用 Ollama API 服务,这可能意味着启动本地 Ollama 服务用于与模型交互
export ENABLE_OLLAMA_API=True  # 设置 OpenAI API 的本地基础 URL,使其指向本地服务 (127.0.0.1:11434),通常用于连接 OpenAI 的代理或自定义接口
export OPENAI_API_BASE_URL=http://127.0.0.1:11434/v1  # 启动 open-webui 服务,通常是启动一个 Web 界面应用来访问模型、进行交互或查看结果
open-webui serve

这里会生成一个文件.webui_secret_key;


【注意】

执行open-webui server后,可能时间会比较长,只要没报错就耐心等待;

简单总结:

  1. 激活 Conda 环境:确保你正在使用特定的 Conda 环境 (open-webui) 来运行应用。

  2. 设置镜像和 API 配置:通过环境变量配置模型下载源 (HF_ENDPOINT) 和启用本地服务(ENABLE_OLLAMA_API)以及设置 API 基础 URL(OPENAI_API_BASE_URL)。

  3. 启动服务:最后通过 open-webui serve 启动 Web 服务,通常是一个用来与模型交互的界面。


4.4 启动浏览器

一切运行正常后,可以通过浏览器输入 http://127.0.0.1:8080 打开 open-webui 面板进行使用。如果部署在远程服务器则需要把 127.0.0.1 改成对应的 ip 地址(并考虑防火墙问题)。
关于后台持续运行服务,可以使用 tmux/screen/systemd 工具或者 nuhup ... & 等方法,网上教程非常多,本文在此不叙述。
▲启动后,需要创建管理员账号
▲确认开始使用

▲进入对话页面

▲进行对话

切换模型,可以发现注册进ollama的模型都在这里,可以根据需求选择增加想要的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/92608.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/92608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#文件操作(创建、读取、修改)

判断文件是否存在 不存在则创建默认文件 并写入默认值/// <summary>/// 判断文件是否存在 不存在则创建默认文件 并写入默认值/// </summary>public void IsConfigFileExist(){try{// 获取应用程序的当前工作目录。string fileName System.IO.Directory.GetCurr…

基于阿里云平台的文章评价模型训练与应用全流程指南

基于阿里云平台的文章评价模型训练与应用全流程指南 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家&#xff0c;觉得好请收藏。点击跳转到网站。 1. 项目概述 1.1 项目背景 在当今信息爆炸的时代&…

AI 及开发领域动态与资源汇总(2025年7月24日)

AI 项目、工具及动态汇总 项目/产品名称核心功能/简介主要特点/亮点相关链接Supervision一个流行的计算机视觉工具库&#xff0c;用于加速计算机视觉应用的构建。模型无关&#xff0c;可与多种主流库集成&#xff1b;提供丰富的可定制标注工具&#xff1b;支持多种数据集操作和…

C专题8:文件操作1

1.C语言中的文件是什么?所谓文件&#xff08;file&#xff09;一般指存储在外部介质上数据的集合&#xff0c;比如我们经常使用的txt、bmp、jpg、exe、rmvb等等。这些文件各有各的用途&#xff0c;我们通常将它们存放在磁盘或者可移动盘等介质中。文件无非就是一段数据的集合&…

Opencv C# 重叠 粘连 Overlap 轮廓分割 (不知道不知道)

先上效果图一种基于凹陷检测重叠轮廓分割的方法这两个星期压力大的一批&#xff0c;心脏都给干得乱跳了&#xff0c;现在高血压心率不齐贫血。兄弟们保重身体啊。简单说下逻辑&#xff1a;前处理&#xff1a;的噼里啪啦我就不说了&#xff0c;根据样品来(灰度&#xff0c;滤波&…

CentOS7 安装 rust 1.82.0

CentOS7 安装 rust 1.82.0 我在CentOS7.9中安装rust遇到报错版本低&#xff0c;再升级版本的过程中遇到诸多问题&#xff0c;简单记录。 遇到的问题 提示版本低 centos7 安装 ERROR: Rust 1.75.0 or newer required.Rust version 1.72.1 was found.原因是 CentOS7 的默认的软件…

Compose 适配 - 键鼠模式

一、概念不止触摸交互&#xff0c;在 ChromeOS 或外接键鼠的设备上&#xff0c;需要考虑焦点、悬停、右键等操作逻辑。二、使用2.1 焦点使用 Tab 键来导航&#xff0c;改变边框以提供清晰的焦点指示器。Composable fun Demo() {val interactionSource remember { MutableInter…

征服 Linux 网络:核心服务与实战解析

在当今的IT基础设施中&#xff0c;Linux作为服务器操作系统的基石&#xff0c;其强大的网络功能是其不可或缺的优势。对于任何志在成为高级系统管理员或运维工程师的人来说&#xff0c;精通Linux网络配置与服务管理是核心竞争力。 与日常应用不同&#xff0c;Linux网络管理往往…

Spark 之 DataFrame

# foreach useFeatureDF.rdd.foreachPartition {iter => iter.foreach {row =>val userId = row.getAs[Int]

射频信号(大宽高比)时频图目标检测anchors配置(下)

书接上文&#xff1a; 射频信号&#xff08;大宽高比&#xff09;时频图目标检测anchors配置&#xff08;上&#xff09; 三、4090加成检测效果深度优化 在4090 24G专用显存加持下继续探究大宽高比目标检测的奥秘&#xff1a; Conda环境迁移至租的云服 在云服上第一次测试…

跨境支付入门~国际支付结算(区块链篇)

摘要Web3区块链技术架构解析&#xff1a;从底层共识到应用生态本文系统梳理了Web3作为稳定币基础设施的技术架构&#xff0c;采用"数字共和国"的比喻框架&#xff0c;将区块链技术分解为六大核心模块&#xff1a;宪法根基&#xff08;区块链层&#xff09;&#xff1…

Docker 私服

什么是 Docker 私服&#xff1f; Docker 官方的 Docker Hub 是一个用于管理公共镜像的仓库&#xff0c;我们可以从上面拉取镜像 到本地&#xff0c;也可以把我们自己的镜像推送上去。 但是&#xff0c;有时候我们的服务器无法访问互联网&#xff0c;或者你不希望将自己的镜像…

DeepSeek vs ChatGPT:谁更胜一筹?

新兴 AI 聊天机器人的崛起与挑战&#xff1a;对话模型发展观察近年来&#xff0c;生成式人工智能领域持续取得突破&#xff0c;聊天机器人作为其中的代表&#xff0c;广泛应用于写作、编程、问答和信息处理等任务。2025 年初&#xff0c;国内某 AI 团队宣布了多项模型技术进展&…

飞算科技:以原创技术为翼,赋能产业数字化转型

在数字经济浪潮席卷全球的当下&#xff0c;一批专注于技术创新的中国企业正加速崛起&#xff0c;飞算数智科技&#xff08;深圳&#xff09;有限公司&#xff08;简称 “飞算科技”&#xff09;便是其中的佼佼者。作为一家国家级高新技术企业&#xff0c;飞算科技以自主创新为核…

电商接口什么意思?

“电商接口”这四个字&#xff0c;在中文互联网上出现的频次越来越高&#xff1a;商家后台、小程序、ERP、数据大屏……几乎任何与线上零售沾边的场景都会提到它。然而&#xff0c;对大多数刚进入电商行业的新人&#xff0c;甚至一些已经开了很多年网店的老板来说&#xff0c;这…

前端面试专栏-前沿技术:30.跨端开发技术(React Native、Flutter)

&#x1f525; 欢迎来到前端面试通关指南专栏&#xff01;从js精讲到框架到实战&#xff0c;渐进系统化学习&#xff0c;坚持解锁新技能&#xff0c;祝你轻松拿下心仪offer。 前端面试通关指南专栏主页 前端面试专栏规划详情 跨端开发技术&#xff08;React Native、Flutter&am…

复盘—MySQL触发器实现监听数据表值的变化,对其他数据表做更新

文章目录 MySQL交换数据库表中两列的值(额外的知识) 为防止后面有疑问,提前解释为什么需要 `$$` ? 第一版需求 第二版需求 第三版需求 注意事项: 存在的严重问题 最终版 关键修复说明: 完整测试场景: 额外建议(如果需要显式处理NULL): COALESCE函数 业务中出现的问题…

SpringCloud【Sentinel】

1&#xff0c;工作原理 2&#xff0c;常见规则 流量控制&#xff08;FlowRule&#xff09; 1&#xff0c;阈值类型设置如下 单机均摊&#xff1a;每个机器均摊&#xff0c;比如阈值填5&#xff0c;三个机器&#xff0c;就个机器都可以有5个 总体阈值&#xff1a;所有机器总阈…

解构未来金融:深入剖析DeFi与去中心化交易所(DEX)的技术架构

今天&#xff0c;我们来聊一个颠覆传统金融界的热门话题——DeFi&#xff08;去中心化金融&#xff09;。大家可能听说过它如何承诺将银行、交易所、保险等金融服务构建在一个开放、无需许可的区块链网络上。而这一切魔法的核心&#xff0c;正是其独特的“技术架构”。 在这篇文…

中国西北典型绿洲区土壤水分特征(2018-2019年)

数据集摘要该数据包含张掖绿洲黑河沿岸湿地、过渡带杨树林土壤水分、温度数据。数据采集时间为2018年至2019年&#xff0c;采集地点为张掖绿洲&#xff0c;数据为日数据。该数据集是按照课题制定的试验方案和中国生态系统研究网络编著的陆地生态系统水土气生观测规范进行数据的…