Dify+Ollama+QwQ:3步本地部署,开启AI搜索新篇章

如何来评价本地化部署的价值与优势分析:


成本优化与隐私保障

自定义搜索插件,告别信息过载

一键生成报告、分析,效率翻倍!

接下来我们就尝试跟随来部署本地的价值所在!

1:安装Ollama & 部署QwQ模型

1.1 安装Ollama

去官网ollama.com下载windows版,一路next就好。

1.2 拉取QwQ模型(通义千问官方推理模型)

在windows命令行输入ollama run qwq。

 

ollama run QwQ

QwQ是32B参数的,显存16G以上应该可以流畅运行。

当然也可以安装最新的Qwen3,它有很多不同参数版本,可以找到适合自己电脑配置的版本安装。

1.3安装Docker容器

本地部署Dify要先安装Docker桌面版,跟Ollama一样简单,也是去官网下载对应版本文件,直接安装就OK。

1.4安装Dify

安装 Dify 简单的方式就是git clone,复制其github地址github.com/langgenius/dify,找个文件夹git cloen就好,当然这样需要科学上网。

2:启动Dify,配置Google搜索插件

2.1 启动Dify

命令行进到dify文件夹中的docker目录,将.env.example文件拷贝一个,重命名为.env,然后运行dify启动命令。

 

cd dify
cd docker
copy .env.example .env
docker compose up -d

稍等一下,它会自动安装一些image

 

点开docker桌面版会看到容器里有个带绿点的docker就成功了。 

点开浏览器,地址栏输入http://localhost/insatll,设置自己本地dify的用户名和密码。

2.2 配置ollama本地模型

点开dify页面右上角的用户图标中的设置。

在模型供应商中选择ollama。

在模型供应商ollama中点添加模型。

注意填写模型名字“qwq”和地址“host.docker.internal:11434”。

成功后显示这样。

2.3 获取谷歌搜索API密钥

  1. 访问 serpapi.com

  2. 注册 → 需要邮箱和电话,国内手机就行

  3. 免费版每月可以进行100次搜索

  4. 进入后可以看到自己API密钥

2.4 添加Dify的谷歌搜索插件

Dify的插件功能比起繁琐的MCP服务器好用多了,直接在dify页面中插件,搜索google,直接安装并填入刚获得的谷歌搜索API密钥。

成功后会显示已授权。

 3:创建Dify Agent代理

3.1 创建Agent

这最后一步反而是最简单的,进入dify页面中工作室,agent菜单,创建空白应用。

在工具中添加谷歌。右上角模型中选qwq。 

到此就完成各位看官可以试一下! 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/87741.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/87741.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FAISS 简介及其与 GPT 的对接(RAG)

什么是 FAISS? FAISS (Facebook AI Similarity Search) 是 Facebook AI 团队开发的一个高效的相似性搜索和密集向量聚类的库。它主要用于: 大规模向量相似性搜索高维向量最近邻检索向量聚类 https://github.com/facebookresearch/faissFAISS 特别适合处理…

【Apache Doris 深度实战:从 MPP 架构到实时分析,解锁三大数据模型的性能优化秘籍】

一、安装部署 安装教程:GitHub地址 Doc文档:Apache Doris 简介 - Apache Doris 二、功能及作用 Apache Doris 是一款基于MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果…

MySQL主从复制与读写分离概述

前言: 在数据驱动的现代应用中,数据库面临高并发读写与海量存储的双重挑战。单一数据库实例在性能、可用性及扩展性上逐渐成为瓶颈。MySQL主从复制(Master-Slave Replication)与读写分离(Read/Write Splitting&#xf…

数据库-元数据表

1. 什么是元数据表元数据:数据的数据,用以描述数据的信息也是数据,被称为元数据2. 获取元数据的方法MySQL提供了以下三种方法用于获取数据库对象的元数据:show语句从INFORMATION_SCHEMA数据库里查询相关表(information…

【STM32】通用定时器PWM

STM32 通用定时器 PWM 输出完全解析(以 TIM3_CH1 为例) PWM 输出基本原理 PWM(Pulse Width Modulation)即脉冲宽度调制,是由定时器通过比较 CNT 与 CCR 寄存器实现的。 信号产生原理: ARR 决定周期&#…

python学习打卡:DAY 21 常见的降维算法

知识点回顾: LDA线性判别PCA主成分分析t-sne降维 还有一些其他的降维方式,也就是最重要的词向量的加工,我们未来再说 浙大疏锦行

基于SpringBoot和Leaflet集成在线天气服务的区县当前天气WebGIS实战

目录 前言 一、需求描述 1、功能需求 2、技术实现流程 二、SpringBoot后台实现 1、控制层实现 2、区县数据返回 三、WebGIS前端实现 1、区位信息展示 2、天气信息展示 四、成果展示 1、魔都上海 2、蜀地成都 3、湖南桂东 五、总结 前言 在当今数字化时…

文心开源:文心大模型4.5系列全面开放,AI普惠时代加速到来

一场由4240亿参数模型领衔的开源盛宴,正在重塑中国AI生态的底层逻辑 2025年6月30日,百度如约宣布全面开源其旗舰产品——文心大模型4.5系列。一次性开源10款模型,覆盖从4240亿参数的MoE多模态巨无霸到轻巧的0.3B端侧模型,并同步开…

【运算放大器专题】基础篇

1.1 运算放大器是放大了个寂寞吗?—初识运算放大器 为了解决震荡问题,人为加了一些补偿网络之后导致的高频特性差 1.2欧姆定律和独立源 1正弦2方波3脉冲 电压源是平行于i轴的横线 1.3有伴源和运放缓冲器 有伴指的是有电阻,有伴是坏事&#…

英伟达 jetson nano 从NFS启动,使用英伟达提供的rootfs根文件系统

0、目标 为了方便驱动阶段的开发,并且使用英伟达提供的上层应用,这里希望使jetson nano 从NFS启动,同时使用英伟达提供的rootfs根文件系统。 1、硬件准备 确保jetson nano 板子和开发主机之间使用网线进行连接(保持板子和开发主…

广州华锐互动:以创新科技赋能教育,开启沉浸式学习​

在教育领域,广州华锐互动致力于打破传统教学的局限性,为师生们带来全新的沉浸式学习体验。广州华锐互动通过开发 VR 虚拟教学课件,将抽象的知识转化为生动、逼真的虚拟场景,让学生能够身临其境地感受知识的魅力 。比如在历史课上&…

Grok 4 最新技术评测与发布指南

TL;DR:马斯克跳过Grok 3.5直接发布Grok 4,计划在7月4日后上线,专注编程模型优化,这次"极限迭代"能否让马斯克在AI军备竞赛中翻盘? 📋 文章目录 🚀 Grok 4发布概况🏆 Grok…

为什么音视频通话需要边缘加速

⏩ 主要原因 ✅ 降低传输延迟 用户与边缘节点之间通常1-2跳即可完成连接,避免跨国、跨运营商长链路传输 保障音视频信令、媒体流快速到达,控制端到端延迟 ✅ 提升弱网环境下的连接稳定性 边缘节点具备链路优化、丢包补偿、转发中继功能 即使在WiFi切…

小架构step系列05:Springboot三种运行模式

1 概述 前面搭建工程的例子,运行的是一个桌面程序,并不是一个Web程序,在这篇中我们把它改为Web程序,同时从启动角度看看它们的区别。 2 Web模式 2.1 桌面例子 回顾一下前面的例子,其pom.xml的配置如下:…

LoRaWAN的设备类型有哪几种?

LoRaWAN(Long Range Wide Area Network)是一种专为物联网(IoT)设备设计的低功耗、长距离通信协议。它根据设备的功能和功耗需求,将设备分为三种类型:Class A、Class B 和 Class C。每种设备类型都有其独特的…

三维目标检测|Iou3D 代码解读一

本文对OpenPCDet项目中的iou3d模块中的iou3d_nms_kernel.cu代码进行解读,本次解决的函数是box_overlap,它的输入是两个包围盒,输出是两个包围盒在bev下的重叠面积,计算流程是 确定box_a和box_b的四个角落坐标 从包围盒中提取坐标值…

探索实现C++ STL容器适配器:优先队列priority_queue

前引: 在算法竞赛中,选手们常常能在0.01秒内分出胜负;在实时交易系统中,毫秒级的延迟可能意味着数百万的盈亏;在高并发服务器中,每秒需要处理数万条不同优先级的请求——这些系统背后,都隐藏着同…

一、Dify 私有部署、本地安装教程(LInux-openeuler)

官网:Dify AI Plans and Pricing 1.找到下载的位置。 2.可以切换文档为中午文档。 3.本次安装使用Docker Compose 安装,可以大致看一下文档描述的配置信息要求。 4.各个版本信息,本次下载1.5.1版本,你也可以选择安装其他版本。 …

GASVM+PSOSVM+CNN+PSOBPNN+BPNN轴承故障诊断

一、各算法基本原理与技术特点 1. GASVM(遗传算法优化支持向量机) 原理: 利用遗传算法(GA)优化SVM的超参数(如惩罚因子 C C C 和核函数参数 g g g)。遗传算法通过模拟自然选择机制&#xff…

Python实例练习---魔法方法

(主页有对应知识点^V^) 【练习要求】 针对知识点Python面向对象的魔法方法安排的本实例。要求实现:用__init__魔法方法定义书的长,宽,高,最后用__str__输出返回值 【重要步骤提示】 定义class书类 2、使…