网页操作自动化解决方案:如何用Browser-Use+CPolar提升企业运营效率

文章目录

    • 前言
    • 1. 安装Ollama
    • 2. Gemma3模型安装与运行
    • 3. 虚拟环境准备
      • 3.1 安装Python
      • 3.2. 安装conda
    • 4. 本地部署Brower Use WebUI
      • 4.1 创建一个新conda环境
      • 4.2 克隆存储库
      • 4.3 安装依赖环境
      • 4.4 安装浏览器自动化工具
      • 4.5 修改配置信息
    • 5. 本地运行测试
    • 6. 安装内网穿透
      • 6.1 配置公网地址
      • 6.2 配置固定公网地址
    • 总结
        • 这种技术组合解决了企业级自动化的核心痛点:它不是简单叠加功能模块,而是通过行为模拟与网络穿透方案协同构建了完整的执行链路。当Browser-Use的智能引擎与CPolar的远程访问能力结合时,在线任务自动化效率将实现质的飞跃——这正是数字化运营中的关键基础设施升级方向。

前言

每个需要处理重复性在线任务的企业都面临同样的挑战:既要绕过网站的反爬机制,又要保证交互动作的准确性。开源工具Browser-Use提供了创新解决路径——通过模拟真实用户行为轨迹,在合规前提下执行复杂网页操作。

其核心优势在于场景适配能力:从自动完成产品注册到竞品价格监控,从表单数据填充到动态内容采集,该工具能处理需要上下文理解的多步骤任务。特别在市场调研领域,Browser-Use可同时模拟数百个独立用户访问行为,避免IP封禁风险——其内置的异常检测模块会自动调整操作节奏以降低识别概率。

结合CPolar网络穿透方案后,这种能力得到延伸扩展。当需要远程管理部署在私有服务器中的自动化实例时,无需配置复杂的端口转发规则即可通过公网控制任务流程。例如:营销团队可随时从任意地点优化问卷调查脚本,技术支持人员则能即时调试在线故障诊断程序——所有操作均通过安全隧道完成。

本文主要介绍如何在本地Windows系统部署Browser-Use WebUI,并结合cpolar内网穿透工具实现远程使用Browser-Use操作浏览器智能抓取数据并通过本地AI大模型进行分析,执行任务,打造个人全自动AI助理。

1. 安装Ollama

在部署Browser-Use之前,我们首先需要先准备好Ollama和你要使用的本地大模型以及虚拟环境配置。

本例中使用的是Windows11系统专业版,通过Ollama运行本地大模型,之前曾经发布过如何在Windows安装Ollama的教程,有需要可以看看这篇文章:Windows本地部署Deepseek-R1大模型并使用Web界面远程交互

简单来说,就是访问Ollama的官网:Download Ollama on Windows

image-20250408144901346

下载对应版本的Ollama安装程序并安装:

image-20250408144936715

2. Gemma3模型安装与运行

本例中我打算使用的本地模型是Gemma3:27b,因为它有多模态能力,可以识别图片,稍后测试一下实际效果。

在Ollama的官网点击Models,就能找到安装命令:

ollama run gemma3:27b

image-20250422155507442

PS:默认会下载模型到C盘,如果想修改下载位置,可以在终端中执行下方命令来指定模型文件的存放目录,这里以d:\ollama为例,大家可以提前自定义位置:

set OLLAMA_MODELS=d:\ollama

如果你之前安装过Ollama,在执行命令后出现如下图提示,那么关闭终端,请先升级ollama到最新版本才能正常下载gemma3模型。

image-20250408153616855

模型下载完成之后,安装成功后会提示success:

image-20250408161835787

3. 虚拟环境准备

3.1 安装Python

本例使用Windows11专业版系统进行演示:

首先需要安装 python 3.12 下载地址:Python Release Python 3.12.0 | Python.org

image-20250318144358086

安装时需要注意,勾选下边两个选项,不然后续有可能报错:

image-20250318144818801

安装结束后,如出现下图提示,点击该选项(更改您的机器配置,以允许程序(包括Python)绕过260字符的“最大路径”限制)同意即可。

image-20250318145149139

确认后,点击close关闭即可完成Python环境安装。

3.2. 安装conda

这里我使用的是本地已有的conda环境,大家也可以通过UV来创建虚拟环境:

conda下载地址:Anaconda Installers and Packages

安装时需要注意的是在这一步,需要勾选第三个选项,自动加载刚才安装的Python3.12环境:

image-20250318150527896

安装完成后,点击Finish即可:

image-20250318150909756

4. 本地部署Brower Use WebUI

接下来开始在Windows系统使用conda本地部署Brower Use WebUI

4.1 创建一个新conda环境

首先在Windows中打开cmd,执行下方命令创建虚拟环境:

conda create -n browseruse python=3.12

输入y确认:

image-20250422163301179

创建成功:

image-20250422163410427

如果提示’conda’ 不是内部或外部命令,也不是可运行的程序,我们需要配置一下环境变量,具体操作可以查看这篇文章:conda环境变量配置

环境创建好之后,执行下方命令激活这个新的conda环境:

conda activate browseruse

image-20250422163642838

如上图所示,这个conda环境就激活成功了。

4.2 克隆存储库

接下来,执行下方命令,将Browser-use WebUI拉取到本地:

git clone https://github.com/browser-use/web-ui.git

进入Browser-use WebUI项目路径:

cd web-ui

4.3 安装依赖环境

执行下方命令安装依赖环境:

pip install -r requirements.txt

image-20250422164626232

现在就安装好了:

image-20250422164716384

4.4 安装浏览器自动化工具

执行下方命令,安装浏览器自动化工具:

playwright install

image-20250422165658668

4.5 修改配置信息

然后执行下方命令,复制一份配置示例文件并改为.env格式文件:

copy .env.example .env

image-20250422170754786

复制后在webui安装的电脑路径中也能看到这两个文件:

image-20250422170903992

打开配置文件后可以修改你想要使用的模型路径,API KEY,使用自己哪个已有的浏览器路径等,本地中使用ollama调用本地大模型,就暂时不用修改了,稍后在web-ui界面中配置即可:

image-20250422172133694

修改完成后,保存退出即可。

5. 本地运行测试

执行下方命令:

python webui.py --ip 127.0.0.1 --port 7788

访问:http://localhost:7788

image-20250422171958209

即可在浏览器中打开browser-use 的 web-ui 界面了:

image-20250422172013738

关闭服务后想再次启动服务,可以打开cmd,执行conda activate browseruse 激活环境,然后cd web-ui进入web-ui路径,执行 python webui.py --ip 127.0.0.1 --port 7788 启动服务即可.

在主界面,上方的设置导航中选择Agent Settings,如果你本地部署的大模型不支持视觉识别,可以把这个使用视觉取消勾选,不然后续让AI执行任务时会报错。

image-20250423120048605

然后点击LLM Settings,对本地大模型进行设置:

image-20250423141304692

LLM Provider在下拉中选择ollama

Model Name需要手动输入你要调用的本地大模型名称,我这里使用的是gemma3:27b

这个模型名称可以在cmd终端中输入ollama list来进行查看:

image-20250423141449351

然后就可以点击顶部导航中的Run Agent来输入指令让AI自动来执行任务了:

image-20250423150254501

点击执行后,底部的结果和报错框中会显示运行时间:

image-20250423150542099

在cmd终端中也能看到刚才我们提的要求,与执行操作的步骤:

image-20250423150835193

执行任务同时AI会打开浏览器,自动进行搜索与后续操作:

image-20250423151104986

任务结束后,能看到AI成功执行了指令,帮我在B站搜索cpolar并打开搜索结果中的第一个视频:

image-20250423152122462

agent_history

美中不足的是使用其自带的浏览器在播放视频时,会提示浏览器不支持html5播放器,想要解决这个问题只需要在上边提到的.env配置文件中修改一下调用你自己电脑上的浏览器就可以了,而且登录视频网站后,在使用AI访问该网站时也无需二次登录了。

除了让它自动使用浏览器访问网站搜索并播放视频,我们也可以让它自动访问指定的网站查询某个账号发布的文章,并统计其账号发布的文章标题,发布时间,阅读量和点击量等信息。大家也可以根据自己的情况来提出要求让这个全自动的AI助力来为你提升工作效率,节省大量时间。

6. 安装内网穿透

现在我们已经成功在本地部署了Browser-Use WebUI并使用AI使用浏览器自动执行任务,但如果想实现不在同一网络环境下,也能随时随地在网页中远程使用本地部署的Browser-Use处理问题,那就需要借助cpolar内网穿透工具来实现公网访问了!接下来介绍一下如何安装cpolar内网穿透,过程同样非常简单:

首先进入cpolar官网:

cpolar官网地址: https://www.cpolar.com

点击免费使用注册一个账号,并下载最新版本的cpolar:

image-20250307152003085

登录成功后,点击下载cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到配置界面,结下来在WebUI管理界面配置即可。

img

6.1 配置公网地址

接下来配置一下 Browser-Use WebUI 的公网地址:

登录后,点击左侧仪表盘的隧道管理——创建隧道,

  • 隧道名称:buse(可自定义命名,注意不要与已有的隧道名称重复)
  • 协议:选择 http
  • 本地地址:7788
  • 域名类型:选择随机域名
  • 地区:选择China Top

image-20250423153718664

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,有两种访问方式,一种是http 和https:

image-20250423153756174

使用上面的任意一个公网地址,在平板或其他电脑的浏览器进行登录访问,即可成功看到 Browser-Use WebUI 界面,这样一个公网地址且可以远程访问就创建好了,使用了cpolar的公网域名,无需自己购买云服务器,即可到随时在线访问了!

image-20250423153936173

同样可以使用AI在浏览器中自动执行任务:

image-20250423154736017

小结

为了方便演示,我们在上边的操作过程中使用cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用。然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。

如果有长期远程访问Browser-use WebUI让AI使用浏览器自动处理问题,或者异地访问与使用其他本地部署的服务的需求,但又不想每天重新配置公网地址,还想让公网地址好看又好记并体验更多功能与更快的带宽,那我推荐大家选择使用固定的二级子域名方式来为WebUI配置一个公网地址。.

6.2 配置固定公网地址

接下来演示如何为其配置固定的HTTP公网地址,该地址不会变化,方便分享给别人长期查看你部署的项目,而无需每天重复修改服务器地址。

配置固定http端口地址需要将cpolar升级到专业版套餐或以上。

登录cpolar官网,点击左侧的预留,选择保留二级子域名,设置一个二级子域名名称,点击保留:

image-20250423155504574

保留成功后复制保留成功的二级子域名的名称:mybuse,大家也可以设置自己喜欢的名称。

image-20250423155536754

返回Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:buse,点击右侧的编辑:

image-20250423155631106

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名:mybuse

点击更新(注意,点击一次更新即可,不需要重复提交)

image-20250423155716162

更新完成后,打开在线隧道列表,此时可以看到公网地址已经发生变化,地址名称也变成了固定的二级子域名名称的域名:

image-20250423155818127

最后,我们使用上边任意一个固定的公网地址访问,可以看到访问成功,这样一个固定且永久不变的公网地址就设置好了,可以随时随地在公网环境异地在线访问本地部署的Browser-use WebUI来让AI帮你全自动处理问题了!

image-20250423160133841

总结

通过以上步骤,我们实现了在Windows系统电脑本地部署Browser-use WebUI,并结合cpolar内网穿透工具轻松实现在公网环境中使用浏览器远程使用AI自主处理问题,并为其配置固定不变的二级子域名公网地址的全部流程,经过简单测试,效果确实不错,同时降低了使用门槛,非常期待它后续的发展,也感谢您的观看,有任何问题欢迎留言交流。

这种技术组合解决了企业级自动化的核心痛点:它不是简单叠加功能模块,而是通过行为模拟与网络穿透方案协同构建了完整的执行链路。当Browser-Use的智能引擎与CPolar的远程访问能力结合时,在线任务自动化效率将实现质的飞跃——这正是数字化运营中的关键基础设施升级方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91739.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pycharm的设置过程

20250802 用于记录pycharm的设置过程 编辑器相关 python语言设置文件注释 在设置的编辑器部分,按照需求设置模板! 函数生成注释

GaussDB as的用法

通过使用 SQL,可以为表名称或列名称指定别名(Alias)。1 别名的作用SQL 别名用于为表或表中的列提供临时名称。 SQL 别名通常用于使列名更具可读性。 SQL 一个别名只存在于查询期间。 提高SQL执行效率与编写SQL代码效率。2 使用别名的场景在下…

Prim算法

一,prim算法逻辑1.理解:克鲁斯卡尔算法关注的是边,普里姆算法关注的是点把图中每个顶点比作孤岛,点亮一座孤岛就可以解锁附近的孤岛每次解锁的点都是离自身最近的点2.普里姆算法流程a.采用邻接矩阵表示,考虑要查找最小…

嵌入式学习之硬件——51单片机 1.0

一、基础知识1.什么是嵌入式?嵌入式以应用为中心,计算机技术为基础,软硬件可裁剪的专用计算机系统;2.嵌入式的应用?消费电子、无人驾驶、储能、新能源........3.嵌入式发展?(1)第一阶…

51c大模型~合集161

自己的原文哦~ https://blog.51cto.com/whaosoft/14079111 #这家国内公司,在给xx智能技术栈做「通解」 打通机器人智能化的关键:眼脑手。 xx智能(Embodied Intelligence)是 AI 领域里热度极高的赛道:给大模型…

Linux9 root密码修改

开机按e进入在linux行即quiet后面输入rd.break ctrlx进入内核输入mount -o remount,rw /sysrootchroot /sysrootpasswd root即可修改密码输入touch /.autorelabelexitexit等待即可

提示词增强工程(Prompt Enhancement Engineering)白皮书草稿

提示词增强工程(Prompt Enhancement Engineering)白皮书草稿 作者: 技术人进化社 Email:2819699195qq.com 日期: 2025年7月30日 1. 引言 随着大型语言模型(LLM)能力的飞速发展,如何高…

电路元器件

电流单位 电压 电阻单位 电阻的决定式 欧姆定律 交流电和直流电 交流电 串联电路 并联电路 在线模拟器 Circuitjs web 在线电路模拟器 下载

广泛分布于内侧内嗅皮层全层的速度细胞(speed cells)对NLP中的深层语义分析的积极影响和启示

速度细胞(Speed Cells)作为内侧内嗅皮层(MEC)的核心神经元,通过编码运动速度信息与网格细胞协同实现动态路径整合。这一神经机制为自然语言处理(NLP)的深层语义分析提供了以下关键启示和影响&am…

sql中的多表查询

在SQL中,多表查询用于从多个表中组合数据,常见的方法包括 ​连接查询(JOIN)​​ 和 ​子查询。以下是详细说明和示例:一、连接查询(JOIN)通过关联字段将多个表的数据合并,分为以下几…

Ruby 面向对象编程深入解析

Ruby 面向对象编程深入解析 引言 Ruby 作为一种动态、解释型、面向对象的语言,自1995年由日本程序员Yukihiro Matsumoto创造以来,凭借其简洁、灵活和强大的面向对象特性,在全球范围内获得了广泛的认可。本文将深入探讨Ruby的面向对象编程(OOP)特性,帮助读者更好地理解和…

Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现围栏羊驼的检测识别(C#代码,UI界面版)

Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现围栏羊驼的检测识别(C#代码,UI界面版)工业相机使用YoloV8模型实现围栏羊驼的检测识别工业相机通过YoloV8模型实现围栏羊驼的检测识别的技术背景在相机SDK中获取图像转换图像的代码分…

如何利用 rowid 在OceanBase 中处理大表时提效

本文作者:张瑞远,现主要从事电信级IT系统及数据库的规划设计、架构设计、运维实施、运维服务、故障处理、性能优化等工作,曾经从事银行、证券数仓设计、开发、优化类工作,持有Orale OCM,MySQL OCP及国产代表数据库认证。 获得包括…

【从0开始学习Java | 第4篇】类和对象

文章目录👏类和对象的概念什么是类?什么是对象?🥝构造方法如何创建一个对象?🥝对象内存布局完整应用 - 编写一个类:人,其具备年龄、性别、姓名等基础属性,并实例化一个人…

Synopsys:默认报告精度(report_default_significant_digits变量)

相关阅读 Synopsyshttps://blog.csdn.net/weixin_45791458/category_12812219.html?spm1001.2014.3001.5482 在使用report_timing之类的报告命令时,可以使用-significant_digits选项指定报告的精度,在不使用该选项的情况下,命令使用由repor…

2025年蓝桥杯青少图形化编程国考真题——摆放玩具

编程实现摆放玩具。(角色非源素材)摆放规则:在方格中摆放玩具,每个方格只能摆放一个,并且如果某个方格中已经摆放了玩具,那么与之上、下、左、右相邻的四个方格中无法再摆放同种玩具。具体要求1&#xff09…

Android 应用的安装流程

安装流程总览: 用户触发安装->系统验证APK的合法性->解析APK元数据->检查权限和存储空间->复制APK到目标位置->生成应用私有数据->注册组件到系统->安装完成 关键步骤: 1.用户触发安装:a.通过应用商店b.通过adb命令c.通…

基于 Amazon Bedrock 与 Anthropic Claude 3 智能文档处理方案:从扫描件提取到数据入库全流程实践

基于 Amazon Bedrock 与 Anthropic Claude 3 智能文档处理方案:从扫描件提取到数据入库全流程实践 文章目录基于 Amazon Bedrock 与 Anthropic Claude 3 智能文档处理方案:从扫描件提取到数据入库全流程实践方案架构前提准备:亚马逊云科技注册…

深入浅出设计模式——创建型模式之单例模式 Singleton

文章目录“天上天下,唯我独尊”——单例模式单例模式简介单例模式结构饿汉式懒汉式客户端示例运行结果单例模式总结构建型模式 Creational Patterns 小结 Summary代码仓库“天上天下,唯我独尊”——单例模式 你能在电脑上调出两个Windows任务管理器吗&a…

静电释放检测漏报率↓85%!陌讯多模态融合算法在电子厂ESD防护实战解析

​摘要​​ 基于边缘计算的静电释放(ESD)视觉检测方案,通过多模态融合技术显著提升复杂场景鲁棒性。实测显示:在电子元件装配线上,ESD事件检测mAP0.5达89.1%,较基线模型提升28.3%。一、行业痛点:ESD检测的隐形危机根据…