前置博客:Ubuntu-Server 22.04.4 详细安装图文教程
wget命令在windows终端下不能使用的原因及解决办法
在 Ubuntu 22.04 LTS 上离线安装 Docker
手把手教你在Win11下安装docker
Umi-OCR
安装docker时报错:workstation服务启动报错。错误1075:依存服务不存在, 或已标记为删除的解决方法
完整部署流程
第一步:在 Windows 上构建/获取 Umi-OCR Docker 镜像
方式一:直接构建镜像
# 下载 Dockerfile
wget https://raw.githubusercontent.com/hiroi-sora/Umi-OCR_runtime_linux/main/Dockerfile# 构建镜像
docker build -t umi-ocr-paddle .
第二步:在 Windows 上测试运行
测试无头模式(HEADLESS 模式),适合在没有显示器的云服务器使用:
# 无头模式运行,提供 HTTP 接口服务
docker run -d --name umi-ocr-test \-e HEADLESS=true \-p 1224:1224 \umi-ocr-paddle
第三步:导出 Docker 镜像
使用 docker save 命令将镜像保存为 tar 文件,这样可以保留镜像的所有历史层和元数据:
# 导出镜像为 tar 文件
docker save -o umi-ocr-paddle.tar umi-ocr-paddle# 或者压缩导出以减小文件大小
docker save umi-ocr-paddle | gzip > umi-ocr-paddle.tar.gz
第四步:将镜像文件传输到 Ubuntu Server
# 使用 scp 传输到目标服务器
scp umi-ocr-paddle.tar.gz user@ubuntu-server-ip:/home/user/# 或者使用 U盘、移动硬盘等物理方式传输
第五步:在 Ubuntu Server 22.04 上导入和运行
导入镜像
使用 docker load 命令从 tar 文件恢复镜像:
# 导入压缩的镜像文件
docker load -i umi-ocr-paddle.tar.gz# 或者导入未压缩的
docker load -i umi-ocr-paddle.tar# 验证镜像导入成功
docker images
运行容器(端口 21224)
配置为无头模式并映射到指定端口:
# 在 21224 端口运行 Umi-OCR
docker run -d --name umi-ocr-server \-e HEADLESS=true \-p 21224:1224 \umi-ocr-paddle# 检查容器运行状态
docker ps# 暂停
docker stop umi-ocr-test
第六步:配置和测试
测试 HTTP 接口
可以通过 HTTP 接口访问 OCR 服务:
# 测试接口是否正常
curl -X POST http://localhost:21224/api/ocr \-H "Content-Type: application/json" \-d '{"base64": "your_base64_encoded_image"}'
持久化配置(可选)
# 挂载配置目录以持久化设置
docker run -d --name umi-ocr-server \-e HEADLESS=true \-p 21224:1224 \-v /opt/umi-ocr-data:/app/UmiOCR-data \umi-ocr-paddle
重要注意事项
CPU 兼容性检查
部署前,请检查主机的CPU是否具有AVX指令集:
# 检查 CPU 是否支持 AVX
cat /proc/cpuinfo | grep avx
防火墙配置
# Ubuntu Server 上开放 21224 端口
sudo ufw allow
sudo ufw reload
自动启动配置
# 设置容器自动重启
docker update --restart=always umi-ocr-server
故障排除
- 如果容器启动失败:检查 CPU 是否支持 AVX 指令集
- 端口访问问题:确认防火墙设置和端口映射
- 内存不足:可以选择 Rapid 版本,内存占用更低,适合低配机器
这样就完成了从 Windows 到离线 Ubuntu Server 的完整迁移部署,Umi-OCR 将在 21224 端口提供 HTTP OCR 服务。