Umi-OCR:Windows7和Linux上可免费离线使用的OCR应用!

工具介绍

Umi-OCR 是一款免费、开源的离线OCR软件,主要由作者 hiroi-sora 用业余时间在开发和维护。
Umi-OCR 内置多国语言库,支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚以及二维码的扫描/生成。

适用平台:Windows7 x64Linux x64

Umi-OCR 具有以下核心优势和特色功能👇

  • 免费:本项目所有代码开源,完全免费
  • 方便:解压即用,离线运行,无需网络
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库
  • 灵活:支持命令行、HTTP接口等外部调用方式
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

Linux x64 部署

Linux x64 部署教程(可以基于Docker部署)请参考:https://github.com/hiroi-sora/Umi-OCR_runtime_linux

Linux x64 已通过作者测试的系统:
👉 主机部署:Ubuntu 22.04 / Debian 12.5 / Kali 2023.3
👉 Docker 部署:CentOS 7

主机部署

Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)

SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b

首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。

Docker部署

请按照文档提供的步骤进行:https://github.com/hiroi-sora/Umi-OCR_runtime_linux/blob/main/README-docker.md

Windows7 x64 部署

不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

一、Paddle 引擎插件版
特点:性能好,速度快,占用率高,适合高配机器(不兼容奔腾、赛扬、凌动CPU)
⚠️重要提示:如果执行OCR时报错 0xc0000142、[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本

Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)

SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2

二、Rapid 引擎插件版
特点:速度稍慢,内存占用低,适合低配机器,兼容性好

Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)

SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722

更多下载途径: 蓝奏云 | SourceForge | Scoop

比如通过SourceForge,选择Paddle 引擎插件版进行.exe文件的下载。
在这里插入图片描述

功能使用

中文用户可以在应用安装成功之后,在「全局设置」中将默认的英文语言修改为中文。
在这里插入图片描述
在「功能页」,我们可以看到应用提供的核心功能。
在这里插入图片描述
我们试试截图OCR的效果吧~
截图可以通过拖入和粘贴这两种方式进行导入,我这边选择了一篇wechat公众号文章(谷歌AI掌门人亲述:十年内终结疾病?揭秘99%人不知道的AI革命真相‌)里带文字的一张图片:
在这里插入图片描述
除了最上方花式字体的双引号识别成了“GG”,其他英文识别还是没有问题的。
在这里插入图片描述
识别完成后,我们可以全选OCR识别出来的文字内容进行复制。
在这里插入图片描述

使用感受分享

不知道是不是我的打开方式不对,虽然简单测试下的效果还不错,但整体使用感受并不不算特别丝滑~总觉得卡卡的,可能是运行的服务器性能不够?
Anyway,作者利用自己的业余时间开发维护这样一个可以本地离线使用的OCR软件并开源分享给大家已经很棒啦~有需要的朋友可以下载尝试看看!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/921922.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/921922.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

30 分钟让 AI 开口查订单:React-Native + Coze 全链路语音对话落地指南

一、前言:为什么你需要“可说话、能查库”的 AI? 聊天机器人在 2025 已不新鲜,但**“张嘴就能查询私有业务数据”**的端到端方案依然踩坑无数: ASR/TTS 选型多、SDK 难对齐大模型与内部 API 安全打通RN 端流式渲染 音频播放并发…

玄机--应急响应--webshell查杀

靶场连接1.黑客webshell里面的flag flag{xxxxx-xxxx-xxxx-xxxx-xxxx}使用命令查找特殊文件//搜索目录下适配当前应用的网页文件,查看内容是否有Webshell特征 find ./ type f -name "*.jsp" -exec grep -l "exec(" {} \; find ./ type f -name &…

Nodejs读取目录下面的文件

需求:给定一个目录,读取该目录下面的所有文件,包括该目录下面文件夹里面的子文件,子子文件......const fs require(fs);const path require(path);// 指定要遍历的目录const directoryPath D:\\;//调用函数入口处readDir(direc…

PPTist,一个完全免费的 AI 生成 PPT 在线网站

PPTist,一个完全免费的 AI 生成 PPT 在线网站 PPTist 是一个完全免费的 AI 生成 PPT 在线网站、PPT 在线演示网站、PPT 在线编辑网站。 它完全免费,无需登录注册,支持 AI 生成 PPT 功能,可以一句话生成 PPT ,支持输入…

C++中操作重载与类型转换

文章目录基本概念调用选择作为成员还是非成员输入和输出运算符算术和关系运算符相等和不等运算符赋值运算符下标运算符递增和递减运算符成员访问运算符函数调用运算符lambda是函数对象标准库定义的函数对象可调用对象与function重载、类型转换与运算符类型转换运算符避免有二义…

Java学习之——“IO流“的进阶流之转换流的学习

在博主的上一篇博文中,详细的介绍了“IO”流中最基本的一些知识,包括基本的常见的字节流和字符流,以及对应的缓冲流,对于“IO”流基础知识相对薄弱的同学可以先去看博主的上一篇博文Java学习之——万字详解“IO流”中基本的字节流…

PMP考试结构、学习框架与基本术语

一、PMP考试整体结构 考试基本信息 考试形式:纸笔考试(中国大陆地区)考试时长:230分钟(约4小时)题目数量:180道题 170道单选题(四选一)10道多选题包含5道非计分的试验题…

浅谈前端框架

在 Web 开发的演进过程中,前端框架扮演着越来越重要的角色。从早期的 jQuery 到如今的 React、Vue、Svelte 等,前端开发模式发生了翻天覆地的变化。本文将从前端框架的定义、核心特性、分类以及主流框架的差异等方面,带你深入理解前端框架。 …

10.3 马尔可夫矩阵、人口和经济

本节内容是关于正矩阵(postive matrices): 每个元素 aij>0a_{ij}>0aij​>0,它核心的结论是:最大的特征值为正实数,其对应的特征向量也是如此。 在经济学、生态学、人口动力系统和随机游走过程中都…

python学习进阶之面向对象(二)

文章目录 1.面向对象编程介绍 2.面向对象基本语法 3.面向对象的三大特征 4.面向对象其他语法 1.面向对象编程介绍 1.1 基本概念 概念:面向对象编程(Object-Oriented Programming, OOP)是一种流行的编程范式,它以"对象"为核心组织代码和数据 在面向对象的世界里: …

VS+QT的编程开发工作:关于QT VS tools的使用 qt的官方帮助

加粗样式 最近的工作用到VS2022QT5.9.9/QT5.12.9,在查找相关资料的时候,发现Qt 官方的资料还是很不错的,特记录下来,要记得抽时间学习下。 Add Qt versions https://doc.qt.io/qtvstools/qtvstools-how-to-add-qt-versions.html B…

【系统分析师】第21章-论文:系统分析师论文写作要点(核心总结)

更多内容请见: 备考系统分析师-专栏介绍和目录 文章目录 一、写作注意事项:构建论文的合规性与专业性 1.1 加强学习 1.2 平时积累 1.3 提高打字速度 1.4 以不变应万变 二、试题解答方法:结构化应对策略 2.1 试题类型分析 2.2 三段式答题框架 2.3 时间分配 三、论文写作方法:…

tailwindcss 究竟比 unocss 快多少?

tailwindcss 究竟比 unocss 快多少? 前言 大家好,我是去年一篇测评 《unocss 究竟比 tailwindcss 快多少?》 的作者 icebreaker。 一晃到了 2025 年,tailwindcss4 也正式发布了,现在最新版本是 4.1.13。 新版本不仅…

算法练习——55.跳跃游戏

1.题目描述给你一个非负整数数组 nums ,你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标,如果可以,返回 true ;否则,返回 false 。示例 1&#xff…

Django 项目6:表单与认证系统

目录 1、form 表单 2、session 保存状态 3、Admin 后台 4、Auth 系统 1、form 表单 (1)创建 form.py 文件,并完善 from django import forms# 定义一个表单类 class Register(forms.Form):user forms.CharField(max_length30, label用…

tvm/triton/tensorrt比较

1.tvm的主线感觉更新太慢,文档太落后,在自动驾驶领域不支持Blackwell平台,跨平台其实吹牛的更多。我觉得自动驾驶用不起来。2.性能最快的还是tensorrt/tensorrt_llm这条路,纯cuda路线面临大量cuda算子开发,比如vllm ll…

Transform 和BERT、GPT 模型

目录 Transform的由来 Seq2seq 模型 Transform 的内部结构 语言模型 BERT 介绍 BERT 模型的组成 分词器 位置编码 Softmax 残差结构 BERT 模型总结 Transform的由来 传统的语⾔模型,⽐如RNN(循环神经⽹络),就像⼀个“短…

2025高教社国赛数学建模A题参考论文35页(含代码和模型)

2025国赛数学建模竞赛A题完整参考论文 目录 摘要 1 问题背景与重述 2 问题分析 2.1 问题一分析 2.2 问题二分析 2.3 问题三分析 2.4 问题四分析 2.5 问题五分析 3 符号说明 4 模型假设 5 模型建立与求解 5.1 问题一 烟幕有效遮蔽时长…

【Linux】常用命令汇总

【Linux】常用命令【一】tar命令【1】可用参数【2】常用案例(1)创建归档(打包)(2)查看归档内容:​​(3)解包归档 (提取):​​【二】日志查看命令【1】基础命令…

软考系统架构设计师之软件系统建模

一、软件系统建模 系统建模流程包括如下: 二、人机交互设计 黄金三法则: 1、置于用户控制之下以不强迫用户进入不必要的或不希望的动作的方式来定义交互方式 提供灵活的交互 允许用户交互可以被中断和撤销 当技能级别增加时可以使交互流水化并允许定制交…