ONLYOFFICE深度解锁系列.10-如何识别图像和PDF扫描件中的文本?用ONLYOFFICE的AI OCR轻松搞定!

ONLYOFFICE 文档版本 9.0带来多项 AI 关键改进,显著提升您处理电子表格和 PDF 文件的工作效率。本指南将重点介绍新增的 OCR 功能,并讲解如何在 PDF 编辑器中利用 AI 助手将图像转为可编辑文本。

什么是 OCR 文字识别?

OCR 技术能够扫描各类文档、图像和 PDF 文件,并将其转换为可编辑、可搜索的数据。

在 ONLYOFFICE 中,OCR 功能由 AI 技术驱动,支持通过 AI 助手在数秒内将图像转为文本。该功能适用于文本文档、电子表格、演示文稿及 PDF 文件。下面介绍在 PDF 中启用 OCR 功能的步骤。 

下面介绍在 PDF 中启用 OCR 功能的步骤。

选择合适的 ONLYOFFICE 解决方案

首先,根据您的需求选择合适的 ONLYOFFICE 解决方案:

  • 在您的 Windows 或 Linux 服务器上部署 ONLYOFFICE 文档,并集成到您选择的平台(如 Nextcloud、ownCloud、Redmine、Moodle、Alfresco、Jira、SuiteCRM、Seafile 等,现成连接器超 40 种),打造安全的协作环境。对于无需手动安装配置的用户,也提供云端版 ONLYOFFICE 文档。
  • 创建免费的 ONLYOFFICE 协作空间账户,它是一个基于房间的文档协作平台。
  • 在 Windows、Linux 或 macOS 电脑上安装 ONLYOFFICE 桌面编辑器,免费享受离线文档编辑。

以上所有方案均含有强大的 ONLYOFFICE PDF 编辑器,支持编辑现有文本、添加文本框、插入和修改视觉对象、添加各类交互字段、批注绘图、管理页面等操作。

在 ONLYOFFICE PDF 编辑器中,安装配置 AI 插件后便可启用 OCR 功能。以下是具体操作流程。

启用 AI 集成

要在 PDF 中运行 OCR,需通过 AI 插件添加支持 OCR 的 AI 模型。该插件兼容众多主流工具,如  DeepSeek、Ollama、通义千问 、 Kimi 、ChatGPT、Google Gemini、Claude Sonnet、Mistral、Groq、GPT4All、xAI、Stability AI 等。
本文我们使用 Mistral 进行演示,您可以选择任何支持 OCR 的模型。

下面是在 ONLYOFFICE PDF 编辑器中安装配置的步骤:

步骤 1. 安装 AI 插件

打开 PDF 文件,通过插件选项卡上的插件管理器访问插件市场。找到 AI 插件并点击相应按钮安装。

图片

步骤 2. 启用 AI 插件

插件管理器旁的后台插件区域,点击 AI 插件按钮以激活。顶部工具栏将出现新的 AI 选项卡。

图片

步骤 3. 添加支持 OCR 的 AI 模型

切换到 AI 选项卡,点击设置图标。在 AI 配置菜单中,可为不同任务添加和选择 AI 模型。

图片

点击编辑 AI 模型添加新模型。在 AI 模型列表菜单中,可随时增删模型。

图片

点击 + 按钮,在名称字段的下拉列表中选择一个提供商(如示例中的 Mistral,也可选其他)。

图片

选择提供商后,系统会自动设置对应的 URL 参数。您只需在密钥字段输入有效的 API 密钥(可从提供商官网获取)。

注意:部分提供商不免费提供 API 密钥,可能需要购买。强烈建议在使用其 AI 模型前查阅其政策和使用条款。

图片

模型下拉列表中选择一个模型(若无选项可点击更新模型列表)。请注意,不同模型擅长的任务不同(例如,某些擅长文本生成但不支持图像文字识别)。建议选择专为 OCR 设计的模型(具体功能请参考提供商网站说明)。

可在模型名称字段重命名添加的模型。关键步骤:在使用模型部分,必须勾选视觉分析选项,否则无法用于 OCR。若您的模型支持 OCR 但未默认勾选,请手动勾选。完成后点击确定

图片

步骤 4. 分配 OCR 任务

成功添加模型后,返回 AI 模型列表菜单。点击返回按钮进入 AI 配置窗口,将您的模型设为 OCR 任务的默认选项。点击确定完成配置。

图片

OCR 功能已准备就绪,可在 AI 选项卡访问该功能。若 OCR 图标为灰色,只需从默认的批注模式切换到编辑模式即可(因为批注模式不支持文字识别)。点击 AI 选项卡上的编辑 PDF 按钮,或在界面右上角选择编辑模式均可。

图片

如何将图像转换为文本

配置好 AI 模型后,点击 AI 选项卡上的 OCR 文字识别 按钮,即可轻松将 PDF 中的图像转为可编辑文本。AI 助手会识别图像文字并插入同一页面。随后,您可使用 ONLYOFFICE PDF 编辑器丰富的工具进行编辑:选择多样字体、调整大小颜色、创建列表、对齐文本、插入修改对象等。

福利推荐-软件获取方法

        豆容器市场专注提供优质Docker应用服务,集成一键式容器安装功能,助力用户快速部署OnlyOffice、协作空间、Nextcloud、可道云等办公应用。平台新增IPv6内网直连技术,搭配自动化SSL证书配置及智能域名解析功能,为家庭云服务提供完整技术方案,简化私有云搭建与运维流程,轻松实现高效云端协作管理。

        onlyoffice已经支持ARM和x86双模式安装,其他软件同步支持中。

        地址: https://ds.sendtokindle.net.cn/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/89033.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/89033.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单例模式详解:确保一个类只有一个实例

在软件开发中,设计模式是解决常见问题的经典方案。单例模式(Singleton Pattern)作为创建型设计模式中最简单也最常用的一种,确保一个类只有一个实例,并提供一个全局访问点。本文将全面探讨单例模式的概念、多种实现方式…

Appdynamic 配置 PostgreSQL 收集器

配置 PostgreSQL 收集器 您可以使用数据库可见性监控任何版本的 PostgreSQL。 连接详细信息 部分场地描述创建新的收集器数据库类型您想要监控的数据库类型。代理人管理收集器的数据库代理。收藏家姓名您想要用来识别收集器的名称。连接详细信息主机名或 IP 地址运行数据库的机…

其他常见 HTTP 方法

除了最常用的四种方法(GET、POST、PUT、DELETE),HTTP 协议还定义了一些较少使用但非常有用的请求方法,常用于调试、部分更新、跨域预检等场景。1. HEAD 方法:获取响应头 特点: 用途:与 GET 类似…

Web应用防火墙(WAF)技术

目录 一:简介 1.1 Web安全现状 1.2 传统防御的局限性 二:Web应用防火墙技术解析 2.1 WAF核心架构 2.2 关键技术特性 三:WAF必要性 3.1 典型防护场景 3.2 与传统方案对比 四:进阶防护方案 4.1 智能WAF架构 4.2 关键技术…

机器学习之线性回归(七)

机器学习之线性回归(七) 文章目录机器学习之线性回归(七)一、线性回归线性回归超全指南:从“一条直线”到“正则化调参”的完整旅程0. 先对齐语言:标称型 vs 连续型1. 问题形式化2. 损失函数全景3. 求解方法…

基于开源AI大模型、AI智能名片与S2B2C商城小程序源码的用户价值引导与核心用户沉淀策略研究

摘要:在数字化商业生态中,用户留存与核心用户培育是产品成功的关键。本文聚焦开源AI大模型、AI智能名片与S2B2C商城小程序源码的协同应用,探讨如何通过技术赋能实现用户价值引导与核心用户沉淀。研究结合工业品供应链、美妆品牌、健康食品行业…

课题申报书成功率提升85%!借助大模型AI精准选题、搭综述框架及提炼创新点(附实操AI提示词)

大家好,感谢关注。我是七哥,一个在高校里不务正业,折腾用大模型AI实操的学术人。可以添加七哥(qige500)交流学术写作或ChatGPT、Claude等学术大模型AI领域相关问题,多多交流,相互成就,共同进步。 写一份高质量的课题申报书往往面临许多困难,对很多同仁来说,难就难在…

Spring之【写一个简单的IOC容器EasySpring】

目录 EasySpring 注解 EasyAutowired EasyComponent EasyComponentScan EasyLazy EasyPostConstruct EasyProtoType EasyValue Bean定义信息 EasyBeanDefinition 管理Bean定义信息 EasyBeanDefinitionRegister Aware EasyAware EasyBeanFactoryAware EasyBea…

Selenium动态网页爬虫编写与解释

使用Selenium来抓取动态网页。动态网页通常是指那些通过JavaScript动态加载内容的网页,这些内容在初始HTML中并不存在,因此使用传统的requests库无法获取到这些动态生成的内容。Selenium可以模拟浏览器行为,等待JavaScript执行并渲染页面&…

element el-table中使用el-image图片预览被其他表格遮挡

或者::v-deep .el-table__cell {position: static !important;}

MyBatis与Spring整合优化实战指南:从配置到性能调优

一、SqlSessionFactory配置最佳实践 1.1 数据源配置优化 <!-- Spring配置示例 --> <bean id"dataSource" class"com.zaxxer.hikari.HikariDataSource" destroy-method"close"><property name"driverClassName" value&q…

LUA(初学)

条件语句if if then endlocal a 2 if a < 6 thenprint(a) end2条件语句if else if then else endlocal a 2 local b 3 if a > 6 thenprint(a) elseprint(b) end3while循环语句 while do endlocal a 2 while a < 5 doa a 1print(a) end3 4 5for循环语句 for do …

JMeter 连接与配置 ClickHouse 数据库

其他人都需要好几十积分提供jar包&#xff0c;我5积分提供给大家 jar包地址&#xff1a;https://download.csdn.net/download/weixin_41853064/91370401 1、将jar包内的文件放入jmeter/lib/exc目录并重启jmeter 2、配置jmeter JDBC连接 3、复制 click hourse的类名&#xff1…

Kmeams聚类算法详解

文章目录一、聚类任务的简介1.1 聚类的核心特征1.2 聚类的典型应用场景二、Kmeans的思想和数学原理2.1 核心思想2.2 数学原理三、Kmeans计算过程示例3.1 数据集3.2 步骤1&#xff1a;确定K值并初始化簇中心3.3 步骤2&#xff1a;计算样本到簇中心的距离并分配簇3.4 步骤3&#…

平升智慧水务整体解决方案,大数据驱动的智慧水务,让城市供水更智能

平升电子智慧水务整体解决方案 智慧供水整体解决方案&#xff0c;在调度中心搭建智慧水务平台&#xff0c;为供水各环节安装智能测控设备&#xff0c;应用物联网、互联网、大数据、云计算、人工智能等新一代信息技术&#xff0c;构建智慧水务综合管理系统&#xff0c;贯穿从水源…

Samba配置使用

主要作用&#xff1a;将Linux系统中的文件共享给windows配置过程&#xff1a;&#xff08;1&#xff09;打开命令终端&#xff1a;获取超级用户权限后运行以下指令:apt-get install samba&#xff08;2&#xff09;修改samba配置文件&#xff1a;gedit /etc/samba/smb.conf :找…

Datawhale AI数据分析 笔记

Part1&#xff1a;数据分析入门--信息统计知识点&#xff1a;什么是提示词&#xff08;Prompt&#xff09;&#xff1f;在人工智能&#xff08;AI&#xff09;领域&#xff0c;"提示词"是一个关键概念&#xff0c;它指的是输入给AI模型的文本或指令&#xff0c;用于引…

JAVA青企码协会模式系统源码支持微信公众号+微信小程序+H5+APP

Java青企码协会系统源码&#xff1a;构建全渠道数字化管理平台&#xff08;多端融合精准服务&#xff09;在政策红利与数字化转型的双重驱动下&#xff0c;青年企业协会正面临资源对接低效、会员粘性不足、跨域协同困难等痛点。基于Java技术栈的青企码协会系统&#xff0c;通过…

Python 中调用阿里云 OCR(Optical Character Recognition,光学字符识别)服务

在 Python 中调用阿里云 OCR&#xff08;Optical Character Recognition&#xff0c;光学字符识别&#xff09;服务&#xff0c;通常需要使用阿里云的 SDK。OCR 服务属于阿里云“视觉智能&#xff08;Vision Intelligence&#xff09;”产品线的一部分&#xff0c;调用时需通过…

网络基础协议综合实验

本文结合所学的一些基础网络协议来完成一个综合性的实验&#xff08;实验完整代码放在最后&#xff09;会先说明使用协议的原理&#xff0c;然后分析具体在拓补图中的应用过程&#xff0c;最后再给出配置明确实验目标&#xff1a;拓扑分 核心层&#xff08;R1&#xff09;、汇聚…