百度ocr的简单封装

百度ocr地址

以下代码为对百度ocr的简单封装,实际使用时推荐使用baidu-aip

百度通用ocr

import base64
from enum import Enum, unique
import requests
import logging as log@unique
class OcrType(Enum):# 标准版STANDARD_BASIC = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"# 标准版含位置STANDARD_WITH_LOCATION = "https://aip.baidubce.com/rest/2.0/ocr/v1/general"# 高精度版ACCURATE_BASIC = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic"# 高精度版含位置ACCURATE_WITH_LOCATION = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate"# 办公文档识别DOC_ANALYSiS_OFFICE = "https://aip.baidubce.com/rest/2.0/ocr/v1/doc_analysis_office"# 网络图片文字识别WEB_IMAGE = "https://aip.baidubce.com/rest/2.0/ocr/v1/webimage"# 网络图片文字识别 含位置WEB_IMAGE_WITH_LOCATION = "https://aip.baidubce.com/rest/2.0/ocr/v1/webimage_loc"# 手写文字识别HAND_WRITING = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting"# 数字识别NUMBERS = "https://aip.baidubce.com/rest/2.0/ocr/v1/numbers"# 表格文字识别(同步接口)FORM_SYNCH = "https://aip.baidubce.com/rest/2.0/ocr/v1/form"# 表格文字识别(异步接口)FORM_ASYNCH = "https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request"# 二维码识别QRCORD = "https://aip.baidubce.com/rest/2.0/ocr/v1/qrcode"def ocr_help():print("==========百度ocr使用说明==========")print("本API基于ocr通用识别api编写,官方文档地址:https://cloud.baidu.com/doc/OCR/s/zk3h7xz52")print("使用示例:")print('''baiduOcr = BaiduGeneralOcr(OcrType.STANDARD_BASIC)baiduOcr.set_access_token("access_token")wordsList = baiduOcr.recoginze(image="D:\\txt1.png",options={})['words_result']for word in wordsList:print(word)''')class BaiduGeneralOcr():# ocr版本ocr_type = 0def __init__(self, ocr_type: OcrType):"""ocr_type ocr识别类型 STANDARD_BASIC标准版 标准版含位置STANDARD_WITH_LOCATION 高精读版ACCURATE_BASIC 高精度版含位置ACCURATE_WITH_LOCATION@param ocr_type:"""self.options = Noneself.pdf_file = Noneself.url = Noneself.image = Noneself.access_token = Noneself.ocr_type = ocr_type.valuedef gen_access_token(self, api_key, secret_key):"""生成access_token@param api_key:@param secret_key:@return:"""request_url = f'''https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={api_key}&client_secret={secret_key}'''response = requests.get(request_url)if response:print("access_token:%s" %(response.json()['access_token']))self.access_token = response.json()['access_token']def __check(self):"""参数检查@return:"""image = self.imageurl = self.urlpdf_file = self.pdf_fileif (image is None or image == "") and (url is None or url == "") and (pdf_file is None or pdf_file == ""):raise ValueError("image,url,pdf_file至少传入一项")if (image is not None) and (image != ""):f = open(image, 'rb')self.options['image'] = base64.b64encode(f.read()).decode()elif (image is not None or image == "") and (url is not None and url != ""):self.options['url'] = urlelse:f = open(pdf_file, 'rb')self.options['pdf_file'] = base64.b64encode(f.read()).decode()keys = self.options.keys()if ("image" not in keys) and ("url" not in keys) and ("pdf_file" not in keys):raise ValueError("image,url,pdf_file至少传入一项")try:self.ocr_type.valueexcept Exception as e:log.info(repr(e))self.ocr_type = OcrType.STANDARD_BASIClog.info("ocr_type类型,已重置为标准版")def __request(self, request_url, data):# 设置headerheaders = {'content-type': 'application/x-www-form-urlencoded'}# 请求print(self.options)print(headers)return requests.post(request_url + "?access_token=%s" % self.access_token, data=self.options,headers=headers).json()def recoginze(self, image: str = None, url: str = None, pdf_file: str = None, options=None):"""识别@param image:@param url:@param pdf_file:@param options:@return:"""self.image = imageself.url = urlself.pdf_file = pdf_fileself.options = options or {}self.__check()# 发送请求return self.__request(self.ocr_type.value, options)def set_access_token(self, access_token):"""设置access_token@param access_token:@return:"""self.access_token = access_token

百度卡片识别ocr

import requests
import base64
import json
from cwrpa.log.log import logging as log
from enum import Enum, unique
import keyring@unique
class OcrType(Enum):# 身份证识别ID_CARD = "https://aip.baidubce.com/rest/2.0/ocr/v1/idcard"# 身份证混贴识别MULTI_IDCARD = "https://aip.baidubce.com/rest/2.0/ocr/v1/multi_idcard"# 身份证识别(金融加密版)IDCARD_ENC = "https://aip.baidubce.com/rest/2.0/ocr/v1/idcard_enc"# 银行卡识别BANKCARD = "https://aip.baidubce.com/rest/2.0/ocr/v1/bankcard"# 营业执照识别BUSINESS_LICENSE = "https://aip.baidubce.com/rest/2.0/ocr/v1/business_license"# 名片识别BUSINESS_CARD = "https://aip.baidubce.com/rest/2.0/ocr/v1/business_card"# 护照识别PASSPORT = "https://aip.baidubce.com/rest/2.0/ocr/v1/passport"# 社保卡识别SOCIAL_SECURITY_CARD = "https://aip.baidubce.com/rest/2.0/ocr/v1/social_security_card"# 港澳通行证识别HK_MACAU_EXITENTRYPERMIT = "https://aip.baidubce.com/rest/2.0/ocr/v1/HK_Macau_exitentrypermit"# 台湾通行证识别TAIWAN_EXITENTRYPERMIT = " https://aip.baidubce.com/rest/2.0/ocr/v1/taiwan_exitentrypermit"# 户口本识别HOUSEHOLD_REGISTER = "https://aip.baidubce.com/rest/2.0/ocr/v1/household_register"# 出生医学识别证明BITTH_CERTIFICATE = "https://aip.baidubce.com/rest/2.0/ocr/v1/birth_certificate"# 多卡证类别检测MULTI_CARD_CLASSIFY = "https://aip.baidubce.com/rest/2.0/ocr/v1/multi_card_classify"def ocr_help():print("==========百度ocr使用说明==========")print("本API基于ocr卡证识别api编写,官方文档地址:https://ai.baidu.com/ai-doc/OCR/rk3h7xzck")print("使用示例:")print('''baiduOcr = BaiduCardOcr(OcrType.ID_CARD)baiduOcr.set_access_token("access_token")wordsList = baiduOcr.recoginze(image="D:\\txt1.png",options={})['words_result']for word in wordsList:print(word)''')class BaiduCardOcr:# ocr版本ocr_type = 0def __init__(self, ocr_type: OcrType):"""ocr_type ocr识别类型 STANDARD_BASIC标准版 标准版含位置STANDARD_WITH_LOCATION 高精读版ACCURATE_BASIC 高精度版含位置ACCURATE_WITH_LOCATION@param ocr_type:"""self.options = Noneself.pdf_file = Noneself.url = Noneself.image = Noneself.access_token = Noneself.ocr_type = ocr_type.valuedef gen_access_token(self, api_key, secret_key):"""生成access_token@param api_key:@param secret_key:@return:"""request_url = f'''https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id={api_key}&client_secret={secret_key}'''response = requests.get(request_url)if response:self.access_token = response.json()['access_token']def __check(self):"""参数检查@return:"""image = self.imageurl = self.urlpdf_file = self.pdf_fileif (image is None or image == "") and (url is None or url == "") and (pdf_file is None or pdf_file == ""):raise ValueError("image,url,pdf_file至少传入一项")if (image is not None) and (image != ""):f = open(image, 'rb')self.options['image'] = base64.b64encode(f.read()).decode()elif (image is not None or image == "") and (url is not None and url != ""):self.options['url'] = urlelse:f = open(pdf_file, 'rb')self.options['pdf_file'] = base64.b64encode(f.read()).decode()keys = self.options.keys()if ("image" not in keys) and ("url" not in keys) and ("pdf_file" not in keys):raise ValueError("image,url,pdf_file至少传入一项")try:self.ocr_type.valueexcept Exception as e:log.info(repr(e))self.ocr_type = OcrType.STANDARD_BASIClog.info("ocr_type类型,已重置为标准版")def __request(self, request_url, data):# 设置headerheaders = {'content-type': 'application/x-www-form-urlencoded'}# 请求print(self.options)print(headers)return requests.post(request_url + "?access_token=%s" % self.access_token, data=self.options,headers=headers).json()def recoginze(self, image: str = None, url: str = None, pdf_file: str = None, options=None):"""识别@param image:@param url:@param pdf_file:@param options:@return:"""self.image = imageself.url = urlself.pdf_file = pdf_fileself.options = options or {}self.__check()# 发送请求return self.__request(self.ocr_type.value, options)def set_access_token(self, access_token):"""设置access_token@param access_token:@return:"""self.access_token = access_token

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/82698.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu20.04 gr-gsm完整安装教程

gr-gsm完整安装教程 安装gnuradio3.8安装依赖项指定gnuradio源安装gnuradio 安装gr-gsm安装依赖项安装gr-gsm修改环境变量 安装成功 安装gnuradio3.8 安装依赖项 sudo apt install git cmake g libboost-all-dev libgmp-dev swig python3-numpy python3-mako python3-sphinx …

(自用)Java学习-5.15(模糊搜索,收藏,购物车)

1. 模糊搜索商品功能 前端实现: 通过解析URL参数(如search联想)获取搜索关键字,发送AJAX GET请求到后端接口/product/searchGoodsMessage。 动态渲染搜索结果:若结果非空,循环遍历返回的商品数据&#xff…

STM32 TIM 定时器深度剖析:结构、时基、中断与应用开发(超形象详解)

文章目录 定时器(TIM)定时器种类与分布定时器的基本结构时基单元时基单元基本结构计数器计数方向时基单元时钟来源计算寄存器预加载机制 自制延时函数获取单片机当前时间实现延迟函数初始化定时器3的时基单元配置中断编写中断响应函数测试延迟函数 定时器…

Java使用minio上传整个目录下的所有内容

目录 1、添加相关配置 2、添加依赖 3、实现方法 1️⃣基础版: 2️⃣优化版(推荐使用): 3️⃣上传远程主机上的目录内容: 4️⃣直接上传远程主机中的目录内容 业务背景:需要需要minio进行上传指定目录下所有…

Python的分布式网络爬虫系统实现

1. 系统架构概述 一个典型的分布式网络爬虫系统通常包含以下几个核心组件: 1.主节点(Master Node): 任务调度:负责将抓取任务分配给各个工作节点。URL 管理:维护待抓取的 URL 队列和已抓取的 URL 集合&a…

AI工具的选择:Dify还是传统工具?

从纯技术视角出发,选择Dify还是传统开发工具需要基于六个核心维度进行理性决策。以下为结构化分析框架,附典型场景示例: 1. 开发效率 vs 控制力权衡矩阵 维度Dify优势场景传统工具优势场景迭代速度需求明确的标准CRUD(如后台管理…

2.3 TypeScript 非空断言操作符(后缀 !)详解

在 TypeScript 中,当你开启了严格的空值检查(strictNullChecks)后,变量如果可能是 null 或 undefined,就必须在使用前进行显式的判断。为了在某些场景下简化代码,TypeScript 提供了非空断言操作符&#xff…

深度学习:损失函数与激活函数全解析

目录 深度学习中常见的损失函数和激活函数详解引言一、损失函数详解1.1 损失函数的作用与分类1.2 回归任务损失函数1.2.1 均方误差(MSE)1.2.2 平均绝对误差(MAE) 1.3 分类任务损失函数1.3.1 交叉熵损失(Cross-Entropy&…

掌握 npm 核心操作:从安装到管理依赖的完整指南

图为开发者正在终端操作npm命令,图片来源:Unsplash 作为 Node.js 生态的基石,npm(Node Package Manager)是每位开发者必须精通的工具。每天有超过 1700 万个项目通过 npm 共享代码,其重要性不言而喻。本文…

Elasticsearch的运维

Elasticsearch 运维工作详解:从基础保障到性能优化 Elasticsearch(简称 ES)作为分布式搜索和分析引擎,其运维工作需要兼顾集群稳定性、性能效率及数据安全。以下从核心运维模块展开说明,结合实践场景提供可落地的方案…

国产三维CAD皇冠CAD(CrownCAD)建模教程:汽车电池

在线解读『汽车电池』的三维建模流程,讲解3D草图、保存实体、拉伸凸台/基体、设置外观等操作技巧,一起和皇冠CAD(CrownCAD)学习制作步骤吧! 汽车电池(通常指铅酸蓄电池或锂离子电池)是车辆电气系…

深入理解 JDK、JRE 和 JVM 的区别

在 Java 中,JDK、JRE 和 JVM 是非常重要的概念,它们各自扮演着不同的角色,却又紧密相连。今天,就让我们来详细探讨一下它们之间的区别。 一、JVM JVM 即 Java 虚拟机,它是整个 Java 技术体系的核心。JVM 提供了 Java…

云电脑显卡性能终极对决:ToDesk云电脑/顺网云/海马云,谁才是4K游戏之王?

一、引言 1.1 云电脑的算力革命 云电脑与传统PC的算力供给差异 传统PC的算力构建依赖用户一次性配置本地硬件,特别是CPU与显卡(GPU)。而在高性能计算和游戏图形渲染等任务中,GPU的能力往往成为决定体验上限的核心因素。随着游戏分…

撤销Conda初始化

在安装miniconda3的过程中,最后系统会出现这一行提示用户可以选择自动初始化,这样的话,系统每次启动就会自动启动基础(base)环境。 但是我们也可以通过 conda init --reverse $shell 来撤销 Conda 的初始化设置。这将恢…

Flask-SQLAlchemy数据库查询:query

1、为什么可以用 模型类.query 来查询数据库? 在 Flask 中使用 SQLAlchemy ORM 时,所有继承自 db.Model 的模型类都会自动获得一个 query 属性。 其本质是 db.session.query(模型类) 的快捷方式,无需显式操作 db.session。 代码示例&#…

【免费】【无需登录/关注】度分秒转换在线工具

UVE Toolbox 功能概述 这是一个用于地理坐标转换的在线工具,支持两种转换模式: 十进制度 → 度分秒 度分秒 → 十进制度 使用方法 十进制度转度分秒 在"经度"输入框中输入十进制度格式的经度值(例如:121.46694&am…

怎么判断一个Android APP使用了React Native 这个跨端框架

要判断一个 Android 应用是否使用了 React Native 框架,可以通过以下方法逐步验证: 一、安装包结构分析 1. 解压 APK 将 .apk 文件重命名为 .zip 并解压,检查以下特征文件: • assets/index.android.bundle: React Na…

Pluto实验报告——基于2ASK的简易的通信系统

一、实验目的 1. 熟悉并掌握PLUTO SDR 主动学习模块的使用; 2.通过matlab 编码与adalm pluto 相配合达成一个简易的通信系统,并能 够传输一些较为简单的信息。 二、实验原理 2ASK 调制原理: 振幅键控是指利用载波的振幅变化来传递数字基带信…

Ubuntu 24-部署FTP和自定义用户

目录 一、 安装 vsftpd 二、创建 FTP 数据目录 三、创建 FTP 用户 四、配置 vsftpd 五、重启 vsftpd 服务 六、增加新用户脚本 一、 安装 vsftpd sudo apt update sudo apt install vsftpd -y 二、创建 FTP 数据目录 sudo mkdir -p /data/ftp sudo chown nobody:nogrou…

MySQL问题:什么是MySQL的中的最左匹配原则?

是指在复合索引中,查询条件需要按照索引列的顺序从最左侧列开始依次匹配。只有查询条件中的列按照索引的最左边列开始进行匹配,索引才能被有效使用,但有时虽然不是正常顺序,由于MySQL中存在优化器,会自动调整顺序&…