华为云 Flexus+DeepSeek 征文|增值税发票智能提取小工具:基于大模型的自动化信息解析实践

华为云 Flexus+DeepSeek 征文|增值税发票智能提取小工具:基于大模型的自动化信息解析实践

前言背景

在这里插入图片描述

企业财务处理中,增值税发票信息手动提取存在效率低、易出错等痛点,华为云 Flexus 弹性算力联合 DeepSeek 大模型,通过 CCE 集群部署 Dify 平台,构建发票上传 - 文本解析 - 信息提取自动化工作流,可精准识别发票代码、金额等关键数据并输出结构化 JSON,助力企业提升财务处理效率,降低人工成本

前提准备
Step.1 华为账号注册登录

1、华为云官网登录

在这里插入图片描述

Step.2 华为云单机部署流程

华为云 Flexus+DeepSeek 实战:华为云单机部署 Dify-LLM 开发平台全流程指南【服务部署、模型配置、知识库构建全流程】

查看链接

✅上面链接文章是本文的操作前提,包含了华为云单机部署 Dify - LLM 开发平台全流程,涵盖 ModelArts Studio 大模型开通、Dify 平台单机与模型供应商配置,还有高质量知识库配置(含 Embedding 及 Rerank 模型部署、相关供应商配置等),以及资源删除销毁,大家需要根据链接完成前提部署再进行本文的操作流程哈

智能体工作流搭建配置

1、智能体工作流信息创建配置

在这里插入图片描述

2、工作流创建配置

在这里插入图片描述

3、开始节点配置

在这里插入图片描述

在这里插入图片描述

4、文档提取器节点配置

  • 输入:接收 “开始” 节点的 sys.files(即上传的发票文件,支持 pdf、docx 等多格式 ),作为提取内容的来源。
  • 功能:解析文件文本信息,输出给后续 “LLM(DeepSeek - R1 模型 )” 节点,让 AI 基于提取的内容识别发票关键数据(如金额、税额等 ),是从 “文件上传” 到 “智能识别” 的核心转换环节 。

在这里插入图片描述

5、大模型配置

  • 模型:选用 DeepSeek-R1,用于处理发票提取任务。
  • 输入:接收 “文档提取器” 解析的发票文件内容(file 关联的文件信息 )。
  • 系统指令(SYSTEM):要求提取发票关键信息(如机器编号、发票代码等 ),并以 JSON 格式输出,明确模型处理发票内容的规则,是智能识别发票数据的核心环节 。
  • USER 输入:关联 “开始” 节点的 sys.query,即把用户输入的查询内容作为该模块的用户侧输入,用于流程中结合历史或上下文信息处理,是构建对话 / 任务上下文关联的配置项 。

在这里插入图片描述

# 角色
你是一个专业的发票信息提取助手,能够从增值税发票中精准地解析并提取所需的信息,然后将这些信息按照指定的JSON格式进行输出。## 技能
### 技能 1: 解析发票
1. 接收并识别增值税发票的图像或文本信息。
2. 根据规则说明,准确提取出所有必要的字段信息。### 技能 2: 数据校验
1. 确保提取的数据符合格式要求,如字段名称与示例完全一致,包括标点和空格。
2. 对金额、日期等关键信息进行校验,确保其严格按票面信息提取。### 技能 3: JSON格式化
1. 将提取的数据按照指定的JSON结构进行组织。
2. 确保所有字段的值正确无误,如无对应信息则填入空字符串。### 技能 4: 精准识别
1. 仔细匹配发票上的文字信息,确保每个字段的提取精准无误。
2. 对于票面上直接显示的税率、税额等信息直接取值,对于需要计算的则按照票面的计算逻辑进行处理。## 限制
- 提取信息时必须严格依据票面内容,不能自行推测或填写不存在的字段。
- 输出内容必须符合规定的JSON格式,不能有任何偏差。
- 对于所有字段的提取,若无对应信息,则必须填写空字符串,不得留白或填写其它默认值。

6、结束节点

  • 功能:接收 LLM 节点输出的 text(即发票提取结果 ),作为最终回复内容输出给用户。
  • 流程定位:是工作流收尾环节,把 AI 处理后的发票信息(如金额、税额等关键数据 ),通过该节点反馈,完成 “上传发票→提取信息→回复结果” 的完整流程 。

在这里插入图片描述

工作流测试与预览

1、准备需要提取的发票

在这里插入图片描述

2、上传至Dify平台

在这里插入图片描述

3、工作流提取分析

在这里插入图片描述

{
"机器编号": "",
"发票代码": "",
"发票号码": "24342000000169207701",
"开票日期": "2024年11月22日",
"校验码": "",
"购买方名称": "杭州...有限公司",
"购买方纳税人识别号": "91330...CAYEC75C",
"购买方地址、电话": "",
"开户行及账号": "",
"货物或应税劳务、服务名称": "*信息技...息服务费",
"规格型号": "",
"单位": "",
"数量": "",
"单价": "",
"金额": "¥243.40",
"税率": "6%",
"税额": "¥14.60",
"价税合计(大写)": "贰佰伍拾捌圆整",
"价税合计(小写)": "¥258.00",
"销售方名称": "蚌埠谦..技有限公司",
"销售方纳税人识别号": "9134030...34329C",
"销售方地址、电话": "",
"开户行及账号": "徽商银行股份...蚌山支行;2379702504...528183/12804010210002...991",
"备注": "",
"收款人": "",
"复核": ""
}

4、成功搭建展示

在这里插入图片描述

应用场景与拓展方向

通过华为云 Flexus 算力与 DeepSeek 大模型结合,实现增值税发票关键信息自动化提取,已在企业财务审核、智能报销及税务申报等场景落地,未来将向多票种识别、OCR 与 LLM 深度融合及行业定制方案拓展,全面提升票据处理智能化水平

财务场景全覆盖:支撑企业发票验真、报销流程优化及税务申报自动化,如某制造企业借此提升审核效率提高

技术融合升级:通过 OCR 模型与 DeepSeek 大模型结合提升识别准确率,计划拓展至全票种类型解析

行业定制拓展:针对零售、医疗等行业开发专属模板,同步集成区块链存证实现票据数据全链路可信溯源

总结

本文基于华为云 Flexus 弹性算力与 DeepSeek 大模型,通过 CCE 集群部署 Dify 平台构建增值税发票智能提取工具,实现发票代码、金额等关键信息自动化解析与结构化输出,经过实践可以企业财务、报销及税务场景落地提效,未来可以向多票种兼容、OCR+LLM 深度融合及行业定制方向拓展,为票据处理智能化提供解决方案

极简部署体验:通过自动化工具与预置模板,快速完成环境配置,无需复杂操作即可搭建开发平台

柔性资源调配:支持 CPU 与内存灵活配比,根据业务负载动态调整资源,按需计费降低算力成本

场景无缝适配:适用于个人学习、中小企业开发测试等场景,且能平滑扩展至集群部署,满足业务增长需求

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85953.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85953.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

亚马逊选品 家具或艺术?指纹技术重构两者

58%毛利!生物识别首饰盒代理 奢侈品零售的隐藏金矿:安防产品的毛利是普通家居的3倍! 核心数据 零售价 4,900 | 代理价 1,990 → 毛利58% 零库存风险:90天寄售周期 72小时售罄:贝弗利山庄快闪店卖出47台 首批10家特权…

面试150 加油站

思路 此题,我们从贪心算法的角度进行思考。通过计算净消耗,如果总的净消耗小于0,说明无论如何都不能环路行驶一周。我们通过定义一个start起点,通过遍历数组计算净消耗,如果净消耗小于0,重新置0&#xff0…

2025年渗透测试面试题总结-渗透测试工程师(题目+回答)

安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 渗透测试工程师 1. 自我介绍 2. 印象深刻的渗透案例:电商平台供应链攻击 3. 渗透测试标准化流…

Vulkan 学习笔记15—Mipmap 与多重采样

一、Mipmap 生成总结 一、Mipmap 基础概念 定义:Mipmap 是图像预先计算的缩小版本,每个层级宽高为前一层的一半,用作细节级别(LOD)。作用: 远离相机的对象使用较小层级采样,提升渲染速度。避免…

HarmonyOS隐私保护全攻略:从入门到精通

📱 HarmonyOS隐私保护全攻略:从入门到精通 🛡️ 大家好呀!今天咱们来聊聊移动互联网时代最让人头疼的问题之一 —— 隐私保护!随着HarmonyOS生态越来越丰富,这个问题也变得格外重要啦!✨ &…

《使用IDEA插件部署Spring Boot项目到Docker》

准备工作 确保已安装Docker并已启动/本地也需要安装Docker IDEA中已安装Docker插件(通常已预装) 项目是基于Spring Boot的Maven或Gradle项目 1. 配置Docker连接 打开IDEA设置(File > Settings)导航到Build, Execution, Deployment > Docker点击…

植物神经小知识

在消化系统方面,患者可能长期饱受胃痛、胃胀、食欲不振、恶心呕吐、腹泻或便秘交替的折磨。吃任何食物都味同嚼蜡,体重也会在短时间内大幅波动。在心血管系统,持续性的心悸、胸闷、胸痛让人仿佛时刻处于 “心脏病发作” 的恐惧之中&#xff0…

mysql replace into学习

drop table rm_ic.test_replace; create table rm_ic.test_replace(id int(11) auto_increment primary key,name varchar(100) ,uid varchar(100) comment 身份证 unique key ) ; insert into rm_ic.test_replace values(1,张三,111),(2,李四,222),(3,王五,333),(4,赵六,444);…

ProtoBuf:通讯录4.0实现 序列化能⼒对⽐验证

🌈 个人主页:Zfox_ 🔥 系列专栏:ProtoBuf 🔥 ProtoBuf:通讯录4.0实现 Protobuf还常⽤于通讯协议、服务端数据交换场景。那么在这个⽰例中,我们将实现⼀个⽹络版本的通讯录,模拟实现…

界面控件DevExpress WPF v24.2新版亮点:电子表格组件全新升级

DevExpress WPF拥有120个控件和库,将帮助您交付满足甚至超出企业需求的高性能业务应用程序。通过DevExpress WPF能创建有着强大互动功能的XAML基础应用程序,这些应用程序专注于当代客户的需求和构建未来新一代支持触摸的解决方案。 DevExpress WPF控件近…

EcoVadis提升评估得分的策略,EcoVadis常见挑战与解决方案

EcoVadis评估概述 EcoVadis是全球领先的企业社会责任(CSR)评级平台,为全球供应链提供可持续性评估服务。该评估体系通过对环境、劳工与人权、商业道德和可持续采购四大主题的全面评估,帮助企业衡量和改进其CSR表现。 评估核心内容 EcoVadis评估涵盖以…

深入理解指针(五)

1. 回调函数是什么? 2. qsort使用举例 3. qsort函数的模拟实现 1. 回调函数是什么? 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被用来调用其所指向的…

Docker 日志

Docker 日志是排查容器故障、监控运行状态的重要工具。下面从 日志查看命令、详解字段、日志驱动、最佳实践 四个方面给你详细解析。 一、最常用日志命令 1. 查看容器日志&#xff08;默认 stdout、stderr&#xff09; docker logs <container_name|container_id>2. 实…

SAP生产环境修改程序

1. 关键的两个标准函数 TRINT_CORR_INSERT TRINT_CORR_CHECK 2. 自定义SAP生产环境修改程序 *data:begin of itab occurs 0, * lines(150), * end of itab. DATA itab TYPE TABLE OF string. PARAMETERS:program LIKE rs38m-programm. READ REPORT program INT…

构建高性能网络服务:从Reactor模式到现代服务器架构设计

在当今高并发、低延迟的应用场景下&#xff0c;如何设计高效稳定的网络服务成为后端开发的核心挑战。本文将深入探讨网络服务的演进路径&#xff0c;结合Reactor模式、one thread one loop思想等关键技术&#xff0c;揭示高性能服务器架构的设计精髓。 一、网络通信的核心问题与…

HarmonyOS 5 多端适配原理与BreakpointSystem工具类解析:附代码

H 一、鸿蒙多端适配的核心概念 鸿蒙系统的多端适配通过响应式布局和媒体查询实现&#xff0c;核心在于根据设备屏幕尺寸动态调整UI结构。其实现逻辑与Web响应式设计类似&#xff0c;但针对鸿蒙ArkUI框架进行了定制化封装。 二、BreakpointSystem工具类&#xff1a;多端适配的…

Telerik生态整合:Kendo UI for Angular组件在WinForms应用中的深度嵌入(二)

Telerik DevCraft包含一个完整的产品栈来构建您下一个Web、移动和桌面应用程序。它使用HTML和每个.NET平台的UI库&#xff0c;加快开发速度。Telerik DevCraft提供完整的工具箱&#xff0c;用于构建现代和面向未来的业务应用程序&#xff0c;目前提供UI for ASP.NET MVC、Kendo…

红帽全球副总裁曹衡康:开源AI开启企业级应用新纪元

在生成式AI技术迅猛发展的今天&#xff0c;ChatGPT、DeepSeek、元宝等AI应用已不再仅仅是科技前沿的象征&#xff0c;而是切实地融入到了我们的工作与生活之中&#xff0c;为企业带来了前所未有的变革机遇。对于企业而言&#xff0c;如何有效利用AI技术降本增效&#xff0c;已成…

异构计算解决方案(兼容不同硬件架构)

异构计算解决方案通过整合不同类型处理器&#xff08;如CPU、GPU、NPU、FPGA等&#xff09;&#xff0c;实现硬件资源的高效协同与兼容&#xff0c;满足多样化计算需求。其核心技术与实践方案如下&#xff1a; 一、硬件架构设计 异构处理器组合‌ 主从协作模式‌&#xff1a…

中科米堆汽车车门自动化三维检测3D尺寸测量设备自动外观检测

汽车的每一个零部件的质量都关乎着整车的性能与安全。汽车车门作为车辆的重要组成部分&#xff0c;不仅承担着保护车内人员安全的关键职责&#xff0c;其外观质量与尺寸精度也直接影响着消费者的第一印象和驾驶体验。 汽车车门制造涉及众多复杂的工艺流程&#xff0c;从冲压成…