FunASR的Java实现Paraformer实时语音识别 | 一款无需联网的本地实时字幕软件

0. 开发背景

我们在看直播时,没有视频字幕,可能看惯了视频字幕,来到直播中缺少字幕会感觉不习惯,特别是对于听力障碍的人群,只能依赖于字幕,那么这个软件可以解决直播,在线会议等场景中无字幕的情况。此外,我们还可以用于人机交互中,以及智能呼叫中心系统中(实时语音质检)。因此,开发一款可以运行在普通CPU中的实时字幕软件很有必要。

1. 使用技术栈

该软件使用JavaFX开发,为何是使用Java来开发桌面应用软件,因此作者我熟悉Java,对于其它开发语言没那么熟悉,所以选择了Java作为开发语言。
为了能够在内网或者是断开网络的情况下使用,这里不是调用云API方式实现,而是采用了本地电脑算力进行推理,并且不要求使用GPU,只需普通的CPU就可以进行实时语音识别,同时占用的资源很低。
模型采用国内大厂阿里巴巴达摩院开源的Paraformer-Streaming流式模型,导出为onnx格式,然后使用onnxruntime推理框架来推理。可以对模型进行int8规格的量化,使得占用的资源更少,推理的速度更快,关键是量化后模型精度基本不受影响。

2. 功能介绍

具体功能:

  1. 可以背景颜色透明,防止遮挡其它窗口。当鼠标停留在上面时,会显示半透明状态,方便用户设置软件。
  2. 可以设置显示的字体大小和字体颜色。
  3. 可以拖动显示的位置,默认在主屏幕的下方居中显示,如果你还有副屏,可以把字体显示拖动到副屏中。

3. 软件效果演示

Java开发的实时语音识别项目 | 实时语音识别 | 内网可用实时语音识别项目 | 开源的实时语音识别模型 | FunASR

4. 其它

项目已经开源,点击这里访问项目源码,如果无法访问,可以点击这里。
博客:点击这里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/95629.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/95629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从机器学习的角度实现 excel 中趋势线:揭秘梯度下降过程

1. 引言:Excel 的“一键魔法”背后藏着什么智慧?在 Excel 中,我们只需右键 → 添加趋势线,一条完美的直线就出现了。它快得像魔法,但魔法背后,是数学的严谨。今天,我们不关心 Excel 内部用了什么…

关于上拉电阻

上拉电阻的作用:辅助浮空状态输出高电平 其实就是确定这根线的电平,不能让他处于一种未知的状态。 其次也可以起到限制电流的作用,防止损坏原件 那么上拉电阻如何取值? 首先来看一下驱动能力。 因为线上是一定有寄生电容的&am…

PiscCode构建Mediapipe 手势识别“剪刀石头布”小游戏

在计算机视觉与人机交互领域,手势识别是一个非常有趣的应用场景。本文将带你用 Mediapipe 和 Python 实现一个基于摄像头的手势识别“剪刀石头布”小游戏,并展示实时手势与游戏结果。 1. 项目概述 该小游戏能够实现: 实时检测手势&#xff0…

【VoNR】VoNR 不等于 VoLTE on 5G

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作,目前牵头6G技术研究。 博客内容主要围绕…

计算机网络:网络设备在OSI七层模型中的工作层次和传输协议

OSI七层模型(物理层、数据链路层、网络层、传输层、会话层、表示层、应用层)中,不同网络设备因功能不同,工作在不同层次。以下是典型网络设备的工作层次及核心功能:1. 物理层(第1层) 核心功能&a…

RSA-e和phi不互素

1.题目import gmpy2 import libnum p 1656713884642828937525841253265560295123546793973683682208576533764344166170780019002774068042673556637515136828403375582169041170690082676778939857272304925933251736030429644277439899845034340194709105071151095131704526…

基于单片机蒸汽压力检测/蒸汽余热回收

传送门 👉👉👉👉单片机作品题目速选一览表🚀 👉👉👉👉单片机作品题目功能速览🚀 🔥更多文章戳👉小新单片机-CSDN博客&#x1f68…

https 协议与 wss 协议有什么不同

HTTPS 是用于网页数据传输的安全协议,而 WSS 是用于实时双向通信(如聊天、直播)的安全协议,二者的设计目标、应用场景、底层逻辑均存在本质区别。以下从 7 个核心维度展开对比,并补充关键关联知识,帮助彻底…

主流分布式数据库集群选型指南

以下是关于主流分布式可扩展数据库集群的详细解析,涵盖技术分类、代表产品及适用场景,帮助您高效选型:一、分布式数据库核心分类 1. NewSQL 数据库(强一致性 分布式事务)产品开发方核心特性适用场景TiDBPingCAPHTAP架…

#T1359. 围成面积

题目描述编程计算由“*”号围成的下列图形的面积。面积计算方法是统计*号所围成的闭合曲线中水平线和垂直线交点的数目。如下图所示,在1010的二维数组中,有“*”围住了15个点,因此面积为15。输入1010的图形。输出输出面积。样例输入数据 10 0…

Hive on Tez/Spark 执行引擎对比与优化

在大数据开发中,Hive 已经成为最常用的数据仓库工具之一。随着业务数据规模的不断扩大,Hive 默认的 MapReduce 执行引擎 显得笨重低效。为了提升查询性能,Hive 支持了 Tez 和 Spark 作为底层执行引擎。本文将带你对比 Hive on Tez 与 Hive on Spark 的区别,并分享调优经验。…

深入理解 Next.js 的路由机制

深入理解 Next.js 的路由机制 作者:码力无边在上一篇文章中,我们成功创建并运行了第一个 Next.js 应用。当你打开项目文件夹时,你可能会注意到一个名为 pages 的目录。这个目录看似普通,但它却是 Next.js 路由系统的核心。今天&am…

modbus_tcp和modbus_rtu对比移植AT-socket,modbus_tcp杂记

modbus_rtu通信时没有连接过程&#xff0c;主机和从机各自初始化自身串口就行了&#xff0c;而rtu需要确定从机ID。注:在TCP连接中&#xff0c;不同的网卡有不同的IP&#xff0c;port对应具体的程序。/* 先读取数据 */for (i 0; i < len; i){if (pdPASS ! xQueueReceive(re…

Docker Compose 详解:从安装到使用的完整指南

在现代容器化应用开发中&#xff0c;Docker Compose 是一个不可或缺的工具&#xff0c;它能够帮助我们轻松定义和运行多容器的 Docker 应用程序。 一、什么是 Docker Compose&#xff1f; Docker Compose 是 Docker 官方提供的一个工具&#xff0c;用于定义和运行多容器 Dock…

springboot配置多数据源(mysql、hive)

MyBatis-Plus 不能也不建议同时去“控制” Hive。它从设计到实现都假定底层是 支持事务、支持标准 SQL 方言 的 关系型数据库&#xff08;MySQL、PostgreSQL、Oracle、SQL Server 等&#xff09;&#xff0c;而 Hive 两者都不完全符合。如果操作两个数据源都是mysql或者和关系数…

2025年上海市星光计划第十一届职业院校技能大赛高职组“信息安全管理与评估”赛项交换部分前6题详解(仅供参考)

1.北京总公司和南京分公司有两条裸纤采用了骨干链路配置,做必要的配置,只允许必要的Vlan 通过,不允许其他 Vlan 信息通过包含 Vlan1,禁止使用 trunk链路。 骨干链路位置​​:总公司 SW 与分公司 AC 之间的两条物理链路(Ethernet 1/0/5-6 必要 VLAN​​: •总公司:Vlan…

学习nginx location ~ .*.(js|css)?$语法规则

引言 nginx作为一款高性能的Web服务和反向代理服务&#xff0c;在网站性能优化中扮演着重要的角色。其中&#xff0c;location指令的正确配置是优化工作的关键之一。 这篇记录主要解析location ~ .*\.(js|css)?$这一特定的语法规则&#xff0c;帮助大家理解其在nginx配置中的…

Nmap网络扫描工具详细使用教程

目录 Nmap 主要功能 网络存活主机发现 (ARP Ping Scan) 综合信息收集扫描 (Stealth SYN Service OS) 全端口扫描 (Full Port Scan) NSE 漏洞脚本扫描 SMB 信息枚举 HTTP 服务深度枚举 SSH 安全审计 隐蔽扫描与防火墙规避 Nmap 主要功能 Nmap 主要有以下几个核心功能…

Spring Boot 3.x 的 @EnableAsync应用实例

语法结构使用 EnableAsync 其实就像为你的应用穿上一件时尚的外套&#xff0c;简单又高效&#xff01;只需在你的配置类上添加这个注解&#xff0c;轻松开启异步之旅。代码如下&#xff1a;想象一下&#xff0c;你的应用一瞬间变得灵活无比&#xff0c;像一个跳舞的机器人&…

Nginx Tomcat Jar包开机启动自动配置

一、Nginx配置1、创建systemd nginx 服务文件vi /usr/lib/systemd/system/nginx.service### 内容[Unit] DescriptionThe nginx HTTP and reverse proxy server Afternetwork.target[Service] Typeforking ExecStartPre/mnt/nginx/sbin/nginx -t ExecStart/mnt/nginx/sbin/nginx…