麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载

我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。

FunASR软件介绍

FunASR 是一款基础语音识别工具包和开源 SOTA 预训练模型,支持语音识别、语音活动检测、文本后处理等。

我使用FunASR制作了一款实时语音识别转文字软件,当前版本为V4版本,由于前几天分享过另一个音视频识别转文字软件faster-whisper《音频视频转文字软件faster-whisper 1.1.1整合包下载,精准快速语音转录工具》,那个软件已经很好用了,所以当前软件版本我删除了文件识别功能,只保留了实时语音识别功能。

FunASR在2月5日刚更新过,我基于最新版制作了当前版本实时语音识别软件整合包

如果需要同时有识别文件和实时识别功能的话,请用V3版本,链接《实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具》

FunASR实时语音识别整合包V5软件使用说明

软件下载解压后直接双击【启动软件.exe】即可启动。软件操作界面比较简单

首先选择识别内容保存位置,识别结果输出文件格式为txt

块长度和上下文长度决定了最终的识别效果,块长度值越大,相同语速下每段识别出的内容的字数越多,上下文长度值建议是块长度值的1/2,这两个值越大,识别出的文字内容越准确,但是延迟也越高,这个可以自行测试效果,选择合适的值

音量阈值就是用于屏蔽低音噪音的,如果说话人环境比较嘈杂,可以设置该值,屏蔽掉低音噪音部分,值越大,屏蔽的声音分贝越高,也就是屏蔽的声音越多

翻译工具国内用户用百度,国外用户用谷歌,免费申请百度翻译API可以查看下面教程《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》

如果你想翻译成的目标语言在列表里没有,可自行设置语言代码,百度翻译和Google翻译语言代码参考下面文章《百度翻译谷歌翻译API语言代码名称对照表》,将所需要的语言代码填入目标语言输入框里即可

由于软件是收集一定长度的识别文本之后再将文本提交到翻译工具进行翻译,然后收到返回翻译结果再进行显示,所以翻译文本和识别的文本有时间差,不会同步显示

待翻译文本长度的意思就是一次性提交给翻译工具的文本长度,软件并不是每次识别出内容之后都提交给翻译工具的,而是收集到一定长度的文本内容之后再发送给翻译工具进行翻译。发送给翻译工具的文本越短,翻译结果越不准确,发送的文本越长,翻译工具越能综合上下文意思翻译的更准确,但是收集的文本越长等待时间也就越长,可自行取舍。一个英文字母算一个字符,一个汉字也算一个字符,如果是类似英语语言这个值建议大一点

软件支持识别电脑内播放的声音或是麦克风等外部输入的声音。如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。

如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

字幕文本显示长度就是前端实时显示语音识别出的文本的字幕字符长度

如果无法使用的话,可以勾选显示调试窗口查看报错信息

软件使用视频教程:电脑实时语音识别转文本工具FunASR整合包视频使用教程-诺瓦小站

注意事项

本软件只支持识别中英文,不支持识别其它语言

软件运行路径中不要出现中文及空格,否则会报错

软件只支持win10或win11,不支持其他版本Windows系统,也不支持手机和MAC

有部分Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

电脑实时语音识别转文字软件V5版本下载链接

麦克风电脑内播放声音实时识别转文字软件FunASR整合包V5下载-诺瓦小站

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/85385.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

子串题解——和为 K 的子数组【LeetCode】

谨记: 数组不是单调的话,不要用滑动窗口,考虑用前缀和 写法一:两次遍历 代码的核心思想是通过 前缀和 和 哈希表 来高效地统计符合条件的子数组个数。具体步骤如下: 计算前缀和数组 s: s[i] 表示 nums 的前…

硬件服务器基础

1、硬件服务器基础 2、服务器后面板 3、组件 3.1 CPU 3.2 内存 3.3 硬盘 3.4 风扇 4、服务器品牌 4.1 配置 4.2 CPU 架构 4.2.1 CPU 命名规则 4.2.2 服务器 CPU 和家用 CPU 的区别 4.2.3 CPU 在主板的位置 4.2.4 常见 CPU 安装方式 4.3 内存中组件 4.3.1 内存的分类 4.3.1.1 …

OpenWebUI(1)源码学习构建

1. 前言 通过docker镜像拉取安装就不介绍了,官方的命令很多。本节主要撸一撸源码,所以,本地构建 2. 技术框架和启动环境 后端python,前端svelte 环境要求:python > 3.11 ,Node.js > 20.10 3. 源…

三方接口设计注意事项

前言 随着业务系统间集成需求的增加,三方接口设计已成为现代软件架构中的关键环节。一个设计良好的三方接口不仅能够提供稳定可靠的服务,还能确保数据安全、提升系统性能并支持业务的持续发展。 一、设计原则 1. 统一接口原则 三方接口设计应遵循统一…

CSS篇-5

1. 内联元素可以实现浮动吗? 是的,内联元素完全可以实现浮动。在 CSS 中,任何元素都可以被设置为浮动(float)。 当一个元素被设置了 float 属性后,无论它本身是块级元素还是内联元素,它都会表现出类似于块级元素的特性: 生成块级框(Block-level box):浮动元素会生…

RocketMQ 学习

消息队列 参考官方文档:https://rocketmq.apache.org/zh/docs/ 基本概念 主题(Topic):是消息传输和消息存储的顶级容器,不是实际的消息容器,而是一个逻辑上的概念,用于区分不同业务消息的标识&…

Conda更换镜像源教程:加速Python包下载

Conda更换镜像源教程:加速Python包下载 为什么要更换conda镜像源? Conda作为Python的包管理和环境管理工具,默认使用的是国外镜像源,在国内下载速度往往较慢。通过更换为国内镜像源,可以显著提高包下载速度&#xff…

PCIe—TS1/TS2 之Polling.Active(一)

前文 训练序列有序集用于比特对齐、符号对齐以及交换物理层参数。2.5GT/s和5GT/s速率时,训练序列有序集不会加扰,只用8b/10b 编码。但到8GT/s及以上速率时,采用128b/130b编码,符号有可能加扰有可能不加扰,具体…

【HarmonyOS Next之旅】DevEco Studio使用指南(二十八) -> 开发云对象

目录 1 -> 开发流程 2 -> 创建云对象 3 -> 开发云对象 4 -> 调试云对象 4.1 -> 前提条件 4.2 -> 通过本地调用方式调试云对象 4.3 -> 通过远程调用方式调试云对象 5 -> 部署云对象 1 -> 开发流程 除去传统的云函数,您还可在端云…

基于51单片机的音乐盒汽车喇叭调音量proteus仿真

地址: https://pan.baidu.com/s/1l3CSSMi4uMV5-XLefnKoSg 提取码:1234 仿真图: 芯片/模块的特点: AT89C52/AT89C51简介: AT89C51 是一款常用的 8 位单片机,由 Atmel 公司(现已被 Microchip 收…

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.8 R语言解题

本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第5章析因设计引导5.7节思考题5.8 R语言解题。主要涉及方差分析&#xff0c;正态假设检验&#xff0c;残差分析&#xff0c;交互作用图。 (a) dataframe<-data.frame( Lightc(580,568…

[蓝桥杯]分考场

题目描述 nn 个人参加某项特殊考试。 为了公平&#xff0c;要求任何两个认识的人不能分在同一个考场。 求是少需要分几个考场才能满足条件。 输入描述 输入格式&#xff1a; 第一行&#xff0c;一个整数 nn (1≤n≤1001≤n≤100)&#xff0c;表示参加考试的人数。 第二行…

C++: STL简介与string类核心技术解析及其模拟实现

目录: 一.STL二.string类一、创建对象的6种构造方式二、常用接口解析1. 容量操作2. 元素访问3. 修改操作4. 字符串操作 三.string模拟实现一、设计基础&#xff1a;类结构与资源管理二、拷贝控制&#xff1a;深拷贝的三种实现1. 传统深拷贝2. 现代写法&#xff08;推荐&#xf…

Python进阶【四】:XML和JSON文件处理

Python提供了多种处理XML和JSON文件的方式&#xff0c;让我们来看看最常用的方法。 一、处理JSON文件 JSON在Python中处理起来非常简单&#xff0c;因为它的结构与Python的字典(dict)和列表(list)几乎一致。 常用模块&#xff1a;json模块 优点&#xff1a;Python标准库自带…

Golang | 搜索哨兵-对接分布式gRPC服务

哨兵&#xff08;centennial&#xff09;负责接待客人&#xff0c;直接与调用方对接。哨兵的核心组件包括service HUB和connection pool。service HUB用于与服务中心通信&#xff0c;获取可提供服务的节点信息。connection pool用于缓存与index worker的连接&#xff0c;避免每…

CSS3实现的账号密码输入框提示效果

以下是通过CSS3实现输入框提示效果的常用方法&#xff0c;包含浮动标签和动态提示两种经典实现方案&#xff1a; 一、浮动标签效果 <div class"input-group"><input type"text" required><label>用户名</label> </div><…

maven编译时跳过test过程

如果代码里有无法在打包环境中测试的部分&#xff0c;则直接运行mvn clean package&#xff0c;因为测试失败&#xff0c;会导致打包失败。目前有两种方式可以跳过测试&#xff1a; 1. mvn clean package -DskipTests&#xff0c;这会跳过执行阶须&#xff0c;但仍会生成测试所…

美业+智能体,解锁行业转化新密码(2/6)

摘要&#xff1a;中国美业市场近年蓬勃发展&#xff0c;规模持续扩大&#xff0c;预计不久将突破万亿级别&#xff0c;但同时也面临着诸多挑战&#xff0c;如获客成本攀升、服务质量不稳定、难以满足消费者多元化个性化需求等。智能体技术的出现为美业带来了新的发展机遇&#…

设计模式——责任链设计模式(行为型)

摘要 责任链设计模式是一种行为型设计模式&#xff0c;旨在将请求的发送者与接收者解耦&#xff0c;通过多个处理器对象按链式结构依次处理请求&#xff0c;直到某个处理器处理为止。它包含抽象处理者、具体处理者和客户端等核心角色。该模式适用于多个对象可能处理请求的场景…

react/vue移动端项目,刷新页面404的原因以及解决办法

一 、 项目 移动端 二、背景 1、问题描述&#xff1a;react/vue移动端项目&#xff0c;正常的页面操作跳转&#xff0c;不会出现404的问题&#xff0c;但是一旦刷新&#xff0c;就会出现404报错 2、产生原因&#xff1a; React Router是客户端的路由&#xff0c;当再次刷新时…