【开源软件推荐】 SmartSub,一个可以快速识别视频/音频字幕的工具

背景介绍

我就说Github上面能找到好东西吧

事情是这样的

我最近在用PC端的剪映剪辑视频

需要用到它的语音转字幕功能

转完之后,导出的时候

发现 赫然有一项字幕识别的会员权益

我寻思看看什么价格

不贵的话就充了

好家伙,这不看不知道,一看吓一跳

599?一年?

连续包年首年也需要399的啊喂!

我…就用个转字幕,其他功能基本上都用不上的

真不划算啊

但凡250以内我还考虑一下

手动加字幕,那也有点太累了

寻找替代方案

Github 上去搜搜

关键字:

语音转文本, 语音转字幕, voice to srt

反正用这几个关键字结合搜索了一下

大概有了点认知,目前市面上比较流行的语音转文本的方案

基本上都是基于 openaiwhisper 模型的,可以离线运行

发现神器:妙幕SmartSub

最终筛选出来这个应用

妙幕SmartSub

是个跨平台客户端工具,完全开源免费,在Github上已经有 2.6k 的 star 了

截止到现在已经有 194个commit 了,更新频率很高,上次提交是在 一周前

界面样式也还挺好看,视频和音频都支持

做了模型整合,也有适合国内宝宝体质的镜像模型

还支持接入百度火山deepseek等大模型服务对字幕进行翻译

这是官方的特性

如何选择模型

就是它了!

下载安装

下载也很方便, Realease页面有不同系统的安装包,下载安装即可

https://github.com/buxuku/SmartSub/releases

作者也很贴心的加上了夸克网盘的下载链接

使用教程

安装之后打开,先下载几个模型

模型的选择和注意事项上文已经提到过,更详细的请查看官方 Github 仓库说明文档

如果遇到下载比较慢的情况,建议切换至国内模型镜像站点

模型下载完之后,上传你的视频或者音频,在左侧菜单栏选择模型,开始任务

我用的 large-v3-turbo-q8_0 模型,亲测效果巨好,5分多钟音频 22秒 就识别完成了,又快又准

校对与导出

识别完成之后可以点击校对按钮,弹出校对模块

这里会在播放的时候,实时定位到哪一行字幕。

太细节了吧!!!

校对无误后点击保存

字幕文件默认跟你导入的音视频文件在一个根目录下

字幕导入剪映

接下来打开剪映,选择文本 - 导入本地字幕

将校对完成后的字幕文件 .srt 拖入剪映字幕中

完活儿~


如果对您有所帮助,还请不要忘了点个关注呦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/915222.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/915222.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动驾驶仿真领域常见开源工具

自动驾驶仿真领域常见开源工具1、目录1.1 自动驾驶仿真领域常见开源2、地图&场景2.1、场景播放器-Esmini4、被测对象-智驾软件4.1、Autoware4.4、端到端模型-VAD4.5、端到端模型-UniAD4.6、端到端模型-ThinkTwice4.7、端到端模型-TCP5、评价方法5.1、Leaderboard5.2、Bench…

GPU算力租用平台推荐,价格便宜且有羊毛薅,最低只要0.49/小时!

1.趋动云,这是我近期一直在用的,使用体验还不错,推荐给大家 网址:https://platform.virtaicloud.com/gemini_web/auth/register?inviteCode5f74065eac6d8867eac5c82194e2683a 是否选择一个算力平台我认为有几点需要考虑&#xff…

python学智能算法(二十五)|SVM-拉格朗日乘数法理解

引言 前序学习进程中,已经对最佳超平面的求解有了一定认识。 刚好在此梳理一下: 函数距离 首先有函数距离F,也可以称为函数间隔F: Fmin⁡i1...myi(w⋅xib)F \min_{i1...m}y_{i}(w \cdot x_{i}b)Fi1...mmin​yi​(w⋅xi​b) 几何距离 然后…

vscode 源码编译

windows 环境 下载安装 build tools Visual Studio Build Tools 勾选 C 因为安装详细信息里是 v143,所以单个组件里也要追加两个 143 的勾选 点击安装,安装好重启下电脑 Electron 安装失败:connect ETIMEDOUT 20.205.243.166:443 为防Ele…

读取和写入json,xml文件

一、JSON文件操作​ 1. 核心类​​ ​​QJsonDocument​​:表示整个JSON文档,提供解析(fromJson())和序列化(toJson())功能。 ​​QJsonObject​​:存储键值对集合,支持嵌套对象和数…

深度学习×第10卷:她用一块小滤镜,在图像中找到你

🌈【第一节 她看到的是像素点,却试图拼出你整张脸】📸 图像是什么?她从未见过你,但看见的是你的一片光斑图像,在神经网络的眼里,是一个个数字格子。这些格子,每个都有 0~255 的亮度…

计算机组成原理中的RAM:核心技术深度解析

摘要:本文深度剖析RAM在计算机体系中的核心地位,结合2025年最新技术标准与实测数据,涵盖DRAM工作原理、主流技术对比、非易失性存储革新及未来发展趋势,为硬件开发者和系统架构师提供权威技术参考。一、RAM基础原理与系统交互机制…

C语言—深入理解指针(详)

深入理解指针(详解)前言一、指针是什么1、指针的定义2、指针的大小二、指针类型1、类型2、不同类型的意义三、野指针1、野指针形成原因2、如何避免野指针四、指针的运算1、 指针整数2、指针-指针3、指针的关系运算五、const修饰指针1、consr修饰变量2、c…

小谈相机的学习过程

前言博主本人并非专职相机开发,还涉及系统的其他几个模块,虽然都属于owner,但是都还在学习探索的一个过程,自认为掌握还不够细致,此篇文章仅梳理,总结,印证自己近五年相机模块的一个学习过程&am…

CentOS7 内网服务器yum修改

1、首先确定的内网服务器是有yum源代理服务器的2、修改 /etc/yum.conf 配置文件,增加代理ip和端口号proxyhttp://ip.ip.ip.ip:port3、备份源是文件sudo cp /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.bak4、修改配置文件 vi CentOS-Base…

基于单片机自行车自动防盗报警系统设计

摘 要 本文阐述了自行车防盗报警系统原理,介绍如何用stc89c52单片机实现防盗报警,分析各个部分的工作原理,并给出了原理图和源程序。此设计电路由震动传感器、单片机、无线超再生发射/接收电路、LED显示器和蜂鸣器组成。由于超再生接收是一种…

【深度学习】神经网络反向传播算法-part4

七、反向传播算法反向传播Back Propagation 简称 BP 。 训练神经网络的核心算法之一,通过计算损失函数,相对于每个权重参数的梯度,来优化神经网络的权重1. 前向传播前向传播是把数据经过各层神经元的运算并逐层向前传输,知道输出层…

CTF之服务器端模板注入(SSTI)与赛题

概念定义服务器端模板注入(Server-Side Template Injection)服务端接受攻击者的输入,将其作为Web应用内容的一部分,在进行代码编译渲染的过程中,进行了语句的拼接,执行了所插入的恶意内容,从而导致信息泄露、代码执行、…

除了某信,就是这款软件来替代了!

引言 哈喽,我是小索奇。有时候会有一个普遍的需求,想在几个设备之间传个文件或者发个消息,除了微信,想一想你还能用什么软件? 今天就是为了解决这个问题,给大家介绍一款软件 Localsend 来解决。 内容模块…

Vue2.x封装预览PDF组件

一、为什么用PDFObject插件? PDFObject 是一个轻量级的 JavaScript 库,主要用于在网页中嵌入和预览 PDF 文件。它通过简单的 API 调用,可以在浏览器中实现 PDF 文件的显示,而无需依赖任何插件。以下将详细介绍 PDFObject 的特点、…

undefined reference to ‘end‘

相关问题: 一、undefined reference to _exit undefined reference to ‘end‘ warning: _close is not implemented and will always fail 一、环境: ubuntu24.04实体机、 arm-none-eabi-gcc gcc version 13.2.1 20231009 (15:13.2.rel1-2) 二…

nginx定制http头信息

修改http响应头信息,相关Nginx模块:ngx_http_headers_moduleexpires语法:expires [modified] time;expires [modified] time;默认值:expires off;作用域:http, server, location, if in location用途:控制缓…

主机安全---开源wazuh安装

Wazuh 简介 Wazuh 是一款免费开源的终端安全监控平台,支持威胁检测、完整性监控、事件响应和合规性管理,适用于企业级安全运维场景。其核心组件包括: Wazuh Indexer:基于 OpenSearch 的日志存储与检索组件。Wazuh Server&#x…

GaussDB 数据库架构师修炼(四) 备份容量估算

1 影响备份容量关键要素业务总数据量备份数据保留周期备份周期备份数据的压缩比平均每天的新增数据量平均每天新增日志数据量2 备份容量的估算方法公式备份容量C = 自动全量备份容量C1 + 自动差量备份容量C2 + 自动日志归档 容量C3 &#xff…

《R for Data Science (2e)》免费中文翻译 (第0章) --- Introduction

写在前面 本系列推文为《R for Data Science (2e)》的中文翻译版本。所有内容都通过开源免费的方式上传至Github,欢迎大家参与贡献,详细信息见: Books-zh-cn 项目介绍: Books-zh-cn:开源免费的中文书籍社区 r4ds-zh-cn…