背景介绍
我就说Github上面能找到好东西吧
事情是这样的
我最近在用PC端的剪映剪辑视频
需要用到它的语音转字幕功能
转完之后,导出的时候
发现 赫然有一项字幕识别的会员权益
我寻思看看什么价格
不贵的话就充了
好家伙,这不看不知道,一看吓一跳
599?一年?
连续包年首年也需要399的啊喂!
我…就用个转字幕,其他功能基本上都用不上的
真不划算啊
但凡250以内我还考虑一下
手动加字幕,那也有点太累了
寻找替代方案
Github 上去搜搜
关键字:
语音转文本, 语音转字幕, voice to srt
反正用这几个关键字结合搜索了一下
大概有了点认知,目前市面上比较流行的语音转文本的方案
基本上都是基于 openai
的 whisper
模型的,可以离线运行
发现神器:妙幕SmartSub
最终筛选出来这个应用
妙幕SmartSub
是个跨平台客户端工具,完全开源免费,在Github上已经有 2.6k
的 star 了
截止到现在已经有 194个commit
了,更新频率很高,上次提交是在 一周前
界面样式也还挺好看,视频和音频都支持
做了模型整合,也有适合国内宝宝体质的镜像模型
还支持接入百度火山deepseek等大模型服务对字幕进行翻译
这是官方的特性
如何选择模型
就是它了!
下载安装
下载也很方便, Realease页面有不同系统的安装包,下载安装即可
https://github.com/buxuku/SmartSub/releases
作者也很贴心的加上了夸克网盘的下载链接
使用教程
安装之后打开,先下载几个模型
模型的选择和注意事项上文已经提到过,更详细的请查看官方 Github 仓库说明文档
如果遇到下载比较慢的情况,建议切换至国内模型镜像站点
模型下载完之后,上传你的视频或者音频,在左侧菜单栏选择模型,开始任务
我用的 large-v3-turbo-q8_0
模型,亲测效果巨好,5分多钟音频 22秒 就识别完成了,又快又准
校对与导出
识别完成之后可以点击校对按钮,弹出校对模块
这里会在播放的时候,实时定位到哪一行字幕。
太细节了吧!!!
校对无误后点击保存
字幕文件默认跟你导入的音视频文件在一个根目录下
字幕导入剪映
接下来打开剪映,选择文本 - 导入本地字幕
将校对完成后的字幕文件 .srt 拖入剪映字幕中
完活儿~
如果对您有所帮助,还请不要忘了点个关注呦