ASR(语音识别)语音/字幕标注 通过via(via_subtitle_annotator)

文章目录

  • 1 VIA 官网资料
  • 2 语音/字幕标注
  • 3 键盘快捷键
    • 常规
    • 当一个时间片段被选中时
    • 图像或视频帧中的空间区域

1 VIA 官网资料

VIA官网:https://www.robots.ox.ac.uk/~vgg/software/via/
VIA官网标注示例:https://www.robots.ox.ac.uk/~vgg/software/via/demo/via_subtitle_annotator.html

在这里插入图片描述

2 语音/字幕标注

在线标注网站:https://whiffe.github.io/VIA/via_subtitle_annotator.html

下面的操作,参考操作视频:https://www.bilibili.com/video/BV1CrTazFETv/

首先选择视频
在这里插入图片描述
在这里插入图片描述
然后按 A ,添加时间片段
在这里插入图片描述
空格键控制是否播放,通过听音频,来调整时间片段长度。
在这里插入图片描述
再通过点击下图的显示的:>,来填入字幕内容
在这里插入图片描述
在这里插入图片描述

多标注几个,如下:
在这里插入图片描述
然后点击保存,保存的json名字要和视频名一直(视频叫0001,那么json文件也要叫0001)
在这里插入图片描述
刷新网页,重新加载保存了的json文件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3 键盘快捷键

常规

在这里插入图片描述
在这里插入图片描述
键盘快捷键(Keyboard Shortcuts)
常规(General)

命令(Command)快捷键(Shortcut)
播放/暂停媒体(Play/Pause Media)空格(Space)
切换媒体静音(Toggle Media Mute)m
提高/降低媒体播放速度(Increase / Decrease Media Playback Speed)+ / -
将媒体时间向后移动1-9秒(按住Ctrl向前移动)[Move Media Time Backward by 1,…,9 sec. (Ctrl to move forward)]Ctrl + 1、2……9
将媒体时间向前或向后移动1帧(按住Shift移动5帧)[Move Media Time Forward or Backward by 1 frame (Shift to move by 5 frames)]Shift + n / p
在当前时间添加时间片段(Add Temporal Segment at Current Time)a
将最后添加片段的边缘(左或右)更新到当前时间[Update the edge (left or right) of last added segment to current time]Shift + a
选择上一个/下一个时间片段时间轴(Select Previous / Next Temporal Segment Timeline)↑ / ↓
选择[上一个]下一个时间片段(如3秒到5秒)[Select [Previous] Next Temporal Segment (e.g. 3sec to 5sec)]Shift + Tab
选择当前时间的时间片段(如有)[Select Temporal Segment at Current Time (if any)]Enter
移动到上一个/下一个视频帧(Move to Previous / Next Video Frame)l / r
跳转到视频开头/结尾(Jump to Start/End of Video)Shift + s / e
将可见时间轴移动1秒(Shift Visible Timeline by 1 sec.)← / →
将可见时间轴移动60秒(Shift Visible Timeline by 60 sec.)Shift + ← / →
放大/缩小时间片段时间轴(Zoom In/Out the Temporal Segment Timeline)鼠标滚轮(Mouse Wheel)
水平平移时间片段时间轴(Pan the Temporal Segment Timeline Horizontally)Shift + 鼠标滚轮(Mouse Wheel)

当一个时间片段被选中时

在这里插入图片描述
当一个时间片段被选中时

命令(Command)快捷键(Shortcut)
播放/暂停锁定到片段边界的视频(Play/Pause Video Locked to Segment Boundary)Spc
删除选中的时间片段(Delete Selected Temporal Segment)Backspace
选择[上一个]下一个时间片段(Select [Previous] Next Temporal Segment)[Shift] + Tab
取消选择时间片段(Unselect Temporal Segment)Esc
增加/减少左边缘范围(按住Ctrl以1秒为单位更新)[Increase/Decrease the Extent of Left Edge (Ctrl updates by 1 sec.)][Ctrl] + ↑ / ↓
增加/减少右边缘范围(按住Ctrl以1秒为单位更新)[Increase/Decrease the Extent of Right edge (Ctrl updates by 1 sec.)][Ctrl] + → / ←
跳转到时间片段的开头/结尾(Jump to Start/End of Temporal Segment)s / e
移动选中的时间片段(按住Ctrl以1秒为单位更新)[Move Selected Temporal Segment (Ctrl updates by 1 sec.)][Ctrl] + ← / →
将选中的时间片段与左侧/右侧的片段合并(Merge Selected Temporal Segment with the Segment on Left/Right)Shift + ← / →
在当前播放位置拆分时间片段(Split temporal segment at current playback position)x

图像或视频帧中的空间区域

在这里插入图片描述
图像或视频帧中的空间区域

命令(Command)快捷键(Shortcut)
选择所有区域(Select All Regions)Ctrl + a
删除选中区域(Delete Selected Regions)Backspace 或 Delete

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/908788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mq安装新版-3.13.7的安装

一、下载包,上传到服务器 https://github.com/rabbitmq/rabbitmq-server/releases/download/v3.13.7/rabbitmq-server-generic-unix-3.13.7.tar.xz 二、 erlang直接安装 rpm -ivh erlang-26.2.4-1.el8.x86_64.rpm不需要配置环境变量,直接就安装了。 erl…

高通平台PCIE EP模式log丢失问题

高通平台PCIE EP模式log丢失问题 1 问题背景2 问题分析2.1 对比USB2.1.1 Logtool优化2.1.2 Device mhi与fs对比2.2 优化方案2.2.1 Diag系统优化2.2.2 Host mhi优化3 最终成果1 问题背景 高通5G模组如SDX55\SDX62\SDX65\SDX72\SDX75等支持pcie ep模式。会通过pcie与host(如MT7…

Python应用输入输出函数

大家好!在 Python 编程中,输入输出函数是与用户进行交互的桥梁。通过输入函数,我们可以获取用户的输入数据;通过输出函数,我们可以向用户展示程序的运行结果。对于初学者来说,掌握基本的输入输出操作是编程入门的重要一…

如何使用 Ansible 在 Ubuntu 24.04 上安装和设置 LNMP

在当今世界,自动化是有效管理和部署 Web 应用程序的关键。Ansible 是一个强大的自动化工具,它是一款开源软件配置、配置管理和应用程序部署工具。本文将指导您使用 Ansible 在 Ubuntu 服务器上安装 LNMP 堆栈(Linux、Nginx、MySQL、PHP)。 先决条件 为了执行本指南中讨论的…

Xela矩阵三轴触觉传感器的工作原理解析与应用场景

Xela矩阵三轴触觉传感器通过先进技术模拟人类触觉感知,帮助设备实现精确的力测量与位移监测。其核心功能基于磁性三维力测量与空间位移测量,能够捕捉多维触觉信息。该传感器的设计不仅提升了触觉感知的精度,还为机器人、医疗设备和制造业的智…

RK3288项目(四)--linux内核之V4L2框架及ov9281驱动分析(中)

目录 一、引言 二、V4L2其他部件驱动分析 ------>2.1、mipi-dphy ------------>2.1.1、dts ------------>2.1.2、driver ------------>2.1.3、notifier机制 ------------>2.1.4、异步回调 ------------>2.1.5、V4L2 subdev ------>2.2、mipi-csi…

容器-使用slim减少10x+大模型镜像

slim(原docker-slim)是一个开源工具,全称SlimToolkit(https://github.com/slimtoolkit/slim),用于基于已有的Docker镜像减小镜像的大小,同时尽可能保留容器的功能。它通过分析镜像的运行环境和应…

Golang基础学习

​​​​​​​​​​ 初见golang语法 go项目路径 cd $GOPATH //ls可以看到有bin,pkg,src三个文件 cd src/ mkdir GolangStudy cd GolangStudy mkdir firstGolanggo程序执行: go run hello.go//如果想分两步执行: go build hello.go ./hello导入包的…

OPenCV CUDA模块图像处理-----对图像执行 均值漂移滤波(Mean Shift Filtering)函数meanShiftFiltering()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 在 GPU 上对图像执行 均值漂移滤波(Mean Shift Filtering),用于图像分割或平滑处理。 该函数将输入图像中的…

电路图识图基础知识-远程/本地启停电动机(二十一)

在实际的生产中,经常会需要电动机的控制可以就地控制和远方控制,在集中的控制室中,远 方控制电动机的启动、停止。在就地设置启动、停止按钮或是紧急停车按钮,以满足生产的需要。 1.远程、多点及连锁控制电动机电路 2.元器件配置…

SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现

摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…

【深度学习新浪潮】什么是credit assignment problem?

Credit Assignment Problem(信用分配问题) 是机器学习,尤其是强化学习(RL)中的核心挑战之一,指的是如何将最终的奖励或惩罚准确地分配给导致该结果的各个中间动作或决策。在序列决策任务中,智能体执行一系列动作后获得一个最终奖励,但每个动作对最终结果的贡献程度往往…

__VUE_PROD_HYDRATION_MISMATCH_DETAILS__ is not explicitly defined.

这个警告表明您在使用Vue的esm-bundler构建版本时,未明确定义编译时特性标志。以下是详细解释和解决方案: ‌问题原因‌: 该标志是Vue 3.4引入的编译时特性标志,用于控制生产环境下SSR水合不匹配错误的详细报告1使用esm-bundler…

Vue.js教学第二十一章:vue实战项目二,个人博客搭建

基于 Vue 的个人博客网站搭建 摘要: 随着前端技术的不断发展,Vue 作为一种轻量级、高效的前端框架,为个人博客网站的搭建提供了极大的便利。本文详细介绍了基于 Vue 搭建个人博客网站的全过程,包括项目背景、技术选型、项目架构设计、功能模块实现、性能优化与测试等方面。…

32位寻址与64位寻址

32位寻址与64位寻址 32位寻址是什么? 32位寻址是指计算机的CPU、内存或总线系统使用32位二进制数来标识和访问内存中的存储单元(地址),其核心含义与能力如下: 1. 核心定义 地址位宽:CPU或内存控制器用32位…

如何在Spring Boot中使用注解动态切换实现

还在用冗长的if-else或switch语句管理多个服务实现? 相信不少Spring Boot开发者都遇到过这样的场景:需要根据不同条件动态选择不同的服务实现。 如果告诉你可以完全摆脱条件判断,让Spring自动选择合适的实现——只需要一个注解,你是否感兴趣? 本文将详细介绍这种优雅的…

开疆智能Ethernet/IP转Modbus网关连接鸣志步进电机驱动器配置案例

在工业自动化控制系统中,常常会遇到不同品牌和通信协议的设备需要协同工作的情况。本案例中,客户现场采用了 罗克韦尔PLC,但需要控制的变频器仅支持 ModbusRTU 协议。为了实现PLC 对变频器的有效控制与监控,引入了开疆智能Etherne…

Neovim - LSP 底层原理,难点配置(二)

Neovim LSP 的工作原理 基本概念 LSP(Language Server Protocol)可以理解成是一个"语言助手"。每种编程语言都有自己的"语言助手"(比如 TypeScript 的 tsserver),这些助手能告诉你: 哪写错了(语法错误)哪能跳转(方法定义,引用)哪可以补全(自…

UNECE R152——解读自动驾驶相关标准法规(AEB)

Uniform provisions concerning the approval of motor vehicles with regard to the Advanced Emergency Braking System (AEBS) for M1 and N1 vehicles(2021) 原文链接:https://unece.org/sites/default/files/2024-03/R152r1am1e%20%282%29.pdf 核心内容解析 …

STM32标准库-ADC数模转换器

文章目录 一、ADC1.1简介1. 2逐次逼近型ADC1.3ADC框图1.4ADC基本结构1.4.1 信号 “上车点”:输入模块(GPIO、温度、V_REFINT)1.4.2 信号 “调度站”:多路开关1.4.3 信号 “加工厂”:ADC 转换器(规则组 注入…