实战二:开发网页端界面完成黑白视频转为彩色视频

​一、需求描述

设计一个简单的视频上色应用,用户可以通过网页界面上传黑白视频,系统会自动将其转换为彩色视频。整个过程对用户来说非常简单直观,不需要了解技术细节。

效果图

​二、实现思路

总体思路:

  1. 用户通过Gradio界面上传黑白视频
  2. 视频被传递给video_colorize函数
  3. 函数使用ModelScope平台提供的UNet模型进行视频上色
  4. 处理后的视频路径被返回给Gradio界面
  5. Gradio界面显示上色后的视频

2.1 导入依赖库

import gradio as gr
import os
import torch
import tempfile
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
  • gradio: 用于创建Web界面的库,可以快速构建机器学习模型的演示界面
  • os: Python标准库,用于处理文件和目录操作
  • torch: PyTorch深度学习框架
  • tempfile: Python标准库,用于处理临时文件和目录
  • modelscope: 阿里云开源的模型即服务框架,提供了大量预训练模型
    • OutputKeys: 定义了模型输出的标准键名
    • pipeline: 用于创建模型推理管道
    • Tasks: 定义了支持的任务类型

2.2 安全设置和临时目录配置

# 添加安全全局变量设置
torch.serialization.add_safe_globals([slice])
# 设置临时目录
temp_dir = "D:/condaLearning/temp"
os.makedirs(temp_dir, exist_ok=True)
tempfile.tempdir = temp_dir
  • torch.serialization.add_safe_globals: 添加安全的全局变量,用于模型加载
  • os.makedirs: 创建临时目录
    • exist_ok=True表示如果目录已存在则不报错
  • tempfile.tempdir: 设置临时文件的默认目录

2.3 视频上色video_colorize函数

def video_colorize(input_video):# 在临时目录中创建输出文件路径output_video_path = os.path.join(temp_dir, 'colored_video.mp4')# 创建视频上色管道colorizer = pipeline(Tasks.video_colorization, model='damo/cv_unet_video-colorization', device='cuda')# 进行视频上色result = colorizer(input_video)# 返回处理后的视频路径return result[OutputKeys.OUTPUT_VIDEO]
  • os.path.join:该函数用于将多个路径组合成为输出文件的路径output_video_path,该路径为D:/condaLearning/temp/colored_video.mp4
  • pipeline: 创建模型推理管道
    • Tasks.video_colorization: 指定任务类型为视频上色
    • model='damo/cv_unet_video-colorization': 使用ModelScope中的视频上色模型damo/cv_unet_video-colorization
    • device='cuda': 使用GPU进行推理
  • colorizer(input_video): 执行视频上色
  • result[OutputKeys.OUTPUT_VIDEO]: 获取处理后的视频路径

2.4 Gradio界面创建

# 创建Gradio界面
demo = gr.Interface(fn=video_colorize,inputs=gr.Video(label="上传黑白视频"),outputs=gr.Video(label="上色后的视频"),
)
  • gr.Interface: 调用Gradio的Interface类,来创建Gradio界面
    • fn=video_colorize: 指定处理函数为video_colorize
    • inputs=gr.Video: 使用视频上传组件,标签为"上传黑白视频"
    • outputs=gr.Video: 使用视频显示组件,标签为"上色后的视频"

2.5 启动应用

if __name__ == "__main__":demo.launch(share=False)
  • demo.launch: 启动Gradio服务器
    • share=False: 不创建公共链接,只在本地运行

三、完整代码

import gradio as gr
import os
import torch
import tempfile
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks# 添加安全全局变量设置
torch.serialization.add_safe_globals([slice])# 设置临时目录
temp_dir = "D:/condaLearning/temp"
os.makedirs(temp_dir, exist_ok=True)
tempfile.tempdir = temp_dir# 定义视频上色函数
def video_colorize(input_video):# 在临时目录中创建输出文件路径output_video_path = os.path.join(temp_dir, 'colored_video.mp4')# 创建视频上色管道colorizer = pipeline(Tasks.video_colorization, model='damo/cv_unet_video-colorization', device='cuda')# 进行视频上色result = colorizer(input_video)# 保存上色后的视频到临时目录# 直接返回结果中的视频路径,而不是尝试写入文件return result[OutputKeys.OUTPUT_VIDEO]# 创建Gradio界面
demo = gr.Interface(fn=video_colorize,inputs=gr.Video(label="上传黑白视频"),outputs=gr.Video(label="上色后的视频"),
)if __name__ == "__main__":demo.launch(share=False)

四、效果展示

运行成功后,生成URL:http://127.0.0.1:7860
在这里插入图片描述
浏览器打开生成的URL:http://127.0.0.1:7860
在这里插入图片描述
打开准备好的黑白视频 ​​在这里插入图片描述

处理后的视频
在这里插入图片描述

五、问题与解决

问题一:ModuleNotFoundError: No module named ‘xxx’(下图为示例)
在这里插入图片描述
解决一:pip install xxx

#过程中遇到需要安装的依赖包
pip install gradio
pip install modelscope
pip install addict
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip install datasets==3.3.0
pip install simplejson
pip install sortedcontainers
pip install opencv-python
pip install ffmpeg

问题二:ImportError: cannot import name ‘get_metadata_patterns’ from ‘datasets.data_files’ 在这里插入图片描述

解决二:pip install datasets==3.3.0

问题三:PermissionError: [Errno 13] Permission denied: ‘D:\XXX\temp\gradio\09d4c3363b495e6c51b91b4c04a11b213ff48ceb3f09a20b7b46a238dfaf17ca\luomajiari.mp4’
在这里插入图片描述

解决三:按照报错信息,将路径下的mp4缓存的文件删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/83991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kotlin List 操作全面指南

在传统 Java 开发 List 相关的 API 中,有着样板代码冗长、缺乏链式调用、空安全等问题。 Kotlin 这门语言 为 List 提供了丰富的扩展函数,这些函数大大简化了集合操作,解决了传统 Java 集合 API 中的许多痛点。 一、基础操作 1. 创建 List …

硬盘寻址全解析:从 CHS 三维迷宫到 LBA 线性王国

在数字存储的底层世界,硬盘如同一个巨大的 “数据图书馆”,而寻址模式就是决定如何高效找到 “书籍”(扇区)的核心规则。从早期基于物理结构的 CHS(柱面 - 磁头 - 扇区)三维寻址,到现代抽象化的…

oracle 11g ADG备库报错ORA-00449 lgwr unexpectedly分析处理

问题背景 昨天遇到群友提问,遇到ADG备库挂了的情况 数据版本:11.2.0.4 操作系统:Centos7.9 环境:ADG主备库,主库为RAC,备库也是RAC 具体报错ORA-00449以及ORA-04021 看样子是LGWR挂了,还有个锁等待。 问题分析 先…

Python——day46通道注意力(SE注意力)

一、 什么是注意力 注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器,就像人类视觉会自动忽略背景,聚焦于图片中的主体(如猫、汽车)。 transformer中的叫做自注意力机制,他是一种自己学习自己的机制&…

入门AJAX——XMLHttpRequest(Post)

一、前言 在上篇文章中,我们已经介绍了 HMLHttpRequest 的GET 请求的基本用法,并基于我提供的接口练习了两个简单的例子。如果你还没有看过第一篇文章,强烈建议你在学习完上篇文章后再学习本篇文章: 🔗入门AJAX——XM…

​BEV和OCC学习-3:mmdet3d 坐标系

目录 坐标系 转向角 (yaw) 的定义 框尺寸的定义 与支持的数据集的原始坐标系的关系 KITTI Waymo NuScenes Lyft ScanNet SUN RGB-D S3DIS 坐标系 坐标系 — MMDetection3D 1.4.0 文档https://mmdetection3d.readthedocs.io/zh-cn/latest/user_guides/coord_sys_tuto…

Redis高可用架构

概述 Redis作为常用的缓存中间件,因其高性能,丰富的数据结构,使用简单等,常被用在需要一定高性能的To C业务场景中,如「秒杀场景」「用户信息中心」「帖子」「群聊」等等大家常见的业务场景中,以提高服务的…

使用WPF的Microsoft.Xaml.Behaviors.Wpf中通用 UI 元素事件

Nuget下载之后记得要先引用下面的 xmlns:i"http://schemas.microsoft.com/xaml/behaviors" <!-- 鼠标事件 --> <i:EventTrigger EventName"MouseEnter"/> <!-- 鼠标进入 --> <i:EventTrigger EventName"MouseLeave"/&g…

敏捷开发中如何避免过度加班

在敏捷开发过程中避免过度加班&#xff0c;需要明确敏捷原则、合理规划迭代任务、加强团队沟通、优化流程效率、设定合理的工作负荷、注重团队士气和成员健康。明确敏捷原则&#xff0c;即保证可持续发展的步调&#xff0c;避免频繁地变更需求、过度承诺任务量。合理规划迭代任…

JSON解析崩溃原因及解决方案

问题记录&#xff1a; /************************************************| * 描述: 将ID124执行NFC操作-JSON解析为结构体* 函数名: cJSON_ID124_to_struct* 参数[ I]: *json_string 待解析的指针* 参数[II]: *wireless_rxd 结构体指针* 返回: 成功返回0 失…

业务系统对接大模型的基础方案:架构设计与关键步骤

业务系统对接大模型&#xff1a;架构设计与关键步骤 在当今数字化转型的浪潮中&#xff0c;大语言模型&#xff08;LLM&#xff09;已成为企业提升业务效率和创新能力的关键技术之一。将大模型集成到业务系统中&#xff0c;不仅可以优化用户体验&#xff0c;还能为业务决策提供…

Edge(Bing)自动领积分脚本部署——基于python和Selenium(附源码)

微软的 Microsoft Rewards 计划可以通过 Bing 搜索赚取积分&#xff0c;积分可以兑换礼品卡、游戏等。每天的搜索任务不多&#xff0c;我们可以用脚本自动完成&#xff0c;提高效率&#xff0c;解放双手。 本文将手把手教你如何部署一个自动刷积分脚本&#xff0c;并解释其背…

前端基础之《Vue(19)—状态管理》

一、什么是状态管理 1、Vue版本问题 Vue2 Vuex3 Vue3 Vuex4 / Pinia2 在使用任何技术的时候&#xff0c;都先要去搜索一下版本&#xff0c;你的版本和脚手架环境是否兼容。 2、安装Vuex yarn add vuex3.6.2 3、状态管理 状态&#xff0c;在应用程序中表示数据&#xff0c…

【图像处理基石】如何进行图像畸变校正?

图像畸变校正常用于计算机视觉、摄影测量学和机器人导航等领域&#xff0c;能够修正因镜头光学特性或传感器排列问题导致的图像失真。下面我将介绍几种常用的图像畸变校正算法&#xff0c;并提供Python实现和测试用例。 常用算法及Python实现 1. 径向畸变校正 径向畸变是最常…

蓝桥杯_DS18B20温度传感器---新手入门级别超级详细解析

目录 一、引言 DS18B20的原理图 单总线简介&#xff1a; ​编辑暂存器简介&#xff1a; DS18B20的温度转换与读取流程 二、代码配置 maic文件 疑问 关于不同格式化输出符号的使用 为什么要rd_temperature()/16.0&#xff1f; onewire.h文件 这个配置为什么要先读lo…

MySQL的并发事务问题及事务隔离级别

一、并发事务问题 1). 赃读&#xff1a;一个事务读到另外一个事务还没有提交的数据。 比如 B 读取到了 A 未提交的数据。 2). 不可重复读&#xff1a;一个事务先后读取同一条记录&#xff0c;但两次读取的数据不同&#xff0c;称之为不可重复读。 事务 A 两次读取同一条记录&…

密码学基础——SM4算法

博客主页&#xff1a;christine-rr-CSDN博客 ​​​​专栏主页&#xff1a;密码学 &#x1f4cc; 【今日更新】&#x1f4cc; 对称密码算法——SM4 目录 一、国密SM系列算法概述 二、SM4算法 2.1算法背景 2.2算法特点 2.3 基本部件 2.3.1 S盒 2.3.2 非线性变换 ​编辑…

练习:对象数组 4

定义数组存储 4 个女朋友的对象。女朋友的属性&#xff1a;姓名、年龄、性别、爱好&#xff1b;要求1&#xff1a;计算出四个女朋友的平均年龄&#xff1b;要求2&#xff1a;统计年龄比平均值低的女朋友有几个&#xff1f;并把他们的所有信息打印出来。 代码&#xff1a; //对…

React Hooks 基础指南

React Hooks 是 React 16.8 引入的重要特性&#xff0c;它允许开发者在函数组件中使用状态和其他 React 特性。本文将详细介绍 6 个最常用的 React Hooks。 1. useState useState 是最常用的 Hook&#xff0c;用于在函数组件中添加 state。 import React, { useState } from…

【Python 算法零基础 4.排序 ⑥ 快速排序】

既有锦绣前程可奔赴&#xff0c;亦有往日岁月可回首 —— 25.5.25 选择排序回顾 ① 遍历数组&#xff1a;从索引 0 到 n-1&#xff08;n 为数组长度&#xff09;。 ② 每轮确定最小值&#xff1a;假设当前索引 i 为最小值索引 min_index。从 i1 到 n-1 遍历&#xff0c;若找到…