官方链接内容整理的 Spark-TTS Windows 安装完整流程

官方链接内容整理的 Spark-TTS Windows 语音克隆 安装完整流程

官方链接内容整理的 Spark-TTS Windows 安装完整流程

Spark TTS:基于大型语言模型的文本转语音模型
Spark-TTS 是一个先进的文本转语音系统,利用大型语言模型(LLM)的强大功能,实现高度准确和自然的声音合成。它被设计为高效、灵活且强大,适用于研究和生产用途。

Inference Overview of Voice Cloning

spark tts infer voice cloning

Inference Overview of Controlled Generation

spark tts infer control

楼主整合好的资源包,免加速,已缓存好的项目,提供不限速链接:
—链接: https://caiyun.139.com/m/i?2mD8SUatQ1y60
/*594n8cMmVZh1:/
复制本段信息,打开「中国移动云盘APP」获取。人人不限速,移动用户免流量!

Spark-TTS Windows 安装指南

1. 安装 Conda

• 下载并安装 Miniconda 或 Anaconda。
重要:安装时勾选 Add Conda to PATH(将 Conda 添加到系统环境变量)。

我的这一步没有环境变量配置,请手动装配
在这里插入图片描述

2. 下载 Spark-TTS

选择以下任一方式
推荐(手动下载)

  1. 访问 GitHub 仓库:SparkAudio/Spark-TTS
  2. 点击 Code > Download ZIP,解压到本地文件夹。
    可选(使用 Git)
git clone https://github.com/SparkAudio/Spark-TTS.git
3. 创建 Conda 环境

打开 命令提示符(cmd),依次执行:

conda create -n sparktts python=3.11 -y
conda activate sparktts

为什么替换为3.11
安装过程遇到错误:
pip 无法从指定的 PyTorch 旧版本索引中找到适合你当前环境的 torch 包。这通常是由于 ​​Python 版本不兼容​​ 或 ​​CUDA 环境问题​​ 导致的。以下是解决方案:
检查 Python 版本​​
PyTorch 对 Python 版本有严格限制:
​​PyTorch 2.0+​​ 需要 Python 3.8-3.11(​​不支持 Python 3.12​​)。

4. 安装依赖

进入 Spark-TTS 文件夹(解压或克隆的目录),运行:

pip install -r requirements.txt
5. 安装 PyTorch

自动检测 CUDA版本(推荐):

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
6. 下载模型

选择以下任一方式
推荐(Python 脚本下载)

  1. 在 Spark-TTS 文件夹中创建 download_model.py 文件,粘贴以下代码:
    from huggingface_hub import snapshot_download
    import osmodel_dir = "pretrained_models/Spark-TTS-0.5B"
    if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:print("Model files already exist. Skipping download.")
    else:print("Downloading model files...")snapshot_download(repo_id="SparkAudio/Spark-TTS-0.5B",local_dir=model_dir,resume_download=True  # 支持断点续传)print("Download complete!")
    
  2. 运行脚本:
    python download_model.py
    ```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/cb101a9282c34a888542fc1717237865.png)

可选(Git 下载)

mkdir pretrained_models
git clone https://huggingface.co/SparkAudio/Spark-TTS-0.5B pretrained_models/Spark-TTS-0.5B
7. 运行 Web UI

启动交互式网页界面:

python webui.py

• 浏览器访问生成的本地地址(通常是 http://127.0.0.1:7860)即可使用 TTS 功能。

此处楼主遇到了numpy 版本问题可供参考
—1. ​​降级 numpy 到兼容版本​​
powershell
pip install “numpy<2.0” --force-reinstall
这会安装最新的 1.x 版本(如 1.26.4),兼容大多数科学计算库。
2. ​​重新安装冲突的包​​
降级 numpy 后,重新安装依赖冲突的包:
powershell
pip install --force-reinstall contourpy gensim numba
3. ​​验证安装​​
检查 numpy 版本是否已降级:
powershell
python -c “import numpy; print(numpy.version)”
应输出 1.x.x(如 1.26.4)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86533.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86533.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Cloud Config动态刷新实战指南

以下是利用 Spring Cloud Config + Bus 实现配置动态刷新的完整步骤和原理说明: 一、核心原理 消息总线机制 Bus 通过消息代理(如 RabbitMQ/Kafka)建立公共 Topic(默认 springCloudBus),当配置变更时,任一服务触发刷新请求,消息会广播至所有监听该 Topic 的服务实例,实…

Linux 修改密码教程

Linux 修改密码教程 Linux 系统中修改密码是非常常见的管理操作&#xff0c;无论是修改当前用户密码还是其他用户的密码&#xff0c;通常都可以通过终端完成。本文将详细介绍如何在 Linux 系统中修改密码&#xff0c;并包括修改其他用户密码的方法。 1. 修改当前用户密码 修改…

正则表达式详解:从基础到高级应用的全面指南

文章大纲 引言&#xff1a;什么是正则表达式&#xff1f; 在编程和文本处理领域&#xff0c;正则表达式&#xff08;Regular Expression&#xff0c;简称 regex&#xff09;是一种强大的工具&#xff0c;用于描述和匹配文本中的特定模式。它本质上是一种由字符和特殊符号组成…

flutter结合ai工具(其他语言通用)

一、为什么Flutter开发者需要免费AI工具&#xff1f; 1. 减少重复性编码 Flutter开发中&#xff0c;UI组件、网络请求、状态管理等代码高度重复&#xff0c;AI可自动生成这些代码。 示例&#xff1a;输入"创建一个Material Design风格的登录页面"&#xff0c;AI工具…

鸿蒙容器组件 Row 全解析:水平布局技术与多端适配指南

一、引言&#xff1a;Row 组件 —— 水平布局的核心引擎 在鸿蒙全场景应用开发中&#xff0c;Row 容器组件作为水平布局的标准载体&#xff0c;通过声明式语法实现子组件的有序水平排列。作为线性布局体系的重要组成部分&#xff0c;其简洁的属性体系与强大的适配能力&#xf…

基于 PCIe 架构的处理器系统

处理器系统A 在有些处理器系统中&#xff0c;没有直接提供PCI总线&#xff0c;此时需要使用PCIe桥&#xff0c;将PCIe链路转换为PCI总线之后&#xff0c;才能连接PCI设备 在这种结构中&#xff0c;RC由两个FSB-to-PCIe桥和存储器控制器组成。 FSB是Front Side Bus的缩写&…

Qt 与 Halcon 联合开发五:为何与如何将耗时算法移入子线程

在 Qt 应用程序开发中&#xff0c;界面响应速度直接影响用户体验。而在集成图像处理库如 Halcon 的项目中&#xff0c;耗时算法一旦运行于主线程中&#xff0c;极易造成界面卡顿甚至假死。本篇文章将围绕耗时算法必须移入子线程执行这一核心原则&#xff0c;结合 Qt 与 Halcon …

聚焦OpenVINO与OpenCV颜色通道转换的实践指南

颜色通道顺序问题&#xff1a;OpenVINO模型RGB输入与OpenCV BGR格式的转换 在计算机视觉任务中&#xff0c;框架间的颜色通道差异常导致模型推理错误。以下方法解决OpenVINO模型需要RGB输入而OpenCV默认输出BGR的问题。 理解核心差异 OpenCV的imread()函数遵循BGR通道顺序&a…

【软考高级系统架构论文】论企业集成平台的理解与应用

论文真题 企业集成平台 (Enterprise Integration Platform, EIP) 是支持企业信息集成的环境,其主要功能是为企业中的数据、系统和应用等多种对象的协同运行提供各种公共服务及运行时的支撑环境。企业集成平台能够根据业务模型的变化快速地进行信息系统的配置和调整,保证不同…

LabVIEW光谱仪设计

采用LabVIEW 开发平台&#xff0c;搭配品牌硬件构建光谱仪系统&#xff0c;实现光谱数据的高效采集、分析与显示&#xff0c;展现 LabVIEW 在仪器开发中的快速集成与灵活扩展能力。 ​ 应用场景 科研领域&#xff1a;用于材料光谱特性研究、光学实验数据分析&#xff0c;支持高…

Nginx配置文件介绍和基本使用

Nginx配置文件介绍和基本使用 Nginx 是一款高性能的 HTTP 服务器、反向代理服务器及电子邮件代理服务器&#xff0c;由俄罗斯工程师 Igor Sysoev 开发&#xff0c;并于2004年首次公开发布。以轻量级、高并发能力、稳定性和低资源消耗著称。 主要功能 HTTP服务器&#xff1a;…

DataSophon 1.2.1集成Flink 1.20并增加JMX 监控

参考:datasophon集成Flink1.20.0 此大神有多篇集成其他服务的文章&#xff0c;建议关注一波 一、服务集成 flink 1.20 下载 1.构建压缩包&#xff1a; 1.1拷贝需要的包 tar -zxvf flink-1.20.0-bin-scala_2.12.tgz tar czf flink-1.20.0.tar.gz flink-1.20.0# 为了flink cdc…

RSYNC+IONTIFY数据实时同步

一、RSYNC简介 rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步&#xff0c;支持本地复制&#xff0c;或者与其他SSH、rsync主机同步。 二、rsync特性 rsync支持很多特性&#xff1a; 可以镜像保存整个目录树和文件系统可以很容易做到保持…

吉林大学软件工程期末复习整理

概述 22级软件工程考试细节及复习相关问题见下面这篇帖子&#xff0c;作者自己复刻了一版真题 吉林大学软件工程2025年期末真题&#xff08;回忆复刻版&#xff09;-CSDN博客 下面是作者复习时整理的笔记&#xff0c;放到csdn之后序号排版稍微有点乱 21级考试情况可以参考学…

chili3d笔记23 正交投影3d重建笔记4 点到线2

从俯视图到主视图就这两条线有问题&#xff0c;比想象的效果好 原图 两条斜线变成了4条横线 经典少一根线 好了但是不知道为什么好了 import { Logger, PubSub } from "chili-core"; import DxfParser, { ILineEntity } from dxf-parser; class Cluster {lines: [num…

LDO的自放电功能

LDO&#xff08;低压差线性稳压器&#xff09;的自放电功能&#xff08;Discharge Function 或 Active Discharge&#xff09;是一种在关闭输出时主动释放输出端残留电荷的机制。以下是其关键点&#xff1a; 1. 自放电功能的作用 快速放电&#xff1a;当LDO被禁用&#xff08;如…

Ingress-Nginx简介和配置样例

Ingress-Nginx 是 Kubernetes 中一个基于 Nginx 的 Ingress 控制器&#xff0c;用于管理对集群内服务的 HTTP/HTTPS 访问。它是 Kubernetes Ingress 资源的实现之一&#xff0c;通过配置 Nginx 反向代理和负载均衡器&#xff0c;提供路由规则、SSL/TLS 终止、路径重写等高级功能…

Java+LangChain实战入门:深度剖析开发大语言模型应用!

在人工智能飞速发展的今天&#xff0c;大语言模型&#xff08;如GPT系列&#xff09;正改变着我们构建应用的方式。但如何将这些先进模型无缝集成到企业级Java应用中&#xff1f;这正是LangChain框架的强项——它简化了语言模型的调用、链式处理和上下文管理&#xff0c;让开发…

论文笔记:Large language model augmented narrative driven recommendations

RecSys 2023 代码&#xff1a;iesl/narrative-driven-rec-mint: Mint: A data augmentation method for narrative driven recommendation. 1 intro 尽管基于历史交互的数据能够有效地提供推荐&#xff0c;但用户在请求推荐时&#xff0c;往往只是对目标物品有一个模糊的概念…

兴达易控Modbus TCP转Profibus DP网关与安科瑞多功能电表的快速通讯

兴达易控Modbus TCP转Profibus DP网关与安科瑞多功能电表的快速通讯 在工业自动化领域&#xff0c;不同设备之间的通信连接至关重要。兴达易控Modbus TCP转Profibus DP网关接APM810/MCE安科瑞多功能电表与300plc通讯&#xff0c;这一过程涉及到多个关键技术和环节&#xff0c;…