File size: 1,279 Bytes
4d9ec1a
 
 
 
 
 
 
 
 
 
 
 
 
ced52e3
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
---
title: Vevo Test
emoji: 🚀
colorFrom: gray
colorTo: indigo
sdk: gradio
sdk_version: 5.24.0
app_file: app.py
pinned: false
license: apache-2.0
---

Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

# Vevo语音转换模型演示

这是基于[amphion/Vevo](https://huggingface.co/amphion/Vevo)模型的Gradio演示应用。Vevo是一个强大的语音转换模型,支持多种语音处理功能。

## 功能

- **语音转换 (VevoVoice)**: 将内容音频的内容转换为参考音频的风格和音色
- **风格转换 (VevoStyle)**: 将内容音频的风格转换为参考音频的风格,保留原始音色
- **音色转换 (VevoTimbre)**: 将内容音频的音色转换为参考音频的音色,保留内容和风格
- **文本转语音 (VevoTTS)**: 将输入文本转换为语音,使用参考音频的风格和音色

## 安装

```bash
pip install -r requirements.txt
```

## 运行

```bash
python app.py
```

## 模型来源

- 模型:[amphion/Vevo](https://huggingface.co/amphion/Vevo)
- 原始仓库:[open-mmlab/Amphion](https://github.com/open-mmlab/Amphion)

## 注意事项

- 首次运行时,会自动下载模型文件,可能需要一些时间
- 音频输入应为WAV格式,采样率为24kHz