Spaces:

buchi-stdesign
/

style-bert-vits2-fastapi

Runtime error

App Files Files Community

style-bert-vits2-fastapi / README.md

buchi-stdesign

Upload 18 files

1ee91f8 verified 22 days ago

preview code

raw

history blame contribute delete

2.14 kB

	---
	title: sbv2-verified-fixed6-real
	emoji: 🗣️
	colorFrom: indigo
	colorTo: pink
	sdk: docker
	sdk_version: "1.0"
	app_file: app.py
	pinned: true
	---

	# Style-Bert-VITS2 (koharune-ami) - FastAPI構成（Strict=True対応）

	本構成は、以下のモデルとstrict=Trueで完全一致する構造により、Hugging Face Spacesまたはローカル環境で音声生成APIを動作させるためのテンプレートです。

	## 🔗 使用モデル
	- モデル名：`buchi-stdesign/sbv2-koharune-secret`
	- ファイル：
	- `koharune-ami.safetensors`
	- `config.json`
	- `style_vectors.npy`

	## ✅ 必要環境
	```bash
	pip install -r requirements.txt

	🚀 起動方法（ローカル / Hugging Face共通）

	uvicorn app:app --host 0.0.0.0 --port 7860

	🎧 使用方法
	以下のエンドポイントにGETリクエストを送るとWAV音声が返却されます。

	GET /voice?text=こんにちは

	環境変数（Spacesなどで使用する場合）
	MODEL_REPO：Hugging Faceのモデルリポジトリ名（例：buchi-stdesign/sbv2-koharune-secret）

	HF_TOKEN：アクセストークン（非公開モデル使用時）

	🛡 ライセンス・著作権
	本テンプレートは商用・非商用問わず自由に利用可能ですが、使用モデルの著作権は各モデル提供者に帰属します。

	koharune-amiの音声モデルは、Style-Bert-VITS2公式ページから取得された学習モデルを基にしています。

	ライセンス等の明示がある場合は、そちらに従ってください。

	📦 フォルダ構成

	.
	├── app.py
	├── inference.py
	├── requirements.txt
	├── README.md
	├── text/
	│ ├── cleaners.py
	│ ├── symbols.py
	│ └── text_to_sequence.py
	├── src/sbv2/
	│ ├── commons.py
	│ ├── generator.py
	│ ├── monotonic_align.py
	│ ├── synthesizer_trn.py
	│ └── text_encoder.py

	📢 注意
	本構成は strict=True 完全一致を前提としたテンプレートです。

	モデルファイルが異なる構造を持つ場合、RuntimeError が発生します。