Spaces:

DeepLearning101
/

Speech-Separation

Running

App Files Files Community

DeepLearning101 commited on 1 day ago

Commit

bb38b9e

verified ·

1 Parent(s): 977e41f

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -4

app.py CHANGED Viewed

@@ -1,13 +1,43 @@
 import gradio as gr
 import torch
 from DPTNet_eval.DPTNet_quant_sep import load_dpt_model, dpt_sep_process
 # 加載模型
 model = load_dpt_model()
 def separate_audio(input_wav):
     outfilename = "output.wav"
-    dpt_sep_process(input_wav, model=model, outfilename=outfilename)
     return (
         outfilename.replace('.wav', '_sep1.wav'),
         outfilename.replace('.wav', '_sep2.wav')
@@ -25,14 +55,14 @@ description_html = """
   <a href='http://deeplearning101.twman.org' target='_blank'>Deep Learning 101</a>
 </div>
-<br><br>
 ### 🔍 使用方式：
 - 上傳一段包含兩人對話的混音音檔（支援 `.mp3`, `.wav`）
 - 點擊「Separate」按鈕
 - 分離出兩個說話人的音軌
-<br><br>
 ### 📘 相關技術文章：
 <ul>
@@ -69,4 +99,4 @@ if __name__ == "__main__":
         allow_flagging="never"
     )
-    interface.launch()

 import gradio as gr
 import torch
 from DPTNet_eval.DPTNet_quant_sep import load_dpt_model, dpt_sep_process
+import os
+import soundfile as sf
+import numpy as np
+import librosa
+import warnings
 # 加載模型
 model = load_dpt_model()
 def separate_audio(input_wav):
+    """
+    Gradio Audio(filepath) → 處理 → 回傳兩個分離後的音檔路徑
+    """
+    file_extension = os.path.splitext(input_wav)[1].lower()
+    # 如果是 MP3 或其他格式，先轉成 WAV
+    if file_extension != ".wav":
+        data, sr = sf.read(input_wav)
+        # 轉單聲道
+        if len(data.shape) > 1:
+            data = data.mean(axis=1)
+        # 重採樣到 16kHz
+        if sr != 16000:
+            data = librosa.resample(data, orig_sr=sr, target_sr=16000)
+        # 存成 WAV
+        sf.write("input.wav", data, 16000)
+        wav_path = "input.wav"
+    else:
+        wav_path = input_wav
+    # 分離語音
     outfilename = "output.wav"
+    dpt_sep_process(wav_path, model=model, outfilename=outfilename)
     return (
         outfilename.replace('.wav', '_sep1.wav'),
         outfilename.replace('.wav', '_sep2.wav')
   <a href='http://deeplearning101.twman.org' target='_blank'>Deep Learning 101</a>
 </div>
+<br>
 ### 🔍 使用方式：
 - 上傳一段包含兩人對話的混音音檔（支援 `.mp3`, `.wav`）
 - 點擊「Separate」按鈕
 - 分離出兩個說話人的音軌
+<br>
 ### 📘 相關技術文章：
 <ul>
         allow_flagging="never"
     )
+    interface.launch(debug=True)