Spaces:

Hieucyber2208
/

know-flow

Sleeping

App Files Files Community

Hieucyber2208 commited on Mar 2

Commit

cc85380

verified ·

1 Parent(s): b30332f

Update src/text_to_speech.py

Browse files

Files changed (1) hide show

src/text_to_speech.py +61 -24

src/text_to_speech.py CHANGED Viewed

@@ -14,37 +14,74 @@ def generate_audio(text, filename="output.mp3", gender="female", speed="normal")
         gender (str): "male" (use MMS-TTS) or "female" (use gTTS).
         speed (str): "slow", "normal", or "fast" (only for gTTS).
     """
     lang = "vi"
     if gender.lower() == "female":
-        # gTTS chỉ có giọng nữ
         speed_mapping = {"slow": True, "normal": False, "fast": False}
         slow = speed_mapping.get(speed.lower(), False)
-        tts = gTTS(text=text, lang=lang, slow=slow)
-        tts.save(filename)
-        print(f"✅ Audio saved as {filename}")
-    elif gender.lower() == "male":
-        # MMS-TTS cho giọng nam
-        model = VitsModel.from_pretrained("facebook/mms-tts-vie")
-        tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-vie")
-        inputs = tokenizer(text, return_tensors="pt")
-        with torch.no_grad():
-            output = model(**inputs).waveform
-        # Lưu file âm thanh
-        torchaudio.save(filename, output, 24000, backend="sox_io")
-        print(f"✅ Audio saved as {filename}")
     else:
-        print("⚠️ Giọng không hợp lệ! Chỉ hỗ trợ 'male' hoặc 'female'.")
 def text_to_speech(gender, speed):
     text_folder = "./"
-    text_files = sorted([f for f in os.listdir(text_folder) if f.endswith('.txt') and f != "text.txt" and f != "requirements.txt"])
     for text_file in text_files:
-        with open(f"{text_file}", "r", encoding="utf-8") as file:
-            content = file.read()
-        audio_file = text_file.replace("txt","mp3")
-        generate_audio(content, f"{audio_file}", gender=gender, speed=speed)

         gender (str): "male" (use MMS-TTS) or "female" (use gTTS).
         speed (str): "slow", "normal", or "fast" (only for gTTS).
     """
+    print("\n[DEBUG] Function: generate_audio")
+    print(f"Received parameters -> text: {text[:50]}..., filename: {filename}, gender: {gender}, speed: {speed}")
     lang = "vi"
     if gender.lower() == "female":
+        print("[DEBUG] Using gTTS for female voice...")
         speed_mapping = {"slow": True, "normal": False, "fast": False}
         slow = speed_mapping.get(speed.lower(), False)
+        try:
+            tts = gTTS(text=text, lang=lang, slow=slow)
+            tts.save(filename)
+            print(f"✅ Audio saved as {filename}")
+        except Exception as e:
+            print(f"[ERROR] Failed to generate audio: {e}")
+    else:
+        print("[ERROR] Male voice generation not implemented yet!")
+    # Debug check for file existence
+    if os.path.exists(filename):
+        print(f"✅ Verified: {filename} exists.")
     else:
+        print(f"[ERROR] {filename} was not created.")
+import os
 def text_to_speech(gender, speed):
+    """
+    Convert text files in the folder to speech and save as audio files.
+    Parameters:
+        gender (str): "male" (use MMS-TTS) or "female" (use gTTS).
+        speed (str): "slow", "normal", or "fast" (only for gTTS).
+    """
+    print("\n[DEBUG] Function: text_to_speech")
+    print(f"Received parameters -> gender: {gender}, speed: {speed}")
     text_folder = "./"
+    print(f"[DEBUG] Looking for text files in: {os.path.abspath(text_folder)}")
+    # Get all valid text files (excluding specific ones)
+    text_files = sorted([
+        f for f in os.listdir(text_folder)
+        if f.endswith('.txt') and f not in ["text.txt", "requirements.txt"]
+    ])
+    print(f"[DEBUG] Found text files: {text_files}")
+    if not text_files:
+        print("[WARNING] No text files found for conversion.")
     for text_file in text_files:
+        file_path = os.path.join(text_folder, text_file)
+        try:
+            print(f"[DEBUG] Reading file: {file_path}")
+            with open(file_path, "r", encoding="utf-8") as file:
+                content = file.read()
+            audio_file = text_file.replace("txt", "mp3")
+            print(f"[DEBUG] Generating audio for: {text_file} -> {audio_file}")
+            generate_audio(content, audio_file, gender=gender, speed=speed)
+            # Verify if audio was created
+            if os.path.exists(audio_file):
+                print(f"✅ Audio file created: {audio_file}")
+            else:
+                print(f"[ERROR] Audio file {audio_file} was not created!")
+        except Exception as e:
+            print(f"[ERROR] Failed to process {text_file}: {e}")