Spaces:

Athspi-ai
/

Audio-translation

Running

App Files Files Community

Athspi commited on Mar 9

Commit

7582b7f

verified ·

1 Parent(s): fe3e319

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -4

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 from flask import Flask, request, jsonify, send_file, send_from_directory
 import google.generativeai as genai
 from gtts import gTTS, lang
@@ -78,16 +79,27 @@ def translate_audio():
         response = model.generate_content(prompt)
         translated_text = response.text.strip()
-        # Generate TTS
         if target_language in KOKORO_LANGUAGES:
             lang_code = KOKORO_LANGUAGES[target_language]
             pipeline = KPipeline(lang_code=lang_code)
             generator = pipeline(translated_text, voice="af_heart", speed=1)
-            audio_data = next((audio for _, _, audio in generator), None)
-            if audio_data:
                 _, temp_output_path = tempfile.mkstemp(suffix=".wav")
                 sf.write(temp_output_path, audio_data, 24000)
         else:
             lang_code = next((k for k, v in GTTS_LANGUAGES.items() if v == target_language), 'en')
             tts = gTTS(translated_text, lang=lang_code)
             _, temp_output_path = tempfile.mkstemp(suffix=".mp3")
@@ -116,4 +128,4 @@ def download_file(filename):
         return jsonify({'error': 'File not found'}), 404
 if __name__ == '__main__':
-    app.run(host="0.0.0.0", port=7860)

 import os
+import numpy as np
 from flask import Flask, request, jsonify, send_file, send_from_directory
 import google.generativeai as genai
 from gtts import gTTS, lang
         response = model.generate_content(prompt)
         translated_text = response.text.strip()
+        # Generate TTS (corrected version)
         if target_language in KOKORO_LANGUAGES:
             lang_code = KOKORO_LANGUAGES[target_language]
             pipeline = KPipeline(lang_code=lang_code)
             generator = pipeline(translated_text, voice="af_heart", speed=1)
+            # Collect all audio segments
+            audio_segments = []
+            for _, _, audio in generator:
+                if audio is not None:  # Explicit None check
+                    audio_segments.append(audio)
+            if audio_segments:
+                # Concatenate audio tensors
+                audio_data = np.concatenate(audio_segments)
                 _, temp_output_path = tempfile.mkstemp(suffix=".wav")
                 sf.write(temp_output_path, audio_data, 24000)
+            else:
+                raise ValueError("No audio generated by Kokoro")
         else:
+            # Fallback to gTTS
             lang_code = next((k for k, v in GTTS_LANGUAGES.items() if v == target_language), 'en')
             tts = gTTS(translated_text, lang=lang_code)
             _, temp_output_path = tempfile.mkstemp(suffix=".mp3")
         return jsonify({'error': 'File not found'}), 404
 if __name__ == '__main__':
+    app.run(host='0.0.0.0', port=5000, debug=True)