Spaces:

GAS17
/

mp4tomp3

Sleeping

App Files Files Community

GAS17 commited on 27 days ago

Commit

d09594b

verified ·

1 Parent(s): f020e8b

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -52

app.py CHANGED Viewed

@@ -2,25 +2,13 @@ import gradio as gr
 import moviepy.editor as mp
 import tempfile
 import os
-import requests
 import base64
-import socket
-def check_dns():
-    """
-    Función de ayuda para verificar si el hostname 'api.fal.ai' se resuelve correctamente.
-    Ejecuta esta función para ver en la consola la dirección IP resultante o el error DNS.
-    """
-    try:
-        ip = socket.gethostbyname("api.fal.ai")
-        print("La IP de 'api.fal.ai' es:", ip)
-    except Exception as e:
-        print("Error al resolver 'api.fal.ai':", e)
 def extraer_audio(video_file):
     """
     Extrae el audio de un video y lo guarda en un archivo temporal (.mp3).
-    Retorna una tupla: (ruta_del_mp3_o_None, mensaje).
     """
     with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_audio:
         temp_audio_path = temp_audio.name
@@ -36,21 +24,31 @@ def extraer_audio(video_file):
 def transcribir_audio(audio_file_path):
     """
-    Envía el audio a la API de FAL para transcribirlo.
     Retorna una tupla: (transcripción, mensaje).
     """
-    fal_key = os.environ.get("FAL_KEY")
-    if not fal_key:
-        return "", "Error: FAL_KEY no está configurada en las variables de entorno."
     try:
-        # Convertir el archivo de audio a un Data URI con base64
         with open(audio_file_path, "rb") as f:
             audio_data = f.read()
         encoded_audio = base64.b64encode(audio_data).decode("utf-8")
         data_uri = f"data:audio/mp3;base64,{encoded_audio}"
-        payload = {
-            "input": {
                 "audio_url": data_uri,
                 "task": "transcribe",
                 "chunk_level": "segment",
@@ -58,34 +56,20 @@ def transcribir_audio(audio_file_path):
                 "batch_size": 64,
                 "num_speakers": None
             },
-            "logs": True
-        }
-        headers = {
-            "Content-Type": "application/json",
-            "Authorization": f"Bearer {fal_key}"
-        }
-        # Asegúrate de que este endpoint sea el actual según la documentación oficial de FAL.
-        # Si tienes errores de resolución de hostname, revisa la URL o tu configuración de DNS.
-        endpoint = "https://api.fal.ai/subscribe/fal-ai/whisper"
-        response = requests.post(endpoint, json=payload, headers=headers)
-        if response.status_code == 200:
-            result = response.json()
-            transcription = result.get("data", {}).get("text", "")
-            return transcription, "Transcripción completada exitosamente."
-        else:
-            return "", f"Error en transcripción: {response.status_code} - {response.text}"
     except Exception as e:
         return "", f"Error al transcribir el audio: {str(e)}"
 def procesar_video(video_file):
     """
     Función principal:
-    1. Extrae el audio del video.
-    2. Envía el audio a la API de FAL para transcribirlo.
-    Retorna: (ruta_del_mp3, transcripción, mensaje de estado).
     """
     audio_path, msg_audio = extraer_audio(video_file)
     if not audio_path:
@@ -103,16 +87,12 @@ iface = gr.Interface(
         gr.Textbox(label="Mensaje de estado")
     ],
     title="Extracción de Audio y Transcripción de Video a MP3",
-    description=("Esta aplicación extrae el audio de un video, lo convierte a un archivo MP3 "
-                 "y posteriormente envía el audio a la API de FAL para transcribirlo.\n\n"
                  "Requisitos:\n"
-                 "• pip install gradio moviepy requests\n"
-                 "• Configurar la variable de entorno FAL_KEY con tu API Key de FAL\n\n"
-                 "Si recibes errores de DNS al conectar con la API, verifica el endpoint y tu conexión a Internet "
-                 "usando la función 'check_dns()'.")
 )
 if __name__ == "__main__":
-    # Ejecuta esta función para verificar si 'api.fal.ai' se resuelve correctamente.
-    check_dns()
     iface.launch()

 import moviepy.editor as mp
 import tempfile
 import os
 import base64
+import fal_client
 def extraer_audio(video_file):
     """
     Extrae el audio de un video y lo guarda en un archivo temporal (.mp3).
+    Retorna una tupla: (ruta_del_mp3, mensaje).
     """
     with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as temp_audio:
         temp_audio_path = temp_audio.name
 def transcribir_audio(audio_file_path):
     """
+    Transcribe el audio utilizando la API de fal_client.
+    Se utiliza la variable de entorno FAL_KEY para la autenticación.
     Retorna una tupla: (transcripción, mensaje).
     """
+    if not os.environ.get("FAL_KEY"):
+        return "", "Error: La variable de entorno FAL_KEY no está configurada."
     try:
+        # Convertir el archivo de audio a Data URI (Base64)
         with open(audio_file_path, "rb") as f:
             audio_data = f.read()
         encoded_audio = base64.b64encode(audio_data).decode("utf-8")
         data_uri = f"data:audio/mp3;base64,{encoded_audio}"
+        logs_collected = []
+        def on_queue_update(update):
+            if isinstance(update, fal_client.InProgress):
+                for log in update.logs:
+                    logs_collected.append(log["message"])
+                    print(log["message"])
+        # Enviar la solicitud a la API de FAL para transcribir el audio
+        result = fal_client.subscribe(
+            "fal-ai/whisper",
+            arguments={
                 "audio_url": data_uri,
                 "task": "transcribe",
                 "chunk_level": "segment",
                 "batch_size": 64,
                 "num_speakers": None
             },
+            with_logs=True,
+            on_queue_update=on_queue_update,
+        )
+        transcription = result.get("data", {}).get("text", "")
+        return transcription, "Transcripción completada exitosamente.\nLogs:\n" + "\n".join(logs_collected)
     except Exception as e:
         return "", f"Error al transcribir el audio: {str(e)}"
 def procesar_video(video_file):
     """
     Función principal:
+      1. Extrae el audio del video.
+      2. Transcribe el audio utilizando la API de fal_client.
+    Retorna una tupla: (ruta_del_mp3, transcripción, mensaje de estado).
     """
     audio_path, msg_audio = extraer_audio(video_file)
     if not audio_path:
         gr.Textbox(label="Mensaje de estado")
     ],
     title="Extracción de Audio y Transcripción de Video a MP3",
+    description=("Esta aplicación extrae el audio de un video y lo convierte en un archivo MP3, "
+                 "luego utiliza fal_client para transcribir el audio.\n\n"
                  "Requisitos:\n"
+                 "• pip install gradio moviepy fal-client\n"
+                 "• Configurar la variable de entorno FAL_KEY con tu API Key de FAL")
 )
 if __name__ == "__main__":
     iface.launch()