whisper

Running

App Files Files Community

artyomboyko commited on Apr 27

Commit

779f9f6

verified ·

1 Parent(s): 5467c51

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -31

app.py CHANGED Viewed

@@ -8,16 +8,15 @@ from huggingface_hub import login
 import tempfile
 import os
-import time # Добавлен импорт time
 # --- Конфигурация ---
-HF_TOKEN = os.getenv("HF_ACCESS_TOKEN") # Убедитесь, что эта переменная установлена в вашей среде
 MODEL_NAME = "artyomboyko/whisper-small-ru-v4"
 BATCH_SIZE = 8
-FILE_LIMIT_MB = 1000 # Эта переменная не используется в коде, но оставлена
 # --- Инициализация ---
-# Попробуйте войти в систему Hugging Face, если токен доступен
 try:
     if HF_TOKEN:
         login(token=HF_TOKEN)
@@ -45,13 +44,10 @@ try:
     print(f"Модель {MODEL_NAME} успешно загружена.")
 except Exception as e:
     print(f"Ошибка при загрузке модели {MODEL_NAME}: {e}")
-    # Можно добавить выход из программы или обработку ошибки
     exit()
 # --- Функции ---
-# Функция для транскрибации аудиофайла
 def transcribe(filepath, task):
     """
     Транскрибирует аудиофайл с помощью загруженной модели Whisper.
@@ -70,8 +66,6 @@ def transcribe(filepath, task):
     print(f"Начало транскрибации файла: {filepath}, Задача: {task}")
     try:
-        # generate_kwargs передает параметры для генерации текста моделью
-        # return_timestamps=True указывает, что нужно возвращать временные метки (хотя здесь используется только текст)
         result = pipe(filepath, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)
         text = result["text"]
         print("Транскрибация завершена успешно.")
@@ -83,13 +77,10 @@ def transcribe(filepath, task):
 # --- Создание интерфейса Gradio ---
-# Используем gr.Blocks для создания кастомного интерфейса с вкладками
 with gr.Blocks(theme=gr.themes.Default(primary_hue="blue", secondary_hue="neutral")) as demo:
-    # Заголовок и описание приложения с использованием Markdown
     gr.Markdown(
         f"""
-        # Whisper: Транскрибация аудио и YouTube видео
         Транскрибируйте длинные аудиозаписи (с микрофона или из файла) одним нажатием кнопки!
         Демо использует модель OpenAI Whisper [{MODEL_NAME}](https://huggingface.co/{MODEL_NAME})
         через библиотеку 🤗 Transformers для распознавания речи.
@@ -98,39 +89,31 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="blue", secondary_hue="neutra
     # Создание вкладок
     with gr.Tabs():
         # Вкладка 1: Транскрибация с микрофона
         with gr.TabItem("Микрофон"):
-            with gr.Row(): # Располагаем элементы в строку
-                # Компонент для записи аудио с микрофона
-                # type="filepath" - функция будет получать путь к временному файлу
                 mic_input = gr.Audio(sources=["microphone"], type="filepath", label="Запись с микрофона")
-                # Компонент для выбора задачи (транскрибация или перевод)
                 task_mic = gr.Radio(["transcribe", "translate"], label="Задача", value="transcribe")
-            # Компонент для вывода результата транскрибации
             output_mic = gr.Textbox(label="Результат", lines=7) # Увеличили количество строк для текста
-            # Кнопка для запуска транскрибации с микрофона
             mic_button = gr.Button("Транскрибировать с микрофона")
         # Вкладка 2: Транскрибация из файла
         with gr.TabItem("Аудиофайл"):
             with gr.Row():
-                # Компонент для загрузки аудиофайла
-                # type="filepath" - функция будет получать путь к загруженному файлу
                 file_input = gr.Audio(sources=["upload"], type="filepath", label="Загрузить аудиофайл")
-                # Компонент для выбора задачи
                 task_file = gr.Radio(["transcribe", "translate"], label="Задача", value="transcribe")
-            # Компонент для вывода результата
             output_file = gr.Textbox(label="Результат", lines=7)
-            # Кнопка для запуска транскрибации файла
             file_button = gr.Button("Транскрибировать файл")
     # --- Привязка функций к кнопкам ---
-    # Связываем кнопку "Транскрибировать с микрофона" с функцией transcribe
     mic_button.click(
-        fn=transcribe,                     # Функция для вызова
-        inputs=[mic_input, task_mic],      # Входные компоненты (аудио и выбор задачи)
-        outputs=output_mic                 # Выходной компонент (текстовое поле)
     )
     # Связываем кнопку "Транскрибировать файл" с функцией transcribe
@@ -141,8 +124,5 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="blue", secondary_hue="neutra
     )
 # --- Запуск приложения ---
-# enable_queue=True - обрабатывает запросы последовательно, полезно для долгих задач
-# share=True - создает публичную ссылку (если нужно)
-# debug=True - включает режим отладки для вывода логов Gradio
 print("Запуск интерфейса Gradio...")
 demo.queue().launch(debug=True, share=False)

 import tempfile
 import os
+import time
 # --- Конфигурация ---
+HF_TOKEN = os.getenv("HF_ACCESS_TOKEN")
 MODEL_NAME = "artyomboyko/whisper-small-ru-v4"
 BATCH_SIZE = 8
+# FILE_LIMIT_MB = 1000
 # --- Инициализация ---
 try:
     if HF_TOKEN:
         login(token=HF_TOKEN)
     print(f"Модель {MODEL_NAME} успешно загружена.")
 except Exception as e:
     print(f"Ошибка при загрузке модели {MODEL_NAME}: {e}")
     exit()
 # --- Функции ---
 def transcribe(filepath, task):
     """
     Транскрибирует аудиофайл с помощью загруженной модели Whisper.
     print(f"Начало транскрибации файла: {filepath}, Задача: {task}")
     try:
         result = pipe(filepath, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)
         text = result["text"]
         print("Транскрибация завершена успешно.")
 # --- Создание интерфейса Gradio ---
 with gr.Blocks(theme=gr.themes.Default(primary_hue="blue", secondary_hue="neutral")) as demo:
     gr.Markdown(
         f"""
+        # Whisper: Транскрибация аудио
         Транскрибируйте длинные аудиозаписи (с микрофона или из файла) одним нажатием кнопки!
         Демо использует модель OpenAI Whisper [{MODEL_NAME}](https://huggingface.co/{MODEL_NAME})
         через библиотеку 🤗 Transformers для распознавания речи.
     # Создание вкладок
     with gr.Tabs():
         # Вкладка 1: Транскрибация с микрофона
         with gr.TabItem("Микрофон"):
+            with gr.Row():
                 mic_input = gr.Audio(sources=["microphone"], type="filepath", label="Запись с микрофона")
                 task_mic = gr.Radio(["transcribe", "translate"], label="Задача", value="transcribe")
             output_mic = gr.Textbox(label="Результат", lines=7) # Увеличили количество строк для текста
             mic_button = gr.Button("Транскрибировать с микрофона")
         # Вкладка 2: Транскрибация из файла
         with gr.TabItem("Аудиофайл"):
             with gr.Row():
                 file_input = gr.Audio(sources=["upload"], type="filepath", label="Загрузить аудиофайл")
                 task_file = gr.Radio(["transcribe", "translate"], label="Задача", value="transcribe")
             output_file = gr.Textbox(label="Результат", lines=7)
             file_button = gr.Button("Транскрибировать файл")
     # --- Привязка функций к кнопкам ---
+    # Связываем кнопку "Транскрибировать с микрофона" с функцией transcrib
     mic_button.click(
+        fn=transcribe,
+        inputs=[mic_input, task_mic],
+        outputs=output_mic
     )
     # Связываем кнопку "Транскрибировать файл" с функцией transcribe
     )
 # --- Запуск приложения ---
 print("Запуск интерфейса Gradio...")
 demo.queue().launch(debug=True, share=False)