Spaces:

Banafo
/

Kroko-Streaming-ASR-Python

Running

Banafo commited on Mar 27

Commit

9a22924

verified ·

1 Parent(s): 5756e90

Update app.py

Add Spanish to options

Files changed (1) hide show

app.py CHANGED Viewed

@@ -36,6 +36,16 @@ recognizer_de = OnlineRecognizer.from_transducer(
     debug=False
 )
 def transcribe_audio_online_streaming(file, language):
     """Generator for file transcription"""
     if file is None:
@@ -50,6 +60,8 @@ def transcribe_audio_online_streaming(file, language):
                 recognizer = recognizer_fr
             case "German":
                 recognizer = recognizer_de
         waveform, sample_rate = torchaudio.load(file.name)
         if sample_rate != 16000:
@@ -112,6 +124,8 @@ def transcribe_microphone_stream(audio_chunk, stream_state, language):
                 recognizer = recognizer_fr
             case "German":
                 recognizer = recognizer_de
         if audio_chunk is None:  # End of stream
             if stream_state is not None:
@@ -164,7 +178,7 @@ def transcribe_microphone_stream(audio_chunk, stream_state, language):
 def create_app():
     with gr.Blocks() as app:
         gr.Markdown("# Real-time Speech Recognition")
-        language_choice = gr.Radio(choices=["English", "French", "German"], label="Select Language", value="English")
         with gr.Tabs():
             with gr.Tab("File Transcription"):

     debug=False
 )
+recognizer_es = OnlineRecognizer.from_transducer(
+    tokens="es_tokens.txt",
+    encoder="es_encoder.onnx",
+    decoder="es_decoder.onnx",
+    joiner="es_joiner.onnx",
+    num_threads=1,
+    decoding_method="modified_beam_search",
+    debug=False
+)
 def transcribe_audio_online_streaming(file, language):
     """Generator for file transcription"""
     if file is None:
                 recognizer = recognizer_fr
             case "German":
                 recognizer = recognizer_de
+            case "Spanish":
+                recognizer = recognizer_es
         waveform, sample_rate = torchaudio.load(file.name)
         if sample_rate != 16000:
                 recognizer = recognizer_fr
             case "German":
                 recognizer = recognizer_de
+            case "Spanish":
+                recognizer = recognizer_es
         if audio_chunk is None:  # End of stream
             if stream_state is not None:
 def create_app():
     with gr.Blocks() as app:
         gr.Markdown("# Real-time Speech Recognition")
+        language_choice = gr.Radio(choices=["English", "French", "German", "Spanish"], label="Select Language", value="English")
         with gr.Tabs():
             with gr.Tab("File Transcription"):