Spaces:

Jiaofeng
/

parakeet-ctc-0.6b

Runtime error

jiaofengxu commited on Jun 14, 2024

Commit

bc83513

1 Parent(s): a90f28f

nvidia VR

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,9 +1,14 @@
 from transformers import pipeline
 import gradio as gr
 #model = pipeline("automatic-speech-recognition")
 #model = pipeline("automatic-speech-recognition", model="openai/whisper-base.en")
-model = pipeline("automatic-speech-recognition", model="models/nvidia/parakeet-ctc-0.6b")
 def transcribe_audio(mic=None, file=None):
     if mic is not None:
@@ -12,7 +17,8 @@ def transcribe_audio(mic=None, file=None):
         audio = file
     else:
         return "You must either provide a mic recording or a file"
-    transcription = model(audio)["text"]
     return transcription

 from transformers import pipeline
 import gradio as gr
+import nemo.collections.asr as nemo_asr
 #model = pipeline("automatic-speech-recognition")
 #model = pipeline("automatic-speech-recognition", model="openai/whisper-base.en")
+#model = pipeline("automatic-speech-recognition", model="nvidia/parakeet-ctc-0.6b")
+asr_model = nemo_asr.models.EncDecCTCModelBPE.from_pretrained(model_name="nvidia/parakeet-ctc-1.1b")
 def transcribe_audio(mic=None, file=None):
     if mic is not None:
         audio = file
     else:
         return "You must either provide a mic recording or a file"
+    #transcription = model(audio)["text"]
+    transcription = asr_model(audio)
     return transcription

requirements.txt CHANGED Viewed

@@ -1,2 +1,3 @@
 transformers
-torch

 transformers
+torch
+nemo_toolkit['all']