Spaces:

GetmanY1
/

sami_asr

Running

GetmanY1 commited on Apr 2

Commit

cf20a06

1 Parent(s): 7e6e084

Fix audio loading script

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,9 +1,15 @@
 import gradio as gr
 from transformers import pipeline
-from librosa import load
 def transcribe(input_audio):
-    speech, _ = load(input_audio, sr=16000, mono=True)
     output = pipe(speech, chunk_length_s=30, stride_length_s=5)['text']
     return output

 import gradio as gr
 from transformers import pipeline
+from librosa import resample
 def transcribe(input_audio):
+    sr, speech = input_audio
+    # Convert to mono if stereo
+    if speech.ndim > 1:
+        speech = speech.mean(axis=1)
+    # Resample if sampling rate is not 16kHz
+    if sr!=16000:
+        speech = librosa.resample(speech, orig_sr=sr, target_sr=16000)
     output = pipe(speech, chunk_length_s=30, stride_length_s=5)['text']
     return output

requirements.txt CHANGED Viewed

@@ -1,3 +1,5 @@
 transformers
 torch
-librosa

 transformers
 torch
+librosa
+samplerate
+resampy