Spaces:

Add-Vishnu
/

Meta_mms_ASR

Runtime error

Add-Vishnu commited on Nov 2, 2023

Commit

9ba53c0

1 Parent(s): 98f5625

Update asr.py

Files changed (1) hide show

asr.py CHANGED Viewed

@@ -20,15 +20,15 @@ def resample_to_16k(audio, orig_sr):
 def transcribe(audio):
     print(audio)
-    audio = librosa.load(audio, sr=16_000, mono=True)[0]
-    print("After loading: ",audio)
     sr,y = audio
     y = y.astype(np.float32)
     y /= np.max(np.abs(y))
     y_resampled = resample_to_16k(y, sr)
     print("Without using librosa to load:",y_resampled)
-    inputs = processor(audio, sampling_rate=16_000,return_tensors="pt")
-    # inputs = processor(y_resampled, sampling_rate=16_000,return_tensors="pt")
     with torch.no_grad():
         tr_start_time = time.time()
         outputs = model(**inputs).logits

 def transcribe(audio):
     print(audio)
+    # audio = librosa.load(audio, sr=16_000, mono=True)[0]
+    # print("After loading: ",audio)
     sr,y = audio
     y = y.astype(np.float32)
     y /= np.max(np.abs(y))
     y_resampled = resample_to_16k(y, sr)
     print("Without using librosa to load:",y_resampled)
+    # inputs = processor(audio, sampling_rate=16_000,return_tensors="pt")
+    inputs = processor(y_resampled, sampling_rate=16_000,return_tensors="pt")
     with torch.no_grad():
         tr_start_time = time.time()
         outputs = model(**inputs).logits