Spaces:

tahirsher
/

ASR_Model_for_Transcription_into_Text

Sleeping

tahirsher commited on Mar 10

Commit

a4a32f2

verified ·

1 Parent(s): 3c21932

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -85,8 +85,13 @@ if audio_file:
     # ================================
     # ✅ Fast Transcription Processing with Conformer
     # ================================
     inputs = processor(denoised_waveform.numpy(), sampling_rate=sr, return_tensors="pt", padding=True).to("cuda" if torch.cuda.is_available() else "cpu")
     with torch.no_grad():
         logits = model(**inputs).logits

     # ================================
     # ✅ Fast Transcription Processing with Conformer
     # ================================
+    # Convert waveform into the required format
     inputs = processor(denoised_waveform.numpy(), sampling_rate=sr, return_tensors="pt", padding=True).to("cuda" if torch.cuda.is_available() else "cpu")
+    # Make sure the input has batch dimension (even if it's one example)
+    if len(inputs.input_values.shape) == 1:
+        inputs.input_values = inputs.input_values.unsqueeze(0)
     with torch.no_grad():
         logits = model(**inputs).logits