Spaces:

zinoubm
/

Voice_Commands

Runtime error

@@ -29,16 +29,21 @@ def transcribe(audio, text):
         result = get_command(text, MODEL, id2label)
         return "Text provided by the user", text_respnses[result], None
     # Downsample original frequency to 16000hrz
-    input, rate = librosa.load(audio, sr=16000)
     # getting text transcription
-    inputs = processor(input, sampling_rate=rate, return_tensors="pt")
-    generated_ids = model.generate(
-        inputs["input_features"], attention_mask=inputs["attention_mask"]
-    )
-    transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
     result = get_command(transcription, MODEL, id2label)
     audio_res = resoponses.get(result)()

         result = get_command(text, MODEL, id2label)
         return "Text provided by the user", text_respnses[result], None
+    # getting text transcription
+    audio_file = open(audio, "rb")
+    transcription = openai.Audio.transcribe("whisper-1", audio_file, language="en")
+    transcription = transcription["text"]
     # Downsample original frequency to 16000hrz
+    # input, rate = librosa.load(audio, sr=16000)
     # getting text transcription
+    # inputs = processor(input, sampling_rate=rate, return_tensors="pt")
+    # generated_ids = model.generate(
+    #     inputs["input_features"], attention_mask=inputs["attention_mask"]
+    # )
+    # transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
     result = get_command(transcription, MODEL, id2label)
     audio_res = resoponses.get(result)()

constants.py CHANGED Viewed

@@ -37,8 +37,8 @@ text_respnses = {
     "cooled_seats_off": "Cooled seats deactivated",
 }
-model = Speech2TextForConditionalGeneration.from_pretrained(
-    "facebook/s2t-small-librispeech-asr"
-)
-processor = Speech2TextProcessor.from_pretrained("facebook/s2t-small-librispeech-asr")

     "cooled_seats_off": "Cooled seats deactivated",
 }
+# model = Speech2TextForConditionalGeneration.from_pretrained(
+#     "facebook/s2t-small-librispeech-asr"
+# )
+# processor = Speech2TextProcessor.from_pretrained("facebook/s2t-small-librispeech-asr")

flagged/log.csv CHANGED Viewed

@@ -7,3 +7,27 @@ C:\Users\admin\Desktop\DS JRP\Programming\Python\Portfolio\Voice_Commands\flagge
 ,my neck  need no more heating,,,2023-02-19 19:29:16.234959
 C:\Users\admin\Desktop\DS JRP\Programming\Python\Portfolio\Voice_Commands\flagged\component 0\tmp7zfrxwn1.wav,,,,2023-02-19 20:28:51.150010
 C:\Users\admin\Desktop\DS JRP\Programming\Python\Portfolio\Voice_Commands\flagged\component 0\tmpj9jcosbt.wav,,,,2023-02-19 20:29:16.601422

 ,my neck  need no more heating,,,2023-02-19 19:29:16.234959
 C:\Users\admin\Desktop\DS JRP\Programming\Python\Portfolio\Voice_Commands\flagged\component 0\tmp7zfrxwn1.wav,,,,2023-02-19 20:28:51.150010
 C:\Users\admin\Desktop\DS JRP\Programming\Python\Portfolio\Voice_Commands\flagged\component 0\tmpj9jcosbt.wav,,,,2023-02-19 20:29:16.601422
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpgp91h4bs.wav,,,,2023-03-03 10:48:05.204488
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpzxnv34e9.wav,,,,2023-03-03 11:00:04.470118
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp293krtcc.wav,,,,2023-03-03 11:05:18.409853
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp8w_dg0my.wav,,,,2023-03-03 11:06:13.151883
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp8uwv1dlh.wav,,,,2023-03-03 11:08:34.437979
+,,,,2023-03-03 11:09:59.046011
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpwerjyrhm.wav,,,,2023-03-03 11:10:14.290251
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp1msp3gk7.wav,,,,2023-03-03 11:11:04.122287
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpic0klrj5.wav,,,,2023-03-03 11:11:17.671385
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpvb2y2kk5.wav,,,,2023-03-03 11:11:31.502951
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp_sv03ta9.wav,,,,2023-03-03 11:11:52.200257
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpl6bjw0sw.wav,,,,2023-03-03 11:17:37.575339
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp7272239u.wav,,,,2023-03-03 11:18:02.333990
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp4fwibr34.wav,,,,2023-03-03 11:18:18.551143
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp3qcgcacy.wav,,,,2023-03-03 11:18:35.923342
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmplih8n03h.wav,,,,2023-03-03 11:51:57.253346
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpx7nz_jih.wav,,,,2023-03-03 11:52:11.455135
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpflbx1ja4.wav,,,,2023-03-03 11:52:28.437100
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmpcrult4_q.wav,,,,2023-03-03 11:52:39.450544
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmps1x6dtf2.wav,,,,2023-03-03 11:53:52.432486
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp_sseh3hk.wav,,,,2023-03-03 11:54:09.292486
+/home/boumaza/Desktop/Programming/Python/Voice_Commands/flagged/component 0/tmp68h39ev5.wav,,,,2023-03-03 11:54:26.488504
+,I'm cold,,,2023-03-04 10:42:40.559129
+,I'm cold,,,2023-03-04 10:44:49.418487