Spaces:

zinoubm
/

Voice_Commands

Runtime error

zinoubm commited on Feb 18, 2023

Commit

0013d95

1 Parent(s): 867485b

initial commit

Files changed (3) hide show

.env ADDED Viewed


1	+ OPENAI_API_KEY = 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
2	+ MODEL = ada:ft-personal-2023-02-17-17-56-33

app.py ADDED Viewed

+import os
+import gradio as gr
+import numpy as np
+import librosa
+import torch
+from transformers import Speech2TextProcessor, Speech2TextForConditionalGeneration
+from dotenv import load_dotenv
+load_dotenv()
+os.environ["PATH"] += ".\env\Lib\site-packages\ffprobe"
+OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
+MODEL = os.getenv("MODEL")
+model = Speech2TextForConditionalGeneration.from_pretrained(
+    "facebook/s2t-small-librispeech-asr"
+)
+processor = Speech2TextProcessor.from_pretrained("facebook/s2t-small-librispeech-asr")
+def transcribe(audio):
+    input, rate = librosa.load(
+        audio, sr=16000
+    )  # Downsample original frequency to 16000hrz
+    inputs = processor(input, sampling_rate=rate, return_tensors="pt")
+    generated_ids = model.generate(
+        inputs["input_features"], attention_mask=inputs["attention_mask"]
+    )
+    transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)
+    return transcription
+gr.Interface(
+    fn=transcribe, inputs=gr.Audio(source="microphone", type="filepath"), outputs="text"
+).launch()

requirements.txt ADDED Viewed

+gradio
+torchaudio
+sentencepiece
+transformers
+openai
+sounddevice
+librosa
+dotenv
+ffmpeg
+ffprobe