Spaces:

alonsosilva
/

whispercpp

Sleeping

App Files Files Community

alonsosilva commited on Feb 7

Commit

03485f2

1 Parent(s): 6d38cdf

Add task

Browse files

Files changed (1) hide show

app.py +37 -24

app.py CHANGED Viewed

@@ -4,11 +4,14 @@ import numpy as np
 from ipywebrtc import AudioRecorder, CameraStream, AudioStream
 from tempfile import NamedTemporaryFile
 from pywhispercpp.model import Model
-whisper_models = ['tiny.en-q8_0', "base.en-q5_1", "small.en-q5_1"]
 whisper_model = solara.reactive("tiny.en-q8_0")
 transcription = solara.reactive("")
 generation_time = solara.reactive("")
 @solara.component
 def Page():
     with solara.Sidebar():
@@ -19,29 +22,39 @@ def Page():
             solara.Markdown(f"#{title}")
             solara.Markdown("## Send a voice message")
             solara.Markdown("### Recorder")
-            w = Model(whisper_model.value)
             camera = CameraStream(constraints={'audio': True,'video':False})
             recorder = AudioRecorder(stream=camera)
             display(recorder)
-            def MyButton():
-                def transcribe_voice():
-                    transcription.value = ""
-                    generation_time.value = ""
-                    with NamedTemporaryFile(suffix=".webm") as temp:
-                        with open(f"{temp.name}", 'wb') as f:
-                            f.write(recorder.audio.value)
-                        start_time = time.time()
-                        segments = w.transcribe(f"{temp.name}")
-                        for segment in segments:
-                            transcription.value += segment.text
-                        end_time = time.time()
-                        generation_time.value = np.round(end_time - start_time, 2)
-                    transcription.value += " "
-                with solara.Row():
-                    solara.Button("Send voice message", on_click=transcribe_voice)
-                    solara.Select(label="Select model:", value=whisper_model, values=whisper_models, style="width: 10%")
-            MyButton()
-    solara.Markdown(f"### Transcription:")
-    solara.Text(f"{transcription.value}", style="color: blue; font-size: 1.5rem")
-    if generation_time.value != "":
-        solara.Text(f"Generation time: {generation_time.value} seconds", style="color: blue; position: fixed; bottom: 8rem")

 from ipywebrtc import AudioRecorder, CameraStream, AudioStream
 from tempfile import NamedTemporaryFile
 from pywhispercpp.model import Model
+from solara.lab import use_task, Task
+whisper_models = ["tiny.en-q5_1", "tiny.en-q8_0","tiny.en", "base.en-q5_1", "base.en", "small.en-q5_1", "small.en"]
 whisper_model = solara.reactive("tiny.en-q8_0")
+current_whisper_model = solara.reactive("tiny.en-q8_0")
 transcription = solara.reactive("")
 generation_time = solara.reactive("")
+w = Model('tiny.en-q8_0')
 @solara.component
 def Page():
     with solara.Sidebar():
             solara.Markdown(f"#{title}")
             solara.Markdown("## Send a voice message")
             solara.Markdown("### Recorder")
+            with solara.Row():
+                def load_model():
+                    w = Model(whisper_model.value)
+                    current_whisper_model.value = whisper_model.value
+                    return 1
+                solara.Select(label="Select model:", value=whisper_model, values=whisper_models, style="width: 10%")
+                #solara.Button("Load model", on_click=load_model)
+            result : Task[int] = use_task(load_model, dependencies=[whisper_model.value])
+            if result.finished:
+                solara.Success(f"Current model: {current_whisper_model.value}")
+            else:
+                solara.ProgressLinear(result.pending)
             camera = CameraStream(constraints={'audio': True,'video':False})
             recorder = AudioRecorder(stream=camera)
+            recorder.playing = False
             display(recorder)
+            def transcribe_voice():
+                transcription.value = ""
+                generation_time.value = ""
+                with NamedTemporaryFile(suffix=".webm") as temp:
+                    with open(f"{temp.name}", 'wb') as f:
+                        f.write(recorder.audio.value)
+                    start_time = time.time()
+                    segments = w.transcribe(f"{temp.name}")
+                    for segment in segments:
+                        transcription.value += segment.text
+                    end_time = time.time()
+                    generation_time.value = np.round(end_time - start_time, 2)
+                transcription.value += " "
+            with solara.Row():
+                solara.Button("Send voice message", on_click=transcribe_voice)
+    with solara.Column(style="padding: 50px"):
+        solara.Markdown(f"### Transcription:")
+        solara.Text(f"{transcription.value}", style="color: blue; font-size: 1.5rem")
+        if generation_time.value != "":
+            solara.Text(f"Generation time: {generation_time.value} seconds", style="color: blue; position: fixed; bottom: 8rem")