Spaces:

MrOvkill
/

Chowza

Sleeping

Samuel L Meyers commited on Nov 16, 2023

Commit

9dd385e

1 Parent(s): 8688550

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,19 +1,20 @@
 import gradio as gr
-from transformers import AutoProcessor, BarkModel
-import scipy
 import torch
-processor = AutoProcessor.from_pretrained("suno/bark-small")
-model = BarkModel.from_pretrained("suno/bark-small")
 def greet(text):
-    inputs = processor(
-        text=[text],
-        return_tensors="pt",
-    )
-    speech_values = model.generate(**inputs, do_sample=True, num_beams=5)
-    scipy.io.wavfile.write("tmp.wav", rate=24000, data=speech_values.cpu().numpy().squeeze())
-    return open("tmp.wav", "rb").read()
 iface = gr.Interface(fn=greet, inputs="text", outputs="audio")
 iface.launch()

 import gradio as gr
+from transformers import VitsModel, AutoTokenizer
 import torch
+import scipy.io.wavfile as wavfile
+model = VitsModel.from_pretrained("facebook/mms-tts-eng")
+tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-eng")
+text = "some example text in the English language"
 def greet(text):
+    inputs = tokenizer(text, return_tensors="pt")
+    with torch.no_grad():
+        output = model(**inputs).waveform
+        out = output[0]
+        wavfile.write("tmp.wav", rate=16000, data=out)
+        return open("tmp.wav", "rb").read()
 iface = gr.Interface(fn=greet, inputs="text", outputs="audio")
 iface.launch()