Spaces:

Bils
/

AIPromoStudio

Sleeping

App Files Files Community

Bils commited on Jan 12

Commit

3b58485

verified ·

1 Parent(s): 3168a3e

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -9

app.py CHANGED Viewed

@@ -51,6 +51,7 @@ def generate_script(user_prompt: str, model_id: str, token: str):
 # Load MusicGen Model (Encapsulated)
 # ---------------------------------------------------------------------
 @spaces.GPU(duration=300)
 def generate_audio(prompt: str, audio_length: int):
     try:
         musicgen_model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-small")
@@ -59,19 +60,21 @@ def generate_audio(prompt: str, audio_length: int):
         musicgen_model.to("cuda")
         inputs = musicgen_processor(text=[prompt], padding=True, return_tensors="pt")
         outputs = musicgen_model.generate(**inputs, max_new_tokens=audio_length)
-        musicgen_model.to("cpu")  # Return the model to CPU
         sr = musicgen_model.config.audio_encoder.sampling_rate
         audio_data = outputs[0, 0].cpu().numpy()
         normalized_audio = (audio_data / max(abs(audio_data)) * 32767).astype("int16")
-        with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as temp_wav:
-            write(temp_wav.name, sr, normalized_audio)
-            return temp_wav.name
     except Exception as e:
         return f"Error generating audio: {e}"
 # ---------------------------------------------------------------------
 # Gradio Interface Functions
 # ---------------------------------------------------------------------
@@ -127,12 +130,11 @@ with gr.Blocks() as demo:
             value=512,
             info="Select the desired audio token length."
         )
-    generate_audio_button = gr.Button("Generate Audio 🎶")
     audio_output = gr.Audio(
-        label="🎶 Generated Audio File",
-        type="filepath",
-        interactive=False
-    )
     # Footer
     gr.Markdown("""

 # Load MusicGen Model (Encapsulated)
 # ---------------------------------------------------------------------
 @spaces.GPU(duration=300)
+@spaces.GPU(duration=300)
 def generate_audio(prompt: str, audio_length: int):
     try:
         musicgen_model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-small")
         musicgen_model.to("cuda")
         inputs = musicgen_processor(text=[prompt], padding=True, return_tensors="pt")
         outputs = musicgen_model.generate(**inputs, max_new_tokens=audio_length)
+        musicgen_model.to("cpu")
         sr = musicgen_model.config.audio_encoder.sampling_rate
         audio_data = outputs[0, 0].cpu().numpy()
         normalized_audio = (audio_data / max(abs(audio_data)) * 32767).astype("int16")
+        output_path = f"{tempfile.gettempdir()}/generated_audio.wav"
+        write(output_path, sr, normalized_audio)
+        return output_path
     except Exception as e:
         return f"Error generating audio: {e}"
 # ---------------------------------------------------------------------
 # Gradio Interface Functions
 # ---------------------------------------------------------------------
             value=512,
             info="Select the desired audio token length."
         )
     audio_output = gr.Audio(
+    label="🎶 Generated Audio File",
+    type="file",
+    interactive=False
+)
     # Footer
     gr.Markdown("""