Spaces:

Respair
/

Darya_TTS

Running

App Files Files Community

Respair commited on 13 days ago

Commit

4059a52

verified ·

1 Parent(s): 45ef0fb

Update demo.py

Browse files

Files changed (1) hide show

demo.py +19 -21

demo.py CHANGED Viewed

@@ -184,30 +184,17 @@ with gr.Blocks() as audio_inf:
                                interactive=True,
                                type='filepath',
                                waveform_options={'waveform_color': '#a3ffc3', 'waveform_progress_color': '#e972ab'})
-            spk_id = gr.Number(label="Speaker ID (randomly picking a sample based on the ID - may result in subpar / broken audio)",
-                               info="Input speaker ID (max 196 Ru / 2006 En) to use a random sample from that speaker on the server. 9999 disables.",
-                               value=9999,
-                               interactive=True)
-            random_spk_btn = gr.Button("Random")
             with gr.Accordion("Advanced Parameters", open=False):
-                def update_audio_inf_defaults(is_english):
-                    new_text_value = en_random_texts_list[0] if is_english else ru_random_texts_list[0]
-                    new_spk_info = "Input speaker ID (max 2006 En) or use Randomize. 9999 disables." if is_english else "Input speaker ID (max 196 Ru) or use Randomize. 9999 disables."
-                    new_spk_val = 9999
-                    return gr.update(value=new_text_value), gr.update(info=new_spk_info, value=new_spk_val)
-                language_checkbox_audio.change(update_audio_inf_defaults,
-                                               inputs=[language_checkbox_audio],
-                                               outputs=[inp, spk_id])
-                random_spk_btn.click(fn=generate_random_spk, inputs=[language_checkbox_audio], outputs=spk_id)
                 beta = gr.Slider(minimum=0, maximum=1, value=0.7, step=0.1,
                                  label="Beta (Diffusion Strength vs. Reference)",
                                  info="Diffusion parameter. Higher means LESS like the reference audio. 0 disables diffusion.",
@@ -231,7 +218,6 @@ with gr.Blocks() as audio_inf:
                               label="T (Duration / Temperature)",
                               info="inflence of previous sentence on the current one",
                               interactive=True)
         with gr.Column(scale=1):
             btn = gr.Button("Synthesize (Voice Guided)", variant="primary")
@@ -240,6 +226,18 @@ with gr.Blocks() as audio_inf:
                              waveform_options={'waveform_color': '#a3ffc3', 'waveform_progress_color': '#e972ab'})
     btn.click(Client_Synthesize_Audio,
               inputs=[inp, voice, voice_2, spk_id, multispeakersteps, embscale, beta, rate_of_speech, t, language_checkbox_audio],
@@ -455,7 +453,7 @@ with gr.Blocks(title="The Poor Man's TTS (Experimental 🔧)", theme="Respair/Sh
     gr.TabbedInterface(
         [audio_inf, longform, info_tab, model_details_tab],
-        ['Voice-guided Synthesis', 'Text-guided Synthesis','Intuition & Tips', 'Model Details'],
         title="The Poor Man's TTS (Experimental)",
         theme="Respair/[email protected]"
     )

                                interactive=True,
                                type='filepath',
                                waveform_options={'waveform_color': '#a3ffc3', 'waveform_progress_color': '#e972ab'})
             with gr.Accordion("Advanced Parameters", open=False):
+                spk_id = gr.Number(label="Speaker ID (randomly picking a sample based on the ID - may result in subpar / broken audio)",
+                                   info="Input speaker ID (max 196 Ru / 2006 En) to use a random sample from that speaker on the server. 9999 disables.",
+                                   value=9999,
+                                   interactive=True)
+                random_spk_btn = gr.Button("Random")
                 beta = gr.Slider(minimum=0, maximum=1, value=0.7, step=0.1,
                                  label="Beta (Diffusion Strength vs. Reference)",
                                  info="Diffusion parameter. Higher means LESS like the reference audio. 0 disables diffusion.",
                               label="T (Duration / Temperature)",
                               info="inflence of previous sentence on the current one",
                               interactive=True)
         with gr.Column(scale=1):
             btn = gr.Button("Synthesize (Voice Guided)", variant="primary")
                              waveform_options={'waveform_color': '#a3ffc3', 'waveform_progress_color': '#e972ab'})
+    def update_audio_inf_defaults(is_english):
+        new_text_value = en_random_texts_list[0] if is_english else ru_random_texts_list[0]
+        new_spk_info = "Input speaker ID (max 2006 En) or use Randomize. 9999 disables." if is_english else "Input speaker ID (max 196 Ru) or use Randomize. 9999 disables."
+        new_spk_val = 9999
+        return gr.update(value=new_text_value), gr.update(info=new_spk_info, value=new_spk_val)
+    language_checkbox_audio.change(update_audio_inf_defaults,
+                                   inputs=[language_checkbox_audio],
+                                   outputs=[inp, spk_id])
+    random_spk_btn.click(fn=generate_random_spk, inputs=[language_checkbox_audio], outputs=spk_id)
     btn.click(Client_Synthesize_Audio,
               inputs=[inp, voice, voice_2, spk_id, multispeakersteps, embscale, beta, rate_of_speech, t, language_checkbox_audio],
     gr.TabbedInterface(
         [audio_inf, longform, info_tab, model_details_tab],
+        ['Voice-guided Synthesis','Text-guided Synthesis', 'Intuition & Tips', 'Model Details'],
         title="The Poor Man's TTS (Experimental)",
         theme="Respair/[email protected]"
     )