Spaces:

Emileo21
/

Ver_summarizer_to_textSpeech

Running

App Files Files Community

Ver_summarizer_to_textSpeech / app.py

Emileo21

Update app.py

49cba45 verified 4 days ago

raw

history blame contribute delete

2.27 kB

	# Realizado por Leonardo Vannoni Lorenzo para el curso de Deep Learning de INTEC, 1105795

	import gradio as gr
	from transformers import pipeline
	import torch
	from gtts import gTTS
	from PyPDF2 import PdfReader

	# --- Usar GPU si esta disponible ---
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

	# --- Resumidor multilingual ---
	summarizer = pipeline(
	"summarization",
	model="csebuetnlp/mT5_multilingual_XLSum",
	tokenizer="csebuetnlp/mT5_multilingual_XLSum",
	device=0 if torch.cuda.is_available() else -1
	)

	def summarize_and_speak(input_type, text_input, pdf_input):
	"""
	Resumir el input y devolver mensaje hablado.
	"""
	try:
	if input_type == "text": # Resumir el cuadro de texto
	text = text_input
	elif input_type == "pdf":
	reader = PdfReader(pdf_input.name) # Resumir el PDF
	text = ""
	for page in reader.pages:
	text += page.extract_text()
	else:
	raise ValueError("Invalid input type. Choose 'text' or 'pdf'.")

	# --- Usando el modelo de summarize ---
	summary = summarizer(
	text,
	max_length=2500,
	min_length=500,
	do_sample=False
	)[0]["summary_text"]

	tts = gTTS(text=summary, lang='es')
	tts.save("summary.mp3")
	return summary, "summary.mp3"
	except Exception as e:
	return f"An error occurred: {e}", None

	with gr.Blocks() as demo:
	gr.Markdown("## Resumen de Historias con Voz")

	with gr.Tab("Texto"):
	text_input = gr.Textbox(label="Introduce tu historia aquí")
	with gr.Tab("PDF"):
	pdf_input = gr.File(label="Sube tu archivo PDF", type="filepath")

	with gr.Row():
	text_output = gr.Textbox(label="Resumen")
	audio_output = gr.Audio(label="Resumen en Audio")

	submit_btn = gr.Button("Resumir y Convertir a Voz")

	input_type = gr.components.Radio(choices=["text", "pdf"], label="Tipo de entrada")
	input_type.value = "text"

	submit_btn.click(fn=summarize_and_speak,
	inputs=[input_type, text_input, pdf_input],
	outputs=[text_output, audio_output])

	demo.launch(share=True)