Spaces:

eduardmtz
/

www

Running

App Files Files Community

eduardmtz commited on Dec 18, 2024

Commit

ce79bba

verified ·

1 Parent(s): 2bcab4f

Create test2.html

Browse files

Files changed (1) hide show

test2.html +93 -0

test2.html ADDED Viewed

	@@ -0,0 +1,93 @@

+<!DOCTYPE html>
+<html lang="es">
+<head>
+    <meta charset="UTF-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1.0">
+    <title>Modelo de Preguntas y Respuestas sobre un PDF</title>
+    <script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs"></script>
+    <script src="https://cdnjs.cloudflare.com/ajax/libs/pdf.js/2.11.338/pdf.min.js"></script>
+    <script src="https://cdn.jsdelivr.net/npm/@huggingface/transformers"></script>
+</head>
+<body>
+    <h1>Modelo de Preguntas y Respuestas sobre un PDF</h1>
+    <input type="file" id="pdfInput" />
+    <button onclick="procesarPDF()">Cargar PDF</button>
+    <h2>Preguntar sobre el PDF</h2>
+    <input type="text" id="inputPregunta" placeholder="Escribe tu pregunta aquí">
+    <button onclick="responderPregunta()">Hacer pregunta</button>
+    <h3>Respuesta:</h3>
+    <div id="respuesta"></div>
+    <script>
+        // Variable global para almacenar el texto del PDF
+        let textoPDF = "";
+        // Cargar y procesar el archivo PDF
+        async function procesarPDF() {
+            const archivo = document.getElementById("pdfInput").files[0];
+            if (archivo) {
+                const archivoPDF = await leerPDF(archivo);
+                textoPDF = archivoPDF.join(" ");
+                alert("PDF cargado y procesado.");
+            }
+        }
+        // Leer y extraer el texto del archivo PDF
+        async function leerPDF(archivo) {
+            const lector = new FileReader();
+            return new Promise((resolve, reject) => {
+                lector.onload = async function (e) {
+                    const arrayBuffer = e.target.result;
+                    const pdf = await pdfjsLib.getDocument(arrayBuffer).promise;
+                    let texto = [];
+                    for (let i = 1; i <= pdf.numPages; i++) {
+                        const pagina = await pdf.getPage(i);
+                        const contenido = await pagina.getTextContent();
+                        const textoPagina = contenido.items.map(item => item.str).join(" ");
+                        texto.push(textoPagina);
+                    }
+                    resolve(texto);
+                };
+                lector.onerror = reject;
+                lector.readAsArrayBuffer(archivo);
+            });
+        }
+        // Función para responder una pregunta utilizando el texto del PDF
+        async function responderPregunta() {
+            const pregunta = document.getElementById("inputPregunta").value;
+            if (!textoPDF) {
+                alert("Por favor, cargue un PDF primero.");
+                return;
+            }
+            // Tokenizar la pregunta y el contexto
+            const question = pregunta;
+            const context = textoPDF;
+            // Usar un modelo preentrenado como BERT o T5 de HuggingFace
+            const response = await obtenerRespuestaDeModelo(question, context);
+            // Mostrar la respuesta
+            document.getElementById("respuesta").innerText = "Respuesta: " + response;
+        }
+        // Función para obtener respuesta utilizando el modelo de Hugging Face
+        async function obtenerRespuestaDeModelo(question, context) {
+            const model = await transformers.BertForQuestionAnswering.from_pretrained('bert-large-uncased-whole-word-masking-finetuned-squad');
+            const tokenizer = await transformers.BertTokenizer.from_pretrained('bert-large-uncased-whole-word-masking-finetuned-squad');
+            const inputs = tokenizer.encode_plus(question, context, { add_special_tokens: true, return_tensors: 'pt' });
+            const output = await model(inputs);
+            const answer_start = output.start_logits.argmax();
+            const answer_end = output.end_logits.argmax();
+            const answer = tokenizer.decode(inputs.input_ids.slice(answer_start, answer_end + 1));
+            return answer;
+        }
+    </script>
+</body>
+</html>