Spaces:

lozanopastor
/

PDFChat

Running

App Files Files Community

lozanopastor commited on Mar 31

Commit

3813ca8

verified ·

1 Parent(s): 23aeff8

Update app.py

Browse files

Files changed (1) hide show

app.py +92 -88

app.py CHANGED Viewed

@@ -39,33 +39,32 @@ css_style = """
         border-radius: 5px;
         border: 1px solid #ccc;
     }
-    .sugerencias-box {
-        padding: 15px;
-        background-color: #fff;
-        border-radius: 10px;
         border: 1px solid #e0e0e0;
         margin: 10px 0;
     }
-    .suggestion-button {
         width: 100%;
-        text-align: left;
-        margin: 5px 0;
-        padding: 10px;
         border-radius: 5px;
-        border: 1px solid #e0e0e0;
-        background-color: #f8f9fa;
         cursor: pointer;
-        transition: all 0.3s;
     }
-    .suggestion-button:hover {
-        background-color: #e9ecef;
-        border-color: #ced4da;
     }
 </style>
 """
 def eliminar_proceso_pensamiento(texto):
-    texto_limpio = re.sub(r'', '', texto, flags=re.DOTALL)
     lineas = [line.strip() for line in texto_limpio.split('\n') if line.strip()]
     return lineas[-1] if lineas else "Respuesta no disponible"
@@ -109,9 +108,9 @@ def get_conversational_chain():
 def extract_metadata(vector_store):
     metadata_questions = {
-        "title": "¿Cual es o podría ser el título del documento? Redacta una sola frase",
-        "entity": "¿A qué entidad u organización pertenece este documento?",
-        "date": "¿En qué fecha se implantará el contenido? Si no se detalla responde \"No se especifica\""
     }
     metadata = {}
@@ -132,38 +131,19 @@ def mostrar_respuesta(texto):
     with st.container():
         st.markdown(f'<div class="response-box">{texto}</div>', unsafe_allow_html=True)
-def procesar_consulta(user_question):
-    if 'vector_store' not in st.session_state:
-        st.error("Por favor carga un documento primero")
-        return
-    chain = get_conversational_chain()
-    docs = st.session_state.vector_store.similarity_search(user_question)
-    with st.spinner("Analizando documento..."):
-        response = chain(
-            {"input_documents": docs, "question": user_question},
-            return_only_outputs=True
-        )
-    respuesta_final = eliminar_proceso_pensamiento(response['output_text'])
-    mostrar_respuesta(respuesta_final)
 def generar_sugerencias():
-    """Genera preguntas sugeridas usando los chunks más relevantes del documento"""
     if 'vector_store' not in st.session_state:
         return []
     try:
-        # Obtener los fragmentos más relevantes
         docs = st.session_state.vector_store.similarity_search("", k=3)
         context = "\n".join([doc.page_content for doc in docs])
-        # Prompt para generación de sugerencias
         prompt_template = """
-        Basado en el siguiente contexto, genera exactamente 3 preguntas simples en español.
-        Las preguntas deben ser muy generales, fáciles de entender y no específicas.
-        Formato: Cada pregunta debe ser breve (menos de 8 palabras).
         Contexto:
         {context}
@@ -173,39 +153,54 @@ def generar_sugerencias():
         """
         model = ChatGroq(
-            temperature=0.7,
             model_name="deepseek-r1-distill-llama-70b",
             groq_api_key=os.getenv("GROQ_API_KEY")
         )
         response = model.invoke(prompt_template.format(context=context))
-        # Procesar la respuesta para extraer las preguntas
         preguntas = []
         for line in response.content.split("\n"):
-            if line.strip() and any(c.isdigit() for c in line[:3]):
-                pregunta = line.split('.', 1)[1].strip() if '.' in line else line.strip()
                 if pregunta:
-                    preguntas.append(pregunta)
-        return preguntas[:3]  # Asegurar máximo 3 preguntas
     except Exception as e:
         st.error(f"Error generando sugerencias: {str(e)}")
         return []
 def main():
     st.set_page_config(page_title="PDF Consultor 🔍", page_icon="🔍", layout="wide")
     st.title("PDF Consultor 🔍")
     st.markdown(css_style, unsafe_allow_html=True)
-    # Inicializa estados de sesión
-    if 'documento_cargado' not in st.session_state:
-        st.session_state.documento_cargado = False
-    if 'sugerencias' not in st.session_state:
-        st.session_state.sugerencias = []
-    if 'pregunta_actual' not in st.session_state:
-        st.session_state.pregunta_actual = ""
     # Sidebar - Carga de documentos
     with st.sidebar:
@@ -217,7 +212,7 @@ def main():
             label_visibility="collapsed"
         )
-    # Procesamiento automático al cargar documentos
     if pdf_docs and not st.session_state.documento_cargado:
         with st.spinner("Analizando documento..."):
             try:
@@ -235,62 +230,71 @@ def main():
             except Exception as e:
                 st.error(f"Error procesando documento: {str(e)}")
-    # Mostrar metadatos
     if 'metadata' in st.session_state:
         st.markdown("---")
         cols = st.columns(3)
-        campos = [
             ("📄 Título", "title"),
             ("🏛️ Entidad", "entity"),
-            ("📅 Fecha Implantación", "date")
         ]
-        for col, (icono, key) in zip(cols, campos):
             with col:
                 st.markdown(f"""
                 <div class="metadata-box">
-                    <div class="metadata-title">{icono}</div>
                     {st.session_state.metadata[key]}
                 </div>
                 """, unsafe_allow_html=True)
-        # Mostrar sugerencias
         if st.session_state.sugerencias:
             st.markdown("---")
-            st.subheader("💡 Preguntas sugeridas:")
-            for i, pregunta in enumerate(st.session_state.sugerencias, 1):
-                if st.button(
-                    pregunta,
-                    key=f"sug_{i}",
-                    help=f"Haz clic para usar esta pregunta",
-                    use_container_width=True
-                ):
-                    # Guardar la pregunta seleccionada en el estado de sesión
-                    st.session_state.pregunta_actual = pregunta
-            st.markdown("---")
-    # Interfaz de consultas
     if st.session_state.documento_cargado:
-        with st.form("consulta_form"):
             col1, col2 = st.columns([5, 1])
             with col1:
-                user_question = st.text_input(
                     "Escribe tu pregunta:",
-                    placeholder="Ej: ¿Qué normativa regula este proceso?",
-                    value=st.session_state.pregunta_actual,  # Mostrar la pregunta seleccionada si existe
-                    key="input_pregunta"
                 )
             with col2:
                 enviar = st.form_submit_button("Enviar ▶")
-        # Procesar la pregunta seleccionada o introducida manualmente
-        if enviar or (st.session_state.pregunta_actual and not enviar):
-            procesar_consulta(user_question or st.session_state.pregunta_actual)
-            # Limpiar la pregunta actual después de procesarla
-            if "pregunta_actual" in st.session_state:
-                del st.session_state.pregunta_actual
-    else:
-        st.write("Por favor, sube un documento para continuar.")

         border-radius: 5px;
         border: 1px solid #ccc;
     }
+    .suggestion-container {
         border: 1px solid #e0e0e0;
+        border-radius: 8px;
+        padding: 15px;
         margin: 10px 0;
+        background: #f8f9fa;
     }
+    .suggestion-btn {
         width: 100%;
+        margin: 3px 0;
+        padding: 8px;
         border-radius: 5px;
+        border: 1px solid #252850;
+        background: white;
         cursor: pointer;
+        transition: all 0.2s;
     }
+    .suggestion-btn:hover {
+        background: #252850;
+        color: white;
     }
 </style>
 """
 def eliminar_proceso_pensamiento(texto):
+    texto_limpio = re.sub(r'<.*?>', '', texto, flags=re.DOTALL)
     lineas = [line.strip() for line in texto_limpio.split('\n') if line.strip()]
     return lineas[-1] if lineas else "Respuesta no disponible"
 def extract_metadata(vector_store):
     metadata_questions = {
+        "title": "¿Cuál es el título principal del documento?",
+        "entity": "¿A qué organización pertenece este documento?",
+        "date": "¿Qué fecha clave se menciona en el documento?"
     }
     metadata = {}
     with st.container():
         st.markdown(f'<div class="response-box">{texto}</div>', unsafe_allow_html=True)
 def generar_sugerencias():
+    """Genera preguntas sugeridas simples y generales"""
     if 'vector_store' not in st.session_state:
         return []
     try:
         docs = st.session_state.vector_store.similarity_search("", k=3)
         context = "\n".join([doc.page_content for doc in docs])
         prompt_template = """
+        Genera 3 preguntas simples en español basadas en este contexto.
+        Las preguntas deben ser generales y fáciles de entender.
+        Formato: Lista numerada sin explicaciones.
         Contexto:
         {context}
         """
         model = ChatGroq(
+            temperature=0.4,
             model_name="deepseek-r1-distill-llama-70b",
             groq_api_key=os.getenv("GROQ_API_KEY")
         )
         response = model.invoke(prompt_template.format(context=context))
         preguntas = []
         for line in response.content.split("\n"):
+            line = line.strip()
+            if line and line[0].isdigit():
+                pregunta = line.split('. ', 1)[1] if '. ' in line else line[2:]
                 if pregunta:
+                    preguntas.append(pregunta[:60])
+        return preguntas[:3]
     except Exception as e:
         st.error(f"Error generando sugerencias: {str(e)}")
         return []
+def procesar_consulta(user_question):
+    if 'vector_store' not in st.session_state:
+        st.error("Por favor carga un documento primero")
+        return
+    chain = get_conversational_chain()
+    docs = st.session_state.vector_store.similarity_search(user_question)
+    with st.spinner("Analizando documento..."):
+        response = chain(
+            {"input_documents": docs, "question": user_question},
+            return_only_outputs=True
+        )
+    respuesta_final = eliminar_proceso_pensamiento(response['output_text'])
+    mostrar_respuesta(respuesta_final)
 def main():
     st.set_page_config(page_title="PDF Consultor 🔍", page_icon="🔍", layout="wide")
     st.title("PDF Consultor 🔍")
     st.markdown(css_style, unsafe_allow_html=True)
+    # Estados de sesión
+    estados_requeridos = ['documento_cargado', 'sugerencias', 'pregunta_actual']
+    for estado in estados_requeridos:
+        if estado not in st.session_state:
+            st.session_state[estado] = False if estado == 'documento_cargado' else []
     # Sidebar - Carga de documentos
     with st.sidebar:
             label_visibility="collapsed"
         )
+    # Procesamiento de documentos
     if pdf_docs and not st.session_state.documento_cargado:
         with st.spinner("Analizando documento..."):
             try:
             except Exception as e:
                 st.error(f"Error procesando documento: {str(e)}")
+    # Sección principal
     if 'metadata' in st.session_state:
+        # Mostrar metadatos
         st.markdown("---")
         cols = st.columns(3)
+        campos_metadata = [
             ("📄 Título", "title"),
             ("🏛️ Entidad", "entity"),
+            ("📅 Fecha clave", "date")
         ]
+        for col, (icono, key) in zip(cols, campos_metadata):
             with col:
                 st.markdown(f"""
                 <div class="metadata-box">
+                    <div style="font-size:16px; margin-bottom:10px;">{icono}</div>
                     {st.session_state.metadata[key]}
                 </div>
                 """, unsafe_allow_html=True)
+        # Sugerencias
         if st.session_state.sugerencias:
             st.markdown("---")
+            with st.container():
+                st.markdown("""
+                <div class="suggestion-container">
+                    <div style="font-size:14px; color:#666; margin-bottom:8px;">💡 ¿Necesitas ideas?</div>
+                """, unsafe_allow_html=True)
+                cols_sugerencias = st.columns(3)
+                for i, (col, pregunta) in enumerate(zip(cols_sugerencias, st.session_state.sugerencias)):
+                    with col:
+                        if st.button(
+                            pregunta,
+                            key=f"sug_{i}",
+                            help="Haz clic para usar esta pregunta",
+                            use_container_width=True
+                        ):
+                            st.session_state.pregunta_actual = pregunta
+                st.markdown("</div>", unsafe_allow_html=True)
+    # Formulario de consulta
     if st.session_state.documento_cargado:
+        with st.form(key="consulta_form"):
             col1, col2 = st.columns([5, 1])
             with col1:
+                pregunta_usuario = st.text_input(
                     "Escribe tu pregunta:",
+                    value=st.session_state.get('pregunta_actual', ''),
+                    placeholder="Ej: ¿De qué trata este documento?",
+                    label_visibility="collapsed"
                 )
             with col2:
+                st.markdown("<br>", unsafe_allow_html=True)
                 enviar = st.form_submit_button("Enviar ▶")
+            if enviar or st.session_state.pregunta_actual:
+                pregunta_final = pregunta_usuario or st.session_state.pregunta_actual
+                procesar_consulta(pregunta_final)
+                if 'pregunta_actual' in st.session_state:
+                    del st.session_state.pregunta_actual
+    elif not st.session_state.documento_cargado:
+        st.info("Por favor, sube un documento PDF para comenzar.")
+if __name__ == "__main__":
+    main()