Spaces:

pmelnechuk
/

QAMath

Sleeping

App Files Files Community

pmelnechuk commited on Feb 27

Commit

1515275

verified ·

1 Parent(s): 4d1e547

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -31

app.py CHANGED Viewed

@@ -1,36 +1,13 @@
-"""
-Este script realiza las siguientes tareas:
-1. Carga archivos desde un directorio especificado utilizando la clase `Loader` del módulo `preprocess`.
-2. Procesa los archivos mediante limpieza de texto y división en fragmentos.
-3. Genera representaciones vectoriales de los textos utilizando `sentence-transformers`.
-4. Almacena los vectores en una base de datos Chroma para su posterior recuperación.
-5. Inicializa un modelo y ejecuta una interfaz para interactuar con los datos procesados.
-Módulos utilizados:
-- `preprocess`: Contiene la clase `Loader` para la carga y preprocesamiento de documentos.
-- `vdb`: Se asume que gestiona la base de datos vectorial.
-- `model_load`: Módulo para cargar el modelo de machine learning.
-- `st`: Se asume que proporciona la interfaz de usuario.
-Estructura del código:
-1. Define el directorio de los archivos a procesar.
-2. Carga los archivos y los procesa si el número de archivos es menor a 2.
-3. Si hay múltiples archivos, los procesa en un bucle y concatena los fragmentos.
-4. Genera embeddings utilizando `sentence-transformers/all-MiniLM-L12-v2`.
-5. Almacena los embeddings en ChromaDB y configura un recuperador basado en similitud.
-6. Carga el modelo de machine learning.
-7. Inicia la interfaz de usuario..
-"""
 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import HuggingFaceEmbeddings
-#from langchain_chroma import Chroma
 from tqdm.auto import tqdm
-#from chromadb.utils import embedding_functions
 from src.preprocess import Loader
 from src.vdb import EmbeddingGen
 import src.model_load
 import gradio as gr
-@spaces.GPU
-if __name__=="__main__":
     # Definición de directorio
     archivo = [r"data/Calculo_Trascendentes_Tempranas_Zill_4t.pdf"]
@@ -43,13 +20,13 @@ if __name__=="__main__":
     else:
         textos = []
         for i in range(len(archivo)):
-            Load = Loader(archivo)
             documentos = Load.load_docs()
             textos_limpios = [Load.limpiar_texto(texto=doc) for doc in documentos]
             chunks = Load.splitter(texto=textos_limpios, chunk_size=500, chunk_overlap=50)
             textos.extend(chunks)
-    # Generación de embeddings y almacenamiento en base de datos ChromaDB
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L12-v2")
     persist_directory = "./persist_directory"
     db = Chroma(persist_directory=persist_directory, embedding_function=embeddings.embed_documents)
@@ -57,11 +34,13 @@ if __name__=="__main__":
     print("Vectorizado terminado")
     retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
     print("Carga del modelo")
-    # Carga del modelo y ejecución de la interfaz
-    qa_chain=src.model_load.load_model()
     print("Lanzando interfaz")
     def chatbot_response(message):
-        return src.model_load(message,retriever)
     iface = gr.Interface(
         fn=chatbot_response,
@@ -71,4 +50,8 @@ if __name__=="__main__":
         description="Interfaz simple de chatbot con Gradio."
     )
-    iface.launch(server_port=7860)

 from langchain_community.vectorstores import Chroma
 from langchain_community.embeddings import HuggingFaceEmbeddings
 from tqdm.auto import tqdm
 from src.preprocess import Loader
 from src.vdb import EmbeddingGen
 import src.model_load
 import gradio as gr
+@spaces.GPU  # Ubica aquí la anotación correctamente
+def main():
     # Definición de directorio
     archivo = [r"data/Calculo_Trascendentes_Tempranas_Zill_4t.pdf"]
     else:
         textos = []
         for i in range(len(archivo)):
+            Load = Loader(archivo[i])
             documentos = Load.load_docs()
             textos_limpios = [Load.limpiar_texto(texto=doc) for doc in documentos]
             chunks = Load.splitter(texto=textos_limpios, chunk_size=500, chunk_overlap=50)
             textos.extend(chunks)
+    # Generación de embeddings y almacenamiento
     embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L12-v2")
     persist_directory = "./persist_directory"
     db = Chroma(persist_directory=persist_directory, embedding_function=embeddings.embed_documents)
     print("Vectorizado terminado")
     retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
     print("Carga del modelo")
+    # Carga del modelo
+    qa_chain = src.model_load.load_model()
     print("Lanzando interfaz")
     def chatbot_response(message):
+        return qa_chain(message, retriever)
     iface = gr.Interface(
         fn=chatbot_response,
         description="Interfaz simple de chatbot con Gradio."
     )
+    iface.launch(server_port=7860, share=True)  # Aquí puedes asegurarte de que `share=True` esté activo
+if __name__ == "__main__":
+    main()