Spaces:
Running
Running
Update app.py
Browse files
app.py
CHANGED
@@ -54,29 +54,8 @@ if __name__=="__main__":
|
|
54 |
# Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
|
55 |
embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
|
56 |
# Define la ruta donde deseas guardar el vector store
|
57 |
-
|
58 |
-
|
59 |
-
# Verifica si la carpeta de persistencia existe, si no la crea
|
60 |
-
if not os.path.exists(persist_directory):
|
61 |
-
os.makedirs(persist_directory)
|
62 |
-
|
63 |
-
# Funci贸n para procesar documentos por lotes
|
64 |
-
def process_in_batches(documents, batch_size):
|
65 |
-
"""Genera embeddings en lotes para evitar problemas de memoria."""
|
66 |
-
for i in range(0, len(documents), batch_size):
|
67 |
-
batch = [doc.page_content for doc in documents[i:i + batch_size]]
|
68 |
-
embeddings_batch = embeddings.embed_documents(batch) # Cambi茅 encode por embed_documents
|
69 |
-
yield embeddings_batch
|
70 |
-
vectorstore = Chroma(persist_directory=persist_directory)
|
71 |
-
# Uso de la funci贸n con tqdm
|
72 |
-
for embeddings_batch in tqdm(process_in_batches(textos, batch_size=16), desc="Procesando lotes de documentos"):
|
73 |
-
# Procesar embeddings_batch aqu铆
|
74 |
-
# Aqu铆 se asume que tienes alg煤n m茅todo para agregar estos embeddings al vectorstore
|
75 |
-
vectorstore.add_documents(embeddings_batch)
|
76 |
-
|
77 |
-
|
78 |
print("Vectorizado terminado")
|
79 |
-
|
80 |
# Convierte el vector store en un recuperador (retriever) de similaridad
|
81 |
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
|
82 |
|
|
|
54 |
# Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
|
55 |
embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
|
56 |
# Define la ruta donde deseas guardar el vector store
|
57 |
+
vectorstore=db.from_documents(textos,embedding_function)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
58 |
print("Vectorizado terminado")
|
|
|
59 |
# Convierte el vector store en un recuperador (retriever) de similaridad
|
60 |
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
|
61 |
|