Spaces:
Running
Running
Update app.py
Browse files
app.py
CHANGED
@@ -52,7 +52,27 @@ if __name__=="__main__":
|
|
52 |
|
53 |
# Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
|
54 |
embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
|
55 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
56 |
print("Vectorizado terminado")
|
57 |
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
|
58 |
print("Carga del modelo")
|
|
|
52 |
|
53 |
# Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
|
54 |
embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
|
55 |
+
# Define la ruta donde deseas guardar el vector store
|
56 |
+
persist_directory = './vectorstore_data'
|
57 |
+
|
58 |
+
# Verifica si la carpeta de persistencia existe, si no la crea
|
59 |
+
if not os.path.exists(persist_directory):
|
60 |
+
os.makedirs(persist_directory)
|
61 |
+
|
62 |
+
# Crea el vector store y persiste los documentos
|
63 |
+
vectorstore = Chroma.from_documents(
|
64 |
+
list(tqdm(textos, desc="Procesando documentos", unit="doc")),
|
65 |
+
embeddings,
|
66 |
+
persist_directory=persist_directory # Ruta de persistencia
|
67 |
+
)
|
68 |
+
|
69 |
+
print("Vectorizado terminado")
|
70 |
+
|
71 |
+
# Convierte el vector store en un recuperador (retriever) de similaridad
|
72 |
+
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
|
73 |
+
|
74 |
+
# Guarda el vector store para que persista entre ejecuciones
|
75 |
+
vectorstore.persist()
|
76 |
print("Vectorizado terminado")
|
77 |
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
|
78 |
print("Carga del modelo")
|