pmelnechuk commited on
Commit
593b5e0
verified
1 Parent(s): f42f9a9

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +21 -1
app.py CHANGED
@@ -52,7 +52,27 @@ if __name__=="__main__":
52
 
53
  # Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
54
  embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
55
- vectorstore = Chroma.from_documents(list(tqdm(textos[:10], desc="Procesando documentos", unit="doc")), embeddings)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
56
  print("Vectorizado terminado")
57
  retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
58
  print("Carga del modelo")
 
52
 
53
  # Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
54
  embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
55
+ # Define la ruta donde deseas guardar el vector store
56
+ persist_directory = './vectorstore_data'
57
+
58
+ # Verifica si la carpeta de persistencia existe, si no la crea
59
+ if not os.path.exists(persist_directory):
60
+ os.makedirs(persist_directory)
61
+
62
+ # Crea el vector store y persiste los documentos
63
+ vectorstore = Chroma.from_documents(
64
+ list(tqdm(textos, desc="Procesando documentos", unit="doc")),
65
+ embeddings,
66
+ persist_directory=persist_directory # Ruta de persistencia
67
+ )
68
+
69
+ print("Vectorizado terminado")
70
+
71
+ # Convierte el vector store en un recuperador (retriever) de similaridad
72
+ retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
73
+
74
+ # Guarda el vector store para que persista entre ejecuciones
75
+ vectorstore.persist()
76
  print("Vectorizado terminado")
77
  retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
78
  print("Carga del modelo")