pmelnechuk commited on
Commit
28af9c9
verified
1 Parent(s): 37f711a

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +1 -22
app.py CHANGED
@@ -54,29 +54,8 @@ if __name__=="__main__":
54
  # Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
55
  embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
56
  # Define la ruta donde deseas guardar el vector store
57
- persist_directory = './vectorstore_data'
58
-
59
- # Verifica si la carpeta de persistencia existe, si no la crea
60
- if not os.path.exists(persist_directory):
61
- os.makedirs(persist_directory)
62
-
63
- # Funci贸n para procesar documentos por lotes
64
- def process_in_batches(documents, batch_size):
65
- """Genera embeddings en lotes para evitar problemas de memoria."""
66
- for i in range(0, len(documents), batch_size):
67
- batch = [doc.page_content for doc in documents[i:i + batch_size]]
68
- embeddings_batch = embeddings.embed_documents(batch) # Cambi茅 encode por embed_documents
69
- yield embeddings_batch
70
- vectorstore = Chroma(persist_directory=persist_directory)
71
- # Uso de la funci贸n con tqdm
72
- for embeddings_batch in tqdm(process_in_batches(textos, batch_size=16), desc="Procesando lotes de documentos"):
73
- # Procesar embeddings_batch aqu铆
74
- # Aqu铆 se asume que tienes alg煤n m茅todo para agregar estos embeddings al vectorstore
75
- vectorstore.add_documents(embeddings_batch)
76
-
77
-
78
  print("Vectorizado terminado")
79
-
80
  # Convierte el vector store en un recuperador (retriever) de similaridad
81
  retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
82
 
 
54
  # Generaci贸n de embeddings y almacenamiento en base de datos ChromaDB
55
  embeddings = EmbeddingGen("sentence-transformers/all-MiniLM-L12-v2")
56
  # Define la ruta donde deseas guardar el vector store
57
+ vectorstore=db.from_documents(textos,embedding_function)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
58
  print("Vectorizado terminado")
 
59
  # Convierte el vector store en un recuperador (retriever) de similaridad
60
  retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
61