pmelnechuk commited on
Commit
d91e81c
verified
1 Parent(s): 26ebe5f

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +7 -9
app.py CHANGED
@@ -61,19 +61,17 @@ if __name__=="__main__":
61
  os.makedirs(persist_directory)
62
 
63
  # Funci贸n para procesar documentos por lotes
64
- def process_in_batches(documents, batch_size=16):
65
- # Dividir los documentos en lotes
66
  for i in range(0, len(documents), batch_size):
67
- batch = documents[i:i+batch_size]
68
- embeddings_batch = embeddings.encode(batch, convert_to_tensor=True, show_progress_bar=True)
69
  yield embeddings_batch
70
-
71
- # Crear el vector store
72
  vectorstore = Chroma(persist_directory=persist_directory)
73
-
74
- # Procesar los documentos por lotes
75
  for embeddings_batch in tqdm(process_in_batches(textos, batch_size=16), desc="Procesando lotes de documentos"):
76
- # Aqu铆 se asume que tienes alg煤n m茅todo para agregar estos embeddings al vectorstore
 
77
  vectorstore.add_documents(embeddings_batch)
78
 
79
 
 
61
  os.makedirs(persist_directory)
62
 
63
  # Funci贸n para procesar documentos por lotes
64
+ def process_in_batches(documents, batch_size):
65
+ """Genera embeddings en lotes para evitar problemas de memoria."""
66
  for i in range(0, len(documents), batch_size):
67
+ batch = documents[i:i + batch_size]
68
+ embeddings_batch = embeddings.embed_documents(batch) # Cambi茅 encode por embed_documents
69
  yield embeddings_batch
 
 
70
  vectorstore = Chroma(persist_directory=persist_directory)
71
+ # Uso de la funci贸n con tqdm
 
72
  for embeddings_batch in tqdm(process_in_batches(textos, batch_size=16), desc="Procesando lotes de documentos"):
73
+ # Procesar embeddings_batch aqu铆
74
+ # Aqu铆 se asume que tienes alg煤n m茅todo para agregar estos embeddings al vectorstore
75
  vectorstore.add_documents(embeddings_batch)
76
 
77