Spaces:

bardicreels
/

rag2

Sleeping

user commited on Sep 12, 2024

Commit

7ebdd2b

1 Parent(s): 97426bb

Fix tokenizer error

Files changed (1) hide show

app.py CHANGED Viewed

@@ -66,12 +66,15 @@ def load_and_process_text(file_path):
         return []
 @st.cache_data
-def create_embeddings(chunks, _embedding_model):
     embeddings = []
     for chunk in chunks:
         inputs = tokenizer(chunk, return_tensors="pt", padding=True, truncation=True, max_length=512)
         with torch.no_grad():
-            outputs = _embedding_model(**inputs)
         embeddings.append(outputs.last_hidden_state.mean(dim=1).squeeze().numpy())
     return np.array(embeddings)

         return []
 @st.cache_data
+def create_embeddings(chunks, embedding_model):
+    tokenizer = AutoTokenizer.from_pretrained(embedding_model)
+    model = AutoModel.from_pretrained(embedding_model)
     embeddings = []
     for chunk in chunks:
         inputs = tokenizer(chunk, return_tensors="pt", padding=True, truncation=True, max_length=512)
         with torch.no_grad():
+            outputs = model(**inputs)
         embeddings.append(outputs.last_hidden_state.mean(dim=1).squeeze().numpy())
     return np.array(embeddings)