Spaces:

M17idd
/

army

Running

M17idd commited on 8 days ago

Commit

ff663c0

verified ·

1 Parent(s): 162eb65

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -104,15 +104,15 @@ st.markdown("""
 """, unsafe_allow_html=True)
 # ----------------- لود PDF و ساخت ایندکس -----------------
-tokenizer = AutoTokenizer.from_pretrained("HooshvareLab/gpt2-fa")
-tokenizer.pad_token = tokenizer.eos_token  # یا می‌توانید این خط را برای توکن جدید فعال کنید: tokenizer.add_special_tokens({'pad_token': '[PAD]'})
 @st.cache_resource
 def get_pdf_index():
     with st.spinner('📄 در حال پردازش فایل PDF...'):
         pdf_loader = PyPDFLoader('test1.pdf')
         # embeddings = SentenceTransformer("Thomslionel/embedings")
-        embeddings = HuggingFaceInstructEmbeddings(model_name="PartAI/Dorna-Llama3-8B-Instruct")
         index = VectorstoreIndexCreator(embedding=embeddings, text_splitter=RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=128)).from_loaders([pdf_loader])
         return index

 """, unsafe_allow_html=True)
 # ----------------- لود PDF و ساخت ایندکس -----------------
+# tokenizer = AutoTokenizer.from_pretrained("HooshvareLab/gpt2-fa")
+# tokenizer.pad_token = tokenizer.eos_token  # یا می‌توانید این خط را برای توکن جدید فعال کنید: tokenizer.add_special_tokens({'pad_token': '[PAD]'})
 @st.cache_resource
 def get_pdf_index():
     with st.spinner('📄 در حال پردازش فایل PDF...'):
         pdf_loader = PyPDFLoader('test1.pdf')
         # embeddings = SentenceTransformer("Thomslionel/embedings")
+        embeddings = HuggingFaceInstructEmbeddings(model_name="ai-forever/mGPT-13B")
         index = VectorstoreIndexCreator(embedding=embeddings, text_splitter=RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=128)).from_loaders([pdf_loader])
         return index