Spaces:

M17idd
/

army

Running

App Files Files Community

M17idd commited on 3 days ago

Commit

1e34f68

verified ·

1 Parent(s): 07e178a

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -27

app.py CHANGED Viewed

@@ -211,9 +211,8 @@ def get_pdf_index():
 index = get_pdf_index()
 """
-# ----------------- لود csv و ساخت ایندکس -----------------
 class TogetherEmbeddings(Embeddings):
     def __init__(self, model_name: str, api_key: str):
         self.model_name = model_name
@@ -232,8 +231,10 @@ def get_csv_index(csv_file):
         # خواندن داده‌های CSV
         df = pd.read_csv(csv_file)
-        # فرض بر این است که شما می‌خواهید ستون خاصی از CSV را برای ایندکس کردن استفاده کنید
-        texts = df['your_column_name'].tolist()  # ستون مورد نظر خود را مشخص کنید
         # ایجاد embeddings
         embeddings = TogetherEmbeddings(
@@ -242,33 +243,25 @@ def get_csv_index(csv_file):
         )
         # استفاده از VectorstoreIndexCreator برای ساخت ایندکس
-        return VectorstoreIndexCreator(
             embedding=embeddings,
             text_splitter=RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=0)
-        ).from_documents(texts)
-# مسیر فایل CSV به صورت دستی
 csv_file_path = 'output (1).csv'
-# در اینجا فایل را به صورت دستی می‌خوانیم
-if csv_file_path:
-    csv_index = get_csv_index(csv_file_path)
-    st.success("ایندکس فایل CSV با موفقیت ساخته شد!")
-index = get_csv_index()
 #------------------------------------------
 llm = ChatOpenAI(
     base_url="https://api.together.xyz/v1",
     api_key='0291f33aee03412a47fa5d8e562e515182dcc5d9aac5a7fb5eefdd1759005979',
@@ -278,7 +271,7 @@ llm = ChatOpenAI(
 chain = RetrievalQA.from_chain_type(
     llm=llm,
     chain_type='stuff',
-    retriever=index.vectorstore.as_retriever(),
     input_key='question'
 )
@@ -305,7 +298,7 @@ if st.session_state.pending_prompt:
         thinking.markdown("🤖 در حال فکر کردن...")
         response = chain.run(f'پاسخ را فقط به زبان فارسی جواب بده به هیچ عنوان از زبان چینی در پاسخ استفاده نکن. سوال: {st.session_state.pending_prompt}')
-        answer = response.split("Helpful Answer:")[-1].strip()
         if not answer:
             answer = "متأسفم، اطلاعات دقیقی در این مورد ندارم."
@@ -319,4 +312,4 @@ if st.session_state.pending_prompt:
         placeholder.markdown(full_response)
         st.session_state.messages.append({'role': 'ai', 'content': full_response})
-        st.session_state.pending_prompt = None

 index = get_pdf_index()
 """
+# ----------------- لود csv و ساخت ایندکس -----------------
 class TogetherEmbeddings(Embeddings):
     def __init__(self, model_name: str, api_key: str):
         self.model_name = model_name
         # خواندن داده‌های CSV
         df = pd.read_csv(csv_file)
+        # تبدیل DataFrame به لیست از متون
+        # فرض می‌کنیم همه ستون‌ها را می‌خواهیم یا یک ستون خاص
+        # اگر فقط یک ستون دارید، نام آن را جایگزین کنید
+        texts = df.iloc[:, 0].astype(str).tolist()  # ستون اول را می‌گیرد
         # ایجاد embeddings
         embeddings = TogetherEmbeddings(
         )
         # استفاده از VectorstoreIndexCreator برای ساخت ایندکس
+        index_creator = VectorstoreIndexCreator(
             embedding=embeddings,
             text_splitter=RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=0)
+        )
+        # تبدیل متون به اسناد (documents)
+        from langchain.docstore.document import Document
+        documents = [Document(page_content=text) for text in texts]
+        return index_creator.from_documents(documents)
+# مسیر فایل CSV
 csv_file_path = 'output (1).csv'
+# ساخت ایندکس
+csv_index = get_csv_index(csv_file_path)
+st.success("ایندکس فایل CSV با موفقیت ساخته شد!")
 #------------------------------------------
 llm = ChatOpenAI(
     base_url="https://api.together.xyz/v1",
     api_key='0291f33aee03412a47fa5d8e562e515182dcc5d9aac5a7fb5eefdd1759005979',
 chain = RetrievalQA.from_chain_type(
     llm=llm,
     chain_type='stuff',
+    retriever=csv_index.vectorstore.as_retriever(),
     input_key='question'
 )
         thinking.markdown("🤖 در حال فکر کردن...")
         response = chain.run(f'پاسخ را فقط به زبان فارسی جواب بده به هیچ عنوان از زبان چینی در پاسخ استفاده نکن. سوال: {st.session_state.pending_prompt}')
+        answer = response.split("Helpful Answer:")[-1].strip() if "Helpful Answer:" in response else response.strip()
         if not answer:
             answer = "متأسفم، اطلاعات دقیقی در این مورد ندارم."
         placeholder.markdown(full_response)
         st.session_state.messages.append({'role': 'ai', 'content': full_response})
+        st.session_state.pending_prompt = None