Spaces:

M17idd
/

army

Running

M17idd commited on 8 days ago

Commit

d8bfdcf

verified ·

1 Parent(s): f5b923e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 import docx
 import torch
 import numpy as np
@@ -58,7 +59,6 @@ def cosine_similarity(vec1, vec2):
 # رابط کاربری استریم‌لیت
 st.title("🔎 یافتن نزدیک‌ترین بخش ۵ جمله‌ای به ورودی شما")
-st.markdown("با استفاده از مدل `HooshvareLab/bert-fa-base-uncased`")
 # مسیر پوشه فایل‌های docx
 folder_path = '46'
@@ -69,16 +69,19 @@ st.success(f"{len(chunks)} بخش ۵ جمله‌ای بارگذاری شد.")
 # ورودی کاربر
 user_input = st.text_area("لطفاً جمله یا متن خود را وارد کنید:")
 if st.button("🔍 جستجو"):
     if not user_input.strip():
         st.warning("لطفاً یک جمله وارد کنید.")
     else:
         with st.spinner("در حال محاسبه شباهت‌ها..."):
             user_embedding = get_embedding(user_input)
-            similarities = [cosine_similarity(user_embedding, get_embedding(chunk)) for chunk in chunks]
             most_similar_index = np.argmax(similarities)
             result = chunks[most_similar_index]
         st.subheader("📌 شبیه‌ترین بخش ۵ جمله‌ای:")
-        st.write(result)

 import os
+import concurrent.futures
 import docx
 import torch
 import numpy as np
 # رابط کاربری استریم‌لیت
 st.title("🔎 یافتن نزدیک‌ترین بخش ۵ جمله‌ای به ورودی شما")
 # مسیر پوشه فایل‌های docx
 folder_path = '46'
 # ورودی کاربر
 user_input = st.text_area("لطفاً جمله یا متن خود را وارد کنید:")
+def calculate_similarities_parallel(user_embedding, chunks):
+    with concurrent.futures.ThreadPoolExecutor() as executor:
+        similarities = list(executor.map(lambda chunk: cosine_similarity(user_embedding, get_embedding(chunk)), chunks))
+    return similarities
 if st.button("🔍 جستجو"):
     if not user_input.strip():
         st.warning("لطفاً یک جمله وارد کنید.")
     else:
         with st.spinner("در حال محاسبه شباهت‌ها..."):
             user_embedding = get_embedding(user_input)
+            similarities = calculate_similarities_parallel(user_embedding, chunks)
             most_similar_index = np.argmax(similarities)
             result = chunks[most_similar_index]
         st.subheader("📌 شبیه‌ترین بخش ۵ جمله‌ای:")
+        st.write(result)