Langchained_PGPS_RAG

Sleeping

App Files Files Community

SergeyO7 commited on Mar 26

Commit

99a8b0b

verified ·

1 Parent(s): ba51f14

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -32

app.py CHANGED Viewed

@@ -24,6 +24,7 @@ PROMPT_TEMPLATE = """
 # Инициализация базы данных Chroma один раз при запуске
 def initialize_chroma():
     if not os.path.exists(CHROMA_PATH):
         generate_data_store()
     embeddings = HuggingFaceEmbeddings(
@@ -38,37 +39,6 @@ def initialize_chroma():
     )
     return db
-def main():
-    # Создаем папки при необходимости
-    os.makedirs("/tmp/model_cache", exist_ok=True)
-    os.makedirs("/tmp/chroma", exist_ok=True)
-    # Генерируем или загружаем базу данных Chroma один раз
-    if not os.path.exists(CHROMA_PATH):
-        generate_data_store()
-    # Инициализация эмбеддингов
-    embeddings = HuggingFaceEmbeddings(
-        model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
-        cache_folder="model_cache"
-    )
-    # Загрузка векторной БД
-    db = Chroma(
-        persist_directory=CHROMA_PATH,
-        embedding_function=embeddings
-    )
-    print("Чат готов. Введите ваш вопрос или 'exit' для выхода.")
-    # Интерактивный цикл чата
-    while True:
-        query_text = input("Вы: ")
-        if query_text.lower() in ["exit", "quit"]:
-            print("Выход из чата.")
-            break
-        process_query(query_text, db)
 def generate_data_store():
     documents = load_documents()
@@ -96,6 +66,7 @@ def split_text(documents: list[Document]):
     print(f"Разделено {len(documents)} документов на {len(chunks)} частей.")
     return chunks
 def save_to_chroma(chunks: list[Document]):
     # Очищаем базу данных перед сохранением
     if os.path.exists(CHROMA_PATH):
@@ -117,6 +88,8 @@ def save_to_chroma(chunks: list[Document]):
     )
     print(f"Сохранено {len(chunks)} частей в {CHROMA_PATH}.")
 # Обработка запроса пользователя
 def process_query(query_text: str, db):
     results = db.similarity_search_with_relevance_scores(query_text, k=3)
@@ -139,6 +112,10 @@ def chat_interface(query_text):
     response, sources = process_query(query_text, db)
     return f"Ответ: {response}\n\nИсточники: {', '.join(sources) if sources else 'Нет источников'}"
 # Создание и запуск интерфейса Gradio
 interface = gr.Interface(
     fn=chat_interface,
@@ -149,4 +126,4 @@ interface = gr.Interface(
 )
 if __name__ == "__main__":
-    main()

 # Инициализация базы данных Chroma один раз при запуске
 def initialize_chroma():
     if not os.path.exists(CHROMA_PATH):
         generate_data_store()
     embeddings = HuggingFaceEmbeddings(
     )
     return db
 def generate_data_store():
     documents = load_documents()
     print(f"Разделено {len(documents)} документов на {len(chunks)} частей.")
     return chunks
 def save_to_chroma(chunks: list[Document]):
     # Очищаем базу данных перед сохранением
     if os.path.exists(CHROMA_PATH):
     )
     print(f"Сохранено {len(chunks)} частей в {CHROMA_PATH}.")
 # Обработка запроса пользователя
 def process_query(query_text: str, db):
     results = db.similarity_search_with_relevance_scores(query_text, k=3)
     response, sources = process_query(query_text, db)
     return f"Ответ: {response}\n\nИсточники: {', '.join(sources) if sources else 'Нет источников'}"
+# Создаем папки при необходимости
+os.makedirs("/tmp/model_cache", exist_ok=True)
+os.makedirs("/tmp/chroma", exist_ok=True)
 # Создание и запуск интерфейса Gradio
 interface = gr.Interface(
     fn=chat_interface,
 )
 if __name__ == "__main__":
+    interface.launch()