Spaces:

aleksandrrnt
/

hakaton

Sleeping

App Files Files Community

aleksandrrnt commited on Feb 27

Commit

9de1f87

verified ·

1 Parent(s): b6e50cd

Upload 5 files

Browse files

Files changed (5) hide show

app.py +159 -56
db.py +3 -0
llm.py +32 -0
prompts.py +55 -0
rag.py +2 -18

app.py CHANGED Viewed

@@ -1,57 +1,160 @@
-import gradio as gr
-from db import db
-from rag import process_query
-def init_db():
-    with open("sources.txt", encoding="utf-8") as f:
-        urls = f.read().splitlines()
-    db.add(urls)
-# Высота столбцов (в пикселях)
-COLUMN_HEIGHT = 280
-NUM_LINES = 12
-# Интерфейс Gradio
-with gr.Blocks() as demo:
-    gr.Markdown("# Интерфейс для анализа пресейла")
-    # Создаем два столбца: левый для загрузки файлов, правый для системного промпта
-    with gr.Row():
-        with gr.Column(scale=1):  # Левый столбец
-            file_input = gr.File(
-                label="Прикрепите рассматриваемый запрос",
-            )
-        with gr.Column(scale=2):  # Правый столбец
-            system_prompt_input = gr.Textbox(
-                label="Системный промпт",
-                placeholder="Введите системный промпт...",
-                lines=NUM_LINES,  # Количество строк зависит от доступной высоты
-                max_lines=NUM_LINES,
-                interactive=True,
-            )
-    # Кнопка "Отправить"
-    send_button = gr.Button("Отправить")
-    # Текстовое поле для отображения результата
-    result_output = gr.Textbox(label="Результат", lines=5, interactive=False)
-    def respond(file2, system_prompt):
-        # Обработка запроса (заглушка)
-        llm_response = process_query(file2, system_prompt)
-        return llm_response
-    # Привязываем кнопку к функции обработки
-    send_button.click(
-        respond,
-        inputs=[file_input, system_prompt_input],
-        outputs=result_output
-    )
-init_db()
-# Запуск приложения
 demo.launch()

+import os
+import gradio as gr
+from db import db
+from rag import process_query
+from llm import LLM
+from prompts import default_system_promot
+def init_db():
+    with open("sources.txt", encoding="utf-8") as f:
+        urls = f.read().splitlines()
+    db.add(urls)
+MISTRAL_KEY=os.getenv('MISTRAL_API_KEY')
+MISTRAL_URL="https://api.mistral.ai/v1"
+MISTRAL_MODEL="mistral-small-latest"
+OPENROUTER_URL = "https://openrouter.ai/api/v1"
+OPENROUTER_KEY = os.getenv('OPENROUTER_API_KEY')
+def get_llm(model):
+    if model == 'qwen2.5-vl-72b-instruct':
+        url = OPENROUTER_URL
+        key = OPENROUTER_KEY
+        model = "qwen/qwen2.5-vl-72b-instruct:free"
+    elif model == 'deepseek_v3':
+        url = OPENROUTER_URL
+        key = OPENROUTER_KEY
+        model = "deepseek/deepseek-chat:free"
+    elif model == 'llama-3.3-70b':
+        url = OPENROUTER_URL
+        key = OPENROUTER_KEY
+        model = "meta-llama/llama-3.3-70b-instruct:free"
+    else:
+        url = MISTRAL_URL
+        key = MISTRAL_KEY
+        model = MISTRAL_MODEL
+    return LLM(url, key, model)
+# Высота столбцов (в пикселях)
+COLUMN_HEIGHT = 280
+NUM_LINES = 12
+def tab1():
+    with gr.Tab("Анализ пресейлов"):
+        # Создаем два столбца: левый для загрузки файлов, правый для системного промпта
+        with gr.Row():
+            with gr.Column(scale=1):  # Левый столбец
+                file_input = gr.File(
+                    label="Прикрепите рассматриваемый запрос",
+                )
+                with gr.Row():
+                    model = gr.Dropdown(
+                        choices=["mistral", "qwen2.5-vl-72b-instruct", "deepseek_v3", "llama-3.3-70b"],  # Список строк для выбора
+                        label="Выберите модель",  # Подпись к выпадающему списку
+                        multiselect=False  # Если True, можно выбрать несколько значений
+                    )
+                    temperature = gr.Slider(
+                        minimum=0,
+                        maximum=1,
+                        step=0.01,
+                        label="Температура",
+                        value=0
+                    )
+            with gr.Column(scale=2):  # Правый столбец
+                system_prompt_input = gr.Textbox(
+                    label="Системный промпт",
+                    placeholder="Введите системный промпт...",
+                    lines=NUM_LINES,  # Количество строк зависит от доступной высоты
+                    max_lines=NUM_LINES,
+                    interactive=True,
+                    value=default_system_promot
+                )
+        # Кнопка "Отправить"
+        send_button = gr.Button("Отправить")
+        # Текстовое поле для отображения результата
+        # result_output = gr.Textbox(label="Результат", lines=5, interactive=False)
+        with gr.Accordion('Результат:', open=True):
+            result_output = gr.Markdown(value="Здесь будет представлен результат")
+        def respond(file, system_prompt, model, temperature):
+            llm = get_llm(model)
+            llm_response = process_query(file, system_prompt, llm, temperature)
+            return llm_response
+        # Привязываем кнопку к функции обработки
+        send_button.click(
+            respond,
+            inputs=[file_input, system_prompt_input, model, temperature],
+            outputs=result_output
+        )
+def add_new_source():
+    new_url = gr.Textbox(
+        label="url нового источника",
+        placeholder="Введите url нового источника...",
+        lines=1,
+        max_lines=1,
+        interactive=True,
+        info="Поддерживается парсинг только с сайта https://www.reksoft.ru"
+    )
+    add_button = gr.Button("Добавить")
+    def add_source(url):
+        if url.startswith("https://www.reksoft.ru"):
+            db.add([url])
+            gr.Success(f"{url} успешно добавлен")
+        else:
+            gr.Error("Ошибка: представленная ссылка не принадлежит https://www.reksoft.ru")
+        return url
+    add_button.click(
+        add_source,
+        inputs=new_url,
+        outputs=new_url
+    )
+def get_sources():
+    ids = db.get_ids()
+    str_ids = ""
+    for source in ids:
+        str_ids += f'* {source}\n'
+    return f"""\
+# Источники
+{str_ids}"""
+def tab2():
+    with gr.Tab("Источники") as dynamic_tab:
+        add_new_source()
+        markdown_output = gr.Markdown("Изначальное содержимое Markdown")
+    dynamic_tab.select(get_sources, outputs=markdown_output)
+# Интерфейс Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("# Интерфейс для анализа пресейла")
+    with gr.Tabs():
+        tab1()
+        tab2()
+init_db()
+# Запуск приложения
 demo.launch()

db.py CHANGED Viewed

@@ -56,6 +56,9 @@ class HacatonDB:
     def update(self, urls):
         pass
     def query(self, query, top_k):
         return self.collection.query(query_texts=query, n_results=top_k)

     def update(self, urls):
         pass
+    def get_ids(self):
+        return self.collection.get()["ids"]
     def query(self, query, top_k):
         return self.collection.query(query_texts=query, n_results=top_k)

llm.py ADDED Viewed

	@@ -0,0 +1,32 @@

+import openai
+import logging
+logger = logging.getLogger("llm")
+logging.basicConfig(
+    format="%(asctime)s %(levelname)-8s %(message)s",
+    level=logging.INFO,
+    datefmt="%Y-%m-%d %H:%M:%S",
+)
+class LLM:
+    def __init__(self, url, key, model):
+        self.url = url
+        self.key = key
+        self.client = openai.OpenAI(api_key=self.key, base_url=self.url)
+        self.model = model
+    def chat(self, messages, temperature=0):
+        logger.info("LLM call")
+        response = self.client.chat.completions.create(
+                messages=messages,
+                model=self.model,
+                temperature=temperature
+            )
+        logger.info("LLM call completed")
+        return response

prompts.py ADDED Viewed

	@@ -0,0 +1,55 @@

+default_system_promot = """\
+Вы — AI-аналитик, оценивающий соответствие опыта компании входящим проектам. **Строго соблюдайте структуру и правила ниже.**
+---
+### **Инструкции**
+1. **Ключевые критерии оценки**:
+   - **Жесткие (обязательные)**:
+     - `Отрасль` (минимум 60% совпадения)
+     - `Технологии` (минимум 50% совпадения)
+   - **Гибкие (вторичные)**:
+     - `Цели проекта` (соответствие бизнес-целям клиента)
+     - `Решаемые задачи` (наличие аналогичных кейсов)
+     - `Компетенции` (экспертиза в требуемой области)
+     - `Сложность` (опыт работы с проектами аналогичного уровня)
+2. **Методология**:
+   - Для каждого критерия:
+     1. Рассчитайте % совпадения на основе данных.
+     2. Укажите **конкретные примеры** (название проекта, ID, описание связи).
+   - **Формула скоринга**:
+     ```
+     (Отрасль × 0.3) + (Технологии × 0.3) + (Цели × 0.2) + (Задачи × 0.1) + (Компетенции × 0.1)
+     ```
+3. **Формат ответа**:
+   ```markdown
+   ### Решение
+   **Вердикт:** [✅ Подходит / ⚠️ Условно подходит / ❌ Не подходит]
+   **Уверенность:** [High/Medium/Low]
+   **Скоринг:** X%
+   #### Анализ критериев
+   | Критерий         | Совпадение | Примеры из опыта                          |
+   |-------------------|------------|-------------------------------------------|
+   | Отрасль          | 75%        | Проект "RetailX" (ID: 45, e-commerce)     |
+   | Технологии       | 60%        | Проект "CloudFlow" (ID: 89, AWS, Python)  |
+   | Цели проекта     | 50%        | Проект "DataSafe" (ID: 12, оптимизация Big Data) |
+   | Решаемые задачи  | 80%        | Проект "LogistAI" (ID: 33, автоматизация склада) |
+   #### Рекомендации
+   - **Сильные стороны:**
+   - **Риски:**
+   - **Оптимизация:**
+   ```
+---
+### **Ограничения**
+- Если **жесткие критерии не пройдены** → автоматический ❌.
+- При **совпадении по целям <30%** → вердикт ⚠️, даже если скоринг высокий.
+- **Запрещено:**
+  - Использовать данные вне контекста.
+  - Обобщения без ссылок на проекты (например, "у нас богатый опыт")."""

rag.py CHANGED Viewed

@@ -1,5 +1,3 @@
-import os
-import openai
 from db import db
 import logging
@@ -11,13 +9,6 @@ logging.basicConfig(
 )
-MISTRAL_KEY=os.getenv('MISTRAL_API_KEY')
-MISTRAL_URL="https://api.mistral.ai/v1"
-MISTRAL_MODEL="mistral-small-latest"
-client = openai.OpenAI(api_key=MISTRAL_KEY, base_url=MISTRAL_URL)
 message_template = """\
 Далее представлена информацию по опыту нашей компании
 ---------------------
@@ -30,7 +21,7 @@ message_template = """\
 При проведении анализа опирайся только на представленную информацию"""
 # Функция для обработки запроса к LLM
-def process_query(req_file, system_prompt):
     logger.info("Process query")
     if req_file is not None:
@@ -58,14 +49,7 @@ def process_query(req_file, system_prompt):
         {"role": "user", "content": user_message}
     ]
-    logger.info("LLM call")
-    response = client.chat.completions.create(
-            messages=messages,
-            model=MISTRAL_MODEL,
-        )
-    logger.info("LLM call completed")
     # Получение ответа от LLM
     llm_response = response.choices[0].message.content

 from db import db
 import logging
 )
 message_template = """\
 Далее представлена информацию по опыту нашей компании
 ---------------------
 При проведении анализа опирайся только на представленную информацию"""
 # Функция для обработки запроса к LLM
+def process_query(req_file, system_prompt, llm, temperature):
     logger.info("Process query")
     if req_file is not None:
         {"role": "user", "content": user_message}
     ]
+    response = llm.chat(messages, temperature)
     # Получение ответа от LLM
     llm_response = response.choices[0].message.content