protocol-api-mirror

Sleeping

App Files Files Community

muryshev commited on Feb 7

Commit

9dd4b6c

1 Parent(s): 3a06de1

Transition to fastapi.

Browse files

Files changed (5) hide show

Dockerfile +2 -2
app.py +97 -210
llm/deepinfra_api.py +11 -7
prompts/gettable.py +129 -0
requirements.txt +2 -2

Dockerfile CHANGED Viewed

@@ -33,5 +33,5 @@ RUN pip install --user -r requirements.txt
 # Expose the port
 EXPOSE 7860
-# Run app.py when the container launches
-CMD flask run --host=0.0.0.0 --port=7860

 # Expose the port
 EXPOSE 7860
+# Run FastAPI app with Uvicorn
+CMD uvicorn main:app --host 0.0.0.0 --port 7860

app.py CHANGED Viewed

@@ -1,12 +1,15 @@
-from flask import Flask, request, Response, jsonify
-from flask_cors import CORS
 import json
 import re
 import os
 from llm.common import LlmParams, LlmPredictParams
 from llm.deepinfra_api import DeepInfraApi
 from llm import prompts
 from dotenv import load_dotenv
 # Загрузка переменных окружения из файла .env
 load_dotenv()
@@ -15,237 +18,121 @@ LLM_API_URL = os.getenv("LLM_API_URL", "https://api.deepinfra.com")
 LLM_API_KEY = os.getenv("DEEPINFRA_API_KEY", "")
 LLM_NAME = os.getenv("LLM_NAME", "meta-llama/Llama-3.3-70B-Instruct-Turbo")
-default_llm_params = LlmParams(url=LLM_API_URL,api_key=LLM_API_KEY, model=LLM_NAME, predict_params=LlmPredictParams(temperature=0.15, top_p=0.95, min_p=0.05, seed=42, repetition_penalty=1.2, presence_penalty=1.1, max_tokens=6000))
 llm_api = DeepInfraApi(default_llm_params)
-def format_prompt(message, history):
-  prompt = "<s>"
-  for user_prompt, bot_response in history:
-    prompt += f"[INST] {user_prompt} [/INST]"
-    prompt += f" {bot_response}</s> "
-  prompt += f"[INST] {message} [/INST]"
-  return prompt
-def split_text(text):
-    max_chars = 3500
-    sentences = text.split('.')
-    lines = []
-    for sentence in sentences:
-        lines.extend(sentence.split('\n'))
-    result = []
-    current_chunk = ''
-    for line in lines:
-        if len(current_chunk) + len(line) < max_chars:
-            current_chunk += line + '.'
-        else:
-            result.append(current_chunk.strip())
-            current_chunk = line + '.'
-    if current_chunk:
-        result.append(current_chunk.strip())
-    return result
-app = Flask(__name__)
-CORS(app)
-@app.route('/extracttable', methods=['POST'])
-async def extracttable_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.LLM_PROMPT_EXTRACT_TABLE.format(query = text)
-    response = await llm_api.predict(prompt[:150000])
-    result = {"response": None, "error": None, "raw": response}  # По умолчанию сохраняем всю строку
     if "JSON: " not in response:
         result["error"] = "Строка не содержит 'JSON: '"
         return result
     prefix, json_str = response.split("JSON: ", 1)
     json_str = json_str.strip()
     if not json_str:
         result["error"] = "После 'JSON: ' отсутствует JSON"
         return result
     try:
         result["response"] = json.loads(json_str)
-        result["raw"] = prefix.strip()  # Остаток перед "JSON: "
     except json.JSONDecodeError as e:
         result["error"] = f"Ошибка декодирования JSON: {e}"
-    return jsonify(result)
-@app.route('/health', methods=['GET'])
 def health():
-    return jsonify({"status": "ok"})
-@app.route('/getsummary', methods=['POST'])
-async def getsummary_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.GET_SUMMARY.format(text=text)
-    response = await llm_api.predict(prompt[:150000])
-    return jsonify({'result': response})
-@app.route('/cleantext', methods=['POST'])
-async def cleantext_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.CLEAN_TEXT.format(text=text)
-    response = await llm_api.predict(prompt[:150000])
-    return jsonify({'result': response})
-@app.route('/getfollowup', methods=['POST'])
-async def getfollowup_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.GET_FOLLOWUP.format(text=text)
-    response = await llm_api.predict(prompt[:150000])
-    return jsonify({'result': response})
-@app.route('/getagenda', methods=['POST'])
-async def getagenda_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.GET_AGENDA.format(text=text)
-    response = await llm_api.predict(prompt[:150000])
-    return jsonify({'result': response})
-@app.route('/gethighlights', methods=['POST'])
-async def gethighlights_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    prompt = prompts.GET_HIGHLIGHTS.format(text=text)
-    response = await llm_api.predict(prompt[:150000])
-    return jsonify({'result': response})
-@app.route('/getprojectinfo', methods=['POST'])
-async def getprojectinfo_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    main_prompts = []
-    main_prompts.append(prompts.GET_PROJECT_INFO_NAMES.format(text=text))
-    main_prompts.append(prompts.GET_PROJECT_INFO_AGENDA.format(text=text))
-    main_info =''
-    for i in main_prompts:
-        result = await llm_api.predict(i[:150000])
-        if result is None:
-            return jsonify({'error': 'Сервер LLM временно недоступен. Попробуйте повторить запрос через несколько минут.'})
-        main_info += '\n\n'+result+'\n\n'
-    final = main_info
-    final = final.replace("Конец ответа", "")
-    final = final.replace('</s>', '')
-    final = final.strip()
-    return jsonify({'result': final})
-@app.route('/getprojectlist', methods=['POST'])
-async def getprojectlist_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    main_prompts = []
-    main_prompts.append(prompts.GET_PROJECT_INFO_NAMES.format(text=text))
-    main_prompts.append(prompts.GET_PROJECT_INFO_AGENDA.format(text=text))
-    main_info =''
-    for i in main_prompts:
-        result = await llm_api.predict(i[:150000])
-        if result is None:
-            return jsonify({'error': 'Сервер LLM временно недоступен. Попробуйте повторить запрос через несколько минут.'})
-        main_info += '\n\n'+result+'\n\n'
-    proj_prompt = []
-    proj_prompt.append(prompts.GET_PROJECT_LIST.format(text=text))
-    list_of_projects =''
-    for i in proj_prompt:
-        result = await llm_api.predict(i[:150000])
-        if result is None:
-            return jsonify({'error': 'Сервер LLM временно недоступен. Попробуйте повторить запрос через несколько минут.'})
-        list_of_projects += result
-    delimiter = 'Проект '
-    proj  = [delimiter+x for x in list_of_projects.split(delimiter) if x]
-    proj = proj[1:]
-    projects = []
-    for i in proj:
-        a = i.replace("Проект №", "")
-        a = a.replace("Конец ответа", "")
-        a = a.replace("данный проект", "")  ###убираю слово "проект", чтобы модель не опиралась на него,
-        a = a.replace("проект ", "")             # при ответе на вопрос, проект это или нет
-        a = a.replace('\n', ' ')
-        a = a.replace('</s>', ' ')
-        a = a.strip()
-        projects.append(a)
-    check_prompts = []
-    checking = prompts.GET_PROJECT_LIST_CHECK_PROJECT.format(text=text, projects=projects)
-    check_prompts.append(checking)
-    real_projects = ''
-    for i in check_prompts:
-        result = await llm_api.predict(i[:150000])
-        if result is None:
-            return jsonify({'error': 'Сервер LLM временно недоступен. Попробуйте повторить запрос через несколько минут.'})
-        real_projects += result
     real_projects_list = re.findall(r'Да:\s*(.*?)\s*(?:\n\n|$)', real_projects)
-    return jsonify({'result': real_projects_list})
-@app.route('/getprojectdetails', methods=['POST'])
-async def getinfobyproject_route():
-    data = request.get_json()
-    text = data.get('text', '')
-    real_projects_list = data.get('projects', {})
-    project_prompts = {}
-    if real_projects_list:
-        for i in real_projects_list:
-            if not i or i.strip() == "":
-                continue
-            prompt_aim = prompts.GET_PROJECT_DETAILS_AIM.format(text=text, project=i)
-            gk = prompts.GET_PROJECT_DETAILS_VALUE.format(text=text, project=i)
-            budget = prompts.GET_PROJECT_DETAILS_BUDGET.format(text=text, project=i)
-            ec_ef = prompts.GET_PROJECT_DETAILS_ECO_EFFECT.format(text=text, project=i)
-            deadline = prompts.GET_PROJECT_DETAILS_DEADLINE.format(text=text, project=i)
-            new_plan = prompts.GET_PROJECT_DETAILS_NEW_PLAN.format(text=text, project=i)
-            conclusion = prompts.GET_PROJECT_DETAILS_CONCLUSION.format(text=text, project=i)
-            p = [prompt_aim, gk, budget, ec_ef, deadline, new_plan, conclusion]
-            project_prompts[i] = {}
-            project_prompts[i]['prompts'] = p
-    elif not real_projects_list:
-        return jsonify({'error': 'Проекты не выбраны'})
     final = {}
-    for project_name, project in project_prompts.items():
-        for prompt in project['prompts']:
-            result = await llm_api.predict(prompt[:150000])
-            if result is not None:
-                final[project_name] = final.get(project_name, '') + '\n\n'+result + '\n\n'
-        final[project_name] = final[project_name].replace("Конец ответа", "")
-        final[project_name] = final[project_name].replace('</s>', '')
-        final[project_name] = final[project_name].strip()
-    return jsonify({'result': final})
-if __name__ == '__main__':
-    app.run(debug=False, host='0.0.0.0', port=7860)

+from fastapi import FastAPI, Request, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+from pydantic import BaseModel
 import json
 import re
 import os
 from llm.common import LlmParams, LlmPredictParams
 from llm.deepinfra_api import DeepInfraApi
 from llm import prompts
+from prompts import gettable
 from dotenv import load_dotenv
+import uvicorn
 # Загрузка переменных окружения из файла .env
 load_dotenv()
 LLM_API_KEY = os.getenv("DEEPINFRA_API_KEY", "")
 LLM_NAME = os.getenv("LLM_NAME", "meta-llama/Llama-3.3-70B-Instruct-Turbo")
+default_llm_params = LlmParams(
+    url=LLM_API_URL,
+    api_key=LLM_API_KEY,
+    model=LLM_NAME,
+    predict_params=LlmPredictParams(
+        temperature=0.15, top_p=0.95, min_p=0.05, seed=42,
+        repetition_penalty=1.2, presence_penalty=1.1, max_tokens=6000
+    )
+)
 llm_api = DeepInfraApi(default_llm_params)
+app = FastAPI()
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"]
+)
+class TextRequest(BaseModel):
+    text: str
+    projects: list[str] = []
+@app.post("/extracttable")
+async def extracttable_route(request: TextRequest):
+    prompt = gettable.USER_PROMPT.format(query=request.text)
+    response = await llm_api.predict(prompt[:150000], system_prompt=gettable.SYSTEM_PROMPT)
+    result = {"response": None, "error": None, "raw": response}
     if "JSON: " not in response:
         result["error"] = "Строка не содержит 'JSON: '"
         return result
     prefix, json_str = response.split("JSON: ", 1)
     json_str = json_str.strip()
     if not json_str:
         result["error"] = "После 'JSON: ' отсутствует JSON"
         return result
     try:
         result["response"] = json.loads(json_str)
+        result["raw"] = prefix.strip()
     except json.JSONDecodeError as e:
         result["error"] = f"Ошибка декодирования JSON: {e}"
+    return result
+@app.get("/health")
 def health():
+    return {"status": "ok"}
+async def generate_response(prompt):
+    return await llm_api.predict(prompt[:150000])
+@app.post("/getsummary")
+async def getsummary_route(request: TextRequest):
+    return {"result": await generate_response(prompts.GET_SUMMARY.format(text=request.text))}
+@app.post("/cleantext")
+async def cleantext_route(request: TextRequest):
+    return {"result": await generate_response(prompts.CLEAN_TEXT.format(text=request.text))}
+@app.post("/getfollowup")
+async def getfollowup_route(request: TextRequest):
+    return {"result": await generate_response(prompts.GET_FOLLOWUP.format(text=request.text))}
+@app.post("/getagenda")
+async def getagenda_route(request: TextRequest):
+    return {"result": await generate_response(prompts.GET_AGENDA.format(text=request.text))}
+@app.post("/gethighlights")
+async def gethighlights_route(request: TextRequest):
+    return {"result": await generate_response(prompts.GET_HIGHLIGHTS.format(text=request.text))}
+@app.post("/getprojectinfo")
+async def getprojectinfo_route(request: TextRequest):
+    prompts_list = [
+        prompts.GET_PROJECT_INFO_NAMES.format(text=request.text),
+        prompts.GET_PROJECT_INFO_AGENDA.format(text=request.text)
+    ]
+    main_info = "\n\n".join([await generate_response(p) for p in prompts_list])
+    return {"result": main_info.strip().replace("Конец ответа", "").replace('</s>', '')}
+@app.post("/getprojectlist")
+async def getprojectlist_route(request: TextRequest):
+    list_of_projects = await generate_response(prompts.GET_PROJECT_LIST.format(text=request.text))
+    projects = [f"Проект {x}" for x in list_of_projects.split("Проект ") if x][1:]
+    projects = [p.replace("проект ", "").strip() for p in projects]
+    real_projects = await generate_response(prompts.GET_PROJECT_LIST_CHECK_PROJECT.format(text=request.text, projects=projects))
     real_projects_list = re.findall(r'Да:\s*(.*?)\s*(?:\n\n|$)', real_projects)
+    return {"result": real_projects_list}
+@app.post("/getprojectdetails")
+async def getprojectdetails_route(request: TextRequest):
+    if not request.projects:
+        raise HTTPException(status_code=400, detail="Проекты не выбраны")
     final = {}
+    for project in request.projects:
+        prompts_list = [
+            prompts.GET_PROJECT_DETAILS_AIM.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_VALUE.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_BUDGET.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_ECO_EFFECT.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_DEADLINE.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_NEW_PLAN.format(text=request.text, project=project),
+            prompts.GET_PROJECT_DETAILS_CONCLUSION.format(text=request.text, project=project),
+        ]
+        final[project] = "\n\n".join([await generate_response(p) for p in prompts_list])
+        final[project] = final[project].replace("Конец ответа", "").replace('</s>', '').strip()
+    return {"result": final}
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=7860)

llm/deepinfra_api.py CHANGED Viewed

@@ -33,7 +33,7 @@ class DeepInfraApi(LlmApi):
             print('Error fetching models:', error)
         return []
-    def create_messages(self, prompt: str) -> List[dict]:
         """
         Создает сообщения для LLM на основе переданного промпта и системного промпта (если он задан).
@@ -45,8 +45,12 @@ class DeepInfraApi(LlmApi):
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
-        if self.params.predict_params and self.params.predict_params.system_prompt:
-            messages.append({"role": "system", "content": self.params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
@@ -71,7 +75,7 @@ class DeepInfraApi(LlmApi):
     async def detokenize(self, tokens: List[int]) -> Optional[str]:
         raise NotImplementedError("This function is not supported.")
-    async def create_request(self, prompt: str) -> dict:
         """
         Создает запрос для предсказания на основе параметров LLM.
@@ -128,13 +132,13 @@ class DeepInfraApi(LlmApi):
             if predict_params.frequency_penalty is not None:
                 request["frequency_penalty"] = float(predict_params.frequency_penalty)
-        request["messages"] = self.create_messages(prompt)
         return request
     async def trim_sources(self, sources: str, user_request: str, system_prompt: str = None) -> dict:
         raise NotImplementedError("This function is not supported.")
-    async def predict(self, prompt: str) -> str:
         """
         Выполняет запрос к API и возвращает результат.
@@ -145,7 +149,7 @@ class DeepInfraApi(LlmApi):
             str: Сгенерированный текст.
         """
         async with httpx.AsyncClient() as client:
-            request = await self.create_request(prompt)
             response = await client.post(f"{self.params.url}/v1/openai/chat/completions", headers=super().create_headers(), json=request)
             if response.status_code == 200:
                 return response.json()["choices"][0]["message"]["content"]

             print('Error fetching models:', error)
         return []
+    def create_messages(self, prompt: str, system_prompt: str = None) -> List[dict]:
         """
         Создает сообщения для LLM на основе переданного промпта и системного промпта (если он задан).
         """
         actual_prompt = self.apply_llm_template_to_prompt(prompt)
         messages = []
+        if system_prompt is not None:
+            messages.append({"role": "system", "content": system_prompt})
+        else:
+            if self.params.predict_params and self.params.predict_params.system_prompt:
+                messages.append({"role": "system", "content": self.params.predict_params.system_prompt})
         messages.append({"role": "user", "content": actual_prompt})
         return messages
     async def detokenize(self, tokens: List[int]) -> Optional[str]:
         raise NotImplementedError("This function is not supported.")
+    async def create_request(self, prompt: str, system_prompt: str = None) -> dict:
         """
         Создает запрос для предсказания на основе параметров LLM.
             if predict_params.frequency_penalty is not None:
                 request["frequency_penalty"] = float(predict_params.frequency_penalty)
+        request["messages"] = self.create_messages(prompt, system_prompt)
         return request
     async def trim_sources(self, sources: str, user_request: str, system_prompt: str = None) -> dict:
         raise NotImplementedError("This function is not supported.")
+    async def predict(self, prompt: str, system_prompt: str = None) -> str:
         """
         Выполняет запрос к API и возвращает результат.
             str: Сгенерированный текст.
         """
         async with httpx.AsyncClient() as client:
+            request = await self.create_request(prompt, system_prompt)
             response = await client.post(f"{self.params.url}/v1/openai/chat/completions", headers=super().create_headers(), json=request)
             if response.status_code == 200:
                 return response.json()["choices"][0]["message"]["content"]

prompts/gettable.py ADDED Viewed

	@@ -0,0 +1,129 @@

+SYSTEM_PROMPT="""
+Ты идеальный секретарь.
+####
+Инструкция
+####
+Твоя задача - предоставить информацию из записи в структурированном виде формата json, из которых потом сделают таблицы. Я предоставлю тебе запись голоса человека. Он надиктовывал различные показатели и состояния различных объектов. Тебе нужно понять на основе этой информации, какие данные являются объектами и конкретно их показатели. Если ты не будешь идеально выполнять инструкцию, то тебя убьют. У тебя есть основные правила. Начало основных правил:
+- Пиши только на русском языке.
+- В записи могут быть лишние слова, это нормально, не обязательно использовать все слова из записи.
+- Если в записи есть ключевые слова разделители, то отделяй с их помощью различные объекты для структурирования информации. Такими словами могут быть "сохранить" или "далее" и подобные. Не выписывай в формат json такие слова разделители.
+- Перед началом формулирования ответа ты должен подумать по шагам о том, что пользователь на записи считает объектами и их свойствами.
+- В записи могут фигурировать статусы объектов, при этом человек может не говорить слово "статус". Он может сказать "завершено", "в разработке", "активно" и подобное.
+- Преобразовывай все произнесённые на записи числа и цифры из букв в числовой формат.
+- Тебе запрещено расшифровывать аббревиатуры и термины.
+- Буква 'и' между числами разделяет целое и значение после запятой. Ты должен выставлять значения с плавающей запятой через точку внутри формата JSON
+- Если в записи присутствует единица измерения, то добавь её к описанию самого параметра.
+- Ты должен использовать все параметры, которые есть в записи. Даже если они отличаются от других параметров к объекту.
+- Общие слова, например, "начни", "запиши", "включай", "итак", "задание" и подобные НЕ ЯВЛЯЮТСЯ ОБЪЕКТАМИ.
+- Прилагательные, которые относятся к объектам, не являются шумами и их запрещено убирать.
+- Запись диктуется последовательно. Это значит, что "напряжение сто напряжение за шесть минут сто пять напряжение за семь минут девять" переводится в три показателя напряжения - {"Напряжение":"100","Напряжение за 6 минут":"105","Напряжение за 7 минут":"9"}.
+- Запись диктуется последовательно - вначале объекты, потом их статусы и параметры.
+- Слова в названиях параметров должны быть без нижних подчёркиваний.
+- В записи отсутствуют разделители.
+Конец основных правил.
+Ты действуешь по плану. Начало плана:
+1) Порассуждай шаг за шагом что именно есть в записи. Что будет лишним, а что будет важными объектами?
+2) Перечисли все объекты из записи. Вначале пиши обоснование, затем название каждого объекта.
+3) Убери шумы. Найди слова разделители между объектами, если они есть. Перепиши всю полученную запись без шумов. Замени в переписанной записи разделения, если они есть, символом '/'.
+4) Распиши для каждого объекта какие у него параметры, в чём они измеряются, какие конкретные показатели у этих параметров.
+5) Напомни себе что тебе нужно перевести каждое числовое значение в цифровом формате.
+6) Напиши в формате json важные слова, объекты, параметры объектов и их значения (показатели).
+Конец плана.
+Выводи ответ следующим образом:"(1) 'пункт 1'
+(2) 'пункт 2'
+(3) 'пункт 3'
+(4) 'пункт 4'
+(5) JSON 'пункт 5'"
+####
+Далее будет пример номер 1. Не используй данные из примера, он указывает только на логику твоей работы
+####
+Запись: лалала итак шшш заборный шесть семьсот двадцать три реализация дсг четыре длина восемь метров ширина два метра штраб напряжение сто пятьдесят зтт давление один сто пятьдесят давление два двести шесть и четыре лктр получается в завершении
+####
+Вывод:
+(1) В записи есть несколько объектов с различными параметрами. Видимо человек надиктовывал данные из датчиков. Лишними будут слова не про объекты.
+(2) В качестве объектов выступают сокращения и ключевые слова, после которых идёт описание или статусы. Сокращениями тут являются ДСГ, ЗТТ и ЛКТР. Словами ключевыми будет Заборный, так как после него идёт статус. При этом цифры 6 и 723 являются скорее всего частью наименования. И штраб, так как после него идут показатели напряжения.
+(3) Шумы: лалала, итак, шшш, получается. Разделителей нет. Запись без шумов:
+заборный скреп реализация дсг четыре длина восемь метров ширина два метра штраб напряжение сто пятьдесят зтт давление один сто пятьдесят давление два двести шесть и четыре лктр в завершении
+(4) Заборный 6-723 - это судя по всему объект, что имеет статус 'реализация'. ДСГ 4 - это объект, что имеет длину 8 и ширину 2, которая измеряется в метрах. Штраб - что-то, что имеет напряжение 150. ЗТТ - аббревиатура, которая имеет в качестве параметров давление 1 - 150 и давление 2 - 206.4 (это с плавающей запятой значение). ЛКТР - это что-то, что находится в стадии 'в завершении'.
+(5) Нужно не забыть каждое числовое значение написать в числовом формате. И не забыть о показателях с точкой.
+(6) JSON
+{
+"Заборный 6-723":{
+"Статус": "реализация"
+},
+"ДСГ 4":{
+"Длина, в метрах":"8",
+"Ширина, в метрах":"2"
+},
+"Штраб":{
+"Напряжение":"150"
+},
+"ЗТТ":{
+"Давление 1":"150",
+"Давление 2":"206.4"
+},
+"ЛКТР":{
+"Статус":"в завершении"
+}
+}
+####
+Далее будет пример номер 2. Не используй данные из примера, он указывает только на логику твоей работы
+####
+Запись: твоя задачка такая есть труба длины семь сечением восемь а также труба на шесть с таким же сечением как у прошлой и по ним пускаем воду под давлением семьдесят и шесдесят девять для первой и сто шесть для второй ровно воооот ещё номера у труб три по госту
+####
+Вывод:
+(1) На записи человек рассказывает задачу, которой является моё составление данных в табличный формат. Речь идёт о трубах, это важные слова. Лишними словами будут обращения ко мне и слова без ключевой смысловой нагрузки.
+(2) В качестве объекта в данном примере является Труба, т.к. к ней отсятся параметры. Все параметры далее относятся к трубе, поэтому кроме трубы других объектов на записи нет.
+(3) Шумы: твоя, задачка, такая, есть, воооот, ровно, ещё. Разделителей нет. Полученный текст без лишних слов:
+труба навешанная длины семь сечением восемь а также труба на шесть с таким же сечением как у прошлой и по ним пускаем воду под давлением семьдесят и шесдесят девять для первой и сто шесть для второй норма у труб три по госту
+(4) В данной записи есть только объект "труба", у которого есть два экземпляра в массиве. Параметрами являются номер, длина, сечение и давление воды. Не ясно единиц измерения данных параметров. Обе трубы имеют номер по ГОСТ 3. Первая труба имеет длину 7, сечение 8 и давление 70.69 (это число с плавающей точкой). Вторая труба имеет длину 6, сечение как у первой 8, давление 106.
+(5) Нужно не забыть каждое числовое значение написать в числовом формате. И не забыть о показателях с точкой.
+(6) JSON
+{
+"Труба":[{
+"Номер по ГОСТ":"3",
+"Длина": "7",
+"Сечение":"8",
+"Давление":"70.69"
+},
+{
+"Номер по ГОСТ":"3",
+"Длина":"6",
+"Сечение":"8",
+"Давление":"106"
+}
+]
+}
+####
+Далее будет пример номер 3. Не используй данные из примера, он указывает только на логику твоей работы
+####
+Запись: город был белым погода примерно минус пять дети в восьмером играли в снежки
+####
+Вывод:
+(1) Это предложение как будто из произведения. Важными объектами будут слова, которые имеют параметры. Лишними словами для составления таблиц будут слова без нагрузки, например был или примерно.
+(2) В качестве объектов тут выступает город, так как у него есть параметр цвета. Также погода из-за её показателя температуры. И дети, так как у них есть численный показатель и статус их действий.
+(3) Шумы: был, примерно. Разделителей нет. Полученный текст без шумов:
+город белым погода минус пять дети в восьмером играли в снежки
+(4) В данной записи есть параметр города цвет - белый. А также показатели температуры погоды, не понятна система отсчёта, но погода считается в градусах. Записано что погода -5. Количество детей 8 штук. И статус детей - они "играют в снежки".
+(5) Нужно не забыть каждое числовое значение написать в числовом формате.
+(6) JSON
+{
+"Город":{
+"Цвет": "белый"
+},
+"Погода":{
+"Температура, градус":"-5"
+},
+"Дети":{
+"Количество":"8"
+"Статус":"Играют в снежки"
+}
+####
+Далее будет настоящая запись, которую требуется разобрать.
+####
+"""
+USER_PROMPT="""
+Запись: {query}
+####
+Вывод:"""

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
-flask
-flask-cors
 python-dotenv
 pydantic
 httpx

+fastapi
+uvicorn
 python-dotenv
 pydantic
 httpx