Spaces:

UntilDot
/

Flask

Running

App Files Files Community

UntilDot commited on 5 days ago

Commit

770da3f

verified ·

1 Parent(s): 7a521ea

Update llm/agents.py

Browse files

Files changed (1) hide show

llm/agents.py +59 -31

llm/agents.py CHANGED Viewed

@@ -1,35 +1,44 @@
 import asyncio
 import httpx
 import os
-OPENROUTER_BASE = "https://openrouter.ai/api/v1/chat/completions"
-HEADERS = {
-    "Authorization": f"Bearer {os.getenv('OPENROUTER_API_KEY')}",
-    "Content-Type": "application/json",
-}
-ALLOWED_MODELS = [
-    "deepseek/deepseek-chat-v3-0324:free",
-    "google/gemini-2.0-flash-exp:free",
-    "meta-llama/llama-4-maverick:free",
-    "microsoft/mai-ds-r1:free",
-    "meta-llama/llama-4-scout:free",
-    "google/gemma-3-27b-it:free",
-    "qwen/qwq-32b:free",
-    "qwen/qwen2.5-vl-72b-instruct:free",
-    "qwen/qwen-2.5-72b-instruct:free",
-    "google/gemini-2.5-pro-exp-03-25:free",
-    "deepseek/deepseek-r1:free",
-]
-async def call_openrouter(model: str, prompt: str) -> str:
     body = {
         "model": model,
         "messages": [{"role": "user", "content": prompt}],
         "temperature": 0.7,
     }
     async with httpx.AsyncClient(timeout=30) as client:
-        response = await client.post(OPENROUTER_BASE, headers=HEADERS, json=body)
         response.raise_for_status()
         return response.json()["choices"][0]["message"]["content"]
@@ -39,15 +48,11 @@ async def query_llm_agent(name: str, prompt: str, settings: dict) -> str:
     if not selected_model:
         return f"[{name}] No model selected."
-    # Auto-append ":free" if missing
-    if not selected_model.endswith(":free"):
-        selected_model += ":free"
-    if selected_model not in ALLOWED_MODELS:
         return f"[{name}] Model '{selected_model}' is not supported."
     try:
-        response = await call_openrouter(selected_model, prompt)
         return f"[{name}] {response}"
     except Exception as e:
         return f"[{name}] Error: {str(e)}"
@@ -55,8 +60,31 @@ async def query_llm_agent(name: str, prompt: str, settings: dict) -> str:
 async def query_all_llms(prompt: str, settings: dict) -> list:
     agents = ["LLM-A", "LLM-B", "LLM-C"]
     tasks = [query_llm_agent(agent, prompt, settings) for agent in agents]
-    results = await asyncio.gather(*tasks)
-    return results
 def query_all_llms_sync(prompt: str, settings: dict) -> list:
-    return asyncio.run(query_all_llms(prompt, settings))

 import asyncio
 import httpx
 import os
+import json
+# Load model config at startup
+with open("llm/model_config.json", "r") as f:
+    CONFIG = json.load(f)
+PROVIDERS = CONFIG["providers"]
+MODEL_PROVIDER_MAPPING = CONFIG["models"]
+async def call_model_api(model: str, prompt: str) -> str:
+    provider_key = MODEL_PROVIDER_MAPPING.get(model)
+    if not provider_key:
+        raise ValueError(f"No provider configured for model: {model}")
+    provider = PROVIDERS.get(provider_key)
+    if not provider:
+        raise ValueError(f"Provider {provider_key} not found in config")
+    url = provider["url"]
+    api_key_env = provider["key_env"]
+    api_key = os.getenv(api_key_env)
+    if not api_key:
+        raise ValueError(f"Missing API key for provider {provider_key}")
+    headers = {
+        "Authorization": f"Bearer {api_key}",
+        "Content-Type": "application/json",
+    }
     body = {
         "model": model,
         "messages": [{"role": "user", "content": prompt}],
         "temperature": 0.7,
     }
     async with httpx.AsyncClient(timeout=30) as client:
+        response = await client.post(url, headers=headers, json=body)
         response.raise_for_status()
         return response.json()["choices"][0]["message"]["content"]
     if not selected_model:
         return f"[{name}] No model selected."
+    if selected_model not in MODEL_PROVIDER_MAPPING:
         return f"[{name}] Model '{selected_model}' is not supported."
     try:
+        response = await call_model_api(selected_model, prompt)
         return f"[{name}] {response}"
     except Exception as e:
         return f"[{name}] Error: {str(e)}"
 async def query_all_llms(prompt: str, settings: dict) -> list:
     agents = ["LLM-A", "LLM-B", "LLM-C"]
     tasks = [query_llm_agent(agent, prompt, settings) for agent in agents]
+    return await asyncio.gather(*tasks)
+async def query_aggregator(responses: list, settings: dict) -> str:
+    model = settings.get("aggregator")
+    if not model:
+        return "[Aggregator] No aggregator model selected."
+    if model not in MODEL_PROVIDER_MAPPING:
+        return f"[Aggregator] Model '{model}' is not supported."
+    system_prompt = (
+        "You are an aggregator AI. Your task is to read the following responses "
+        "from different AI agents and produce a single, high-quality response.\n\n"
+        + "\n\n".join(responses)
+    )
+    try:
+        result = await call_model_api(model, system_prompt)
+        return f"[Aggregator] {result}"
+    except Exception as e:
+        return f"[Aggregator] Error: {str(e)}"
 def query_all_llms_sync(prompt: str, settings: dict) -> list:
+    return asyncio.run(query_moa_chain(prompt, settings))
+async def query_moa_chain(prompt: str, settings: dict) -> list:
+    responses = await query_all_llms(prompt, settings)
+    aggregator = await query_aggregator(responses, settings)
+    return responses + [aggregator]