Spaces:

rote1
/

IAGO

Sleeping

App Files Files Community

lazychih114 commited on Mar 8

Commit

4d796f5

2 Parent(s): 76c8819 cb09349

Merge branch 'main' of https://github.com/camel-ai/owl

Browse files

Files changed (5) hide show

README_zh.md +6 -2
owl/.env_template +6 -9
owl/camel/toolkits/video_analysis_toolkit.py +3 -8
owl/run.py +6 -6
owl/run_gaia_roleplaying.py +1 -1

README_zh.md CHANGED Viewed

@@ -36,12 +36,16 @@
 </h4>
 <div align="center">
 🦉 OWL 是一个前沿的多智能体协作框架，推动任务自动化的边界，构建在 [CAMEL-AI Framework](https://github.com/camel-ai/camel)。
-OWL 在 GAIA 基准测试中取得 **58.18** 平均分，在开源框架中排名 🏅️ #1。
 我们的愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互，OWL 实现了跨多领域更自然、高效且稳健的任务自动化。
 </div>

 </h4>
+<div align="center" style="background-color: #f0f7ff; padding: 10px; border-radius: 5px; margin: 15px 0;">
+  <h3 style="color: #1e88e5; margin: 0;">
+    🏆 OWL 在 GAIA 基准测试中取得 <span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">58.18</span> 平均分，在开源框架中排名 <span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">🏅️ #1</span>！ 🏆
+  </h3>
+</div>
 <div align="center">
 🦉 OWL 是一个前沿的多智能体协作框架，推动任务自动化的边界，构建在 [CAMEL-AI Framework](https://github.com/camel-ai/camel)。
 我们的愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互，OWL 实现了跨多领域更自然、高效且稳健的任务自动化。
 </div>

owl/.env_template CHANGED Viewed

@@ -1,19 +1,14 @@
 # MODEL & API (See https://github.com/camel-ai/camel/blob/master/camel/types/enums.py)
-DEFAULT_MODEL_PLATFORM_TYPE = "OPENAI"
-DEFAULT_MODEL_TYPE = "gpt-4o"
-OPENAI_API_BASE_URL = ""
 # OPENAI API
 OPENAI_API_KEY = ""
-# Hugging Face API (https://huggingface.co/join)
-HF_TOKEN=""
 # Qwen API (https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key)
-QWEN_API_KEY=""
 # DeepSeek API (https://platform.deepseek.com/api_keys)
-DEEPSEEK_API_KEY="
 #===========================================
 # Tools & Services API
@@ -23,9 +18,11 @@ DEEPSEEK_API_KEY="
 GOOGLE_API_KEY=""
 SEARCH_ENGINE_ID=""
 # Chunkr API (https://chunkr.ai/)
 CHUNKR_API_KEY=""
 # Firecrawl API (https://www.firecrawl.dev/)
 FIRECRAWL_API_KEY=""

 # MODEL & API (See https://github.com/camel-ai/camel/blob/master/camel/types/enums.py)
 # OPENAI API
 OPENAI_API_KEY = ""
+# OPENAI_API_BASE_URL = ""
 # Qwen API (https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key)
+# QWEN_API_KEY=""
 # DeepSeek API (https://platform.deepseek.com/api_keys)
+# DEEPSEEK_API_KEY=""
 #===========================================
 # Tools & Services API
 GOOGLE_API_KEY=""
 SEARCH_ENGINE_ID=""
+# Hugging Face API (https://huggingface.co/join)
+HF_TOKEN=""
 # Chunkr API (https://chunkr.ai/)
 CHUNKR_API_KEY=""
 # Firecrawl API (https://www.firecrawl.dev/)
 FIRECRAWL_API_KEY=""

owl/camel/toolkits/video_analysis_toolkit.py CHANGED Viewed

@@ -28,12 +28,10 @@ from scenedetect.detectors import (  # type: ignore[import-untyped]
 )
 from camel.agents import ChatAgent
-from camel.configs import QwenConfig
 from camel.messages import BaseMessage
-from camel.models import ModelFactory, OpenAIAudioModels
 from camel.toolkits.base import BaseToolkit
 from camel.toolkits.function_tool import FunctionTool
-from camel.types import ModelPlatformType, ModelType
 from camel.utils import dependencies_required
 from .video_downloader_toolkit import (
@@ -101,6 +99,7 @@ class VideoAnalysisToolkit(BaseToolkit):
     def __init__(
         self,
         download_directory: Optional[str] = None,
     ) -> None:
         self._cleanup = download_directory is None
@@ -125,11 +124,7 @@ class VideoAnalysisToolkit(BaseToolkit):
         logger.info(f"Video will be downloaded to {self._download_directory}")
-        self.vl_model = ModelFactory.create(
-            model_platform=ModelPlatformType.QWEN,
-            model_type=ModelType.QWEN_VL_MAX,
-            model_config_dict=QwenConfig(temperature=0.2).as_dict(),
-        )
         self.vl_agent = ChatAgent(
             model=self.vl_model, output_language="English"

 )
 from camel.agents import ChatAgent
 from camel.messages import BaseMessage
+from camel.models import OpenAIAudioModels, BaseModelBackend
 from camel.toolkits.base import BaseToolkit
 from camel.toolkits.function_tool import FunctionTool
 from camel.utils import dependencies_required
 from .video_downloader_toolkit import (
     def __init__(
         self,
         download_directory: Optional[str] = None,
+        model: Optional[BaseModelBackend] = None,
     ) -> None:
         self._cleanup = download_directory is None
         logger.info(f"Video will be downloaded to {self._download_directory}")
+        self.vl_model = model
         self.vl_agent = ChatAgent(
             model=self.vl_model, output_language="English"

owl/run.py CHANGED Viewed

@@ -24,14 +24,14 @@ def construct_society(question: str) -> OwlRolePlaying:
     assistant_role_name = "assistant"
     user_model = ModelFactory.create(
-        model_platform=ModelPlatformType.DEFAULT,
-        model_type=ModelType.DEFAULT,
         model_config_dict=ChatGPTConfig(temperature=0, top_p=1).as_dict(), # [Optional] the config for model
     )
     assistant_model = ModelFactory.create(
-        model_platform=ModelPlatformType.DEFAULT,
-        model_type=ModelType.DEFAULT,
         model_config_dict=ChatGPTConfig(temperature=0, top_p=1).as_dict(), # [Optional] the config for model
     )
@@ -42,10 +42,10 @@ def construct_society(question: str) -> OwlRolePlaying:
             planning_agent_model=assistant_model
         ).get_tools(),
         *DocumentProcessingToolkit().get_tools(),
-        *VideoAnalysisToolkit().get_tools(),  # This requires OpenAI and Qwen Key
         *CodeExecutionToolkit().get_tools(),
         *ImageAnalysisToolkit(model=assistant_model).get_tools(),
-        *AudioAnalysisToolkit().get_tools(),  # This requires OpenAI Key
         *SearchToolkit(model=assistant_model).get_tools(),
         *ExcelToolkit().get_tools()
     ]

     assistant_role_name = "assistant"
     user_model = ModelFactory.create(
+        model_platform=ModelPlatformType.OPENAI,
+        model_type=ModelType.GPT_4O,
         model_config_dict=ChatGPTConfig(temperature=0, top_p=1).as_dict(), # [Optional] the config for model
     )
     assistant_model = ModelFactory.create(
+        model_platform=ModelPlatformType.OPENAI,
+        model_type=ModelType.GPT_4O,
         model_config_dict=ChatGPTConfig(temperature=0, top_p=1).as_dict(), # [Optional] the config for model
     )
             planning_agent_model=assistant_model
         ).get_tools(),
         *DocumentProcessingToolkit().get_tools(),
+        *VideoAnalysisToolkit(model=assistant_model).get_tools(),  # This requires OpenAI Key
+        *AudioAnalysisToolkit().get_tools(),  # This requires OpenAI Key
         *CodeExecutionToolkit().get_tools(),
         *ImageAnalysisToolkit(model=assistant_model).get_tools(),
         *SearchToolkit(model=assistant_model).get_tools(),
         *ExcelToolkit().get_tools()
     ]

owl/run_gaia_roleplaying.py CHANGED Viewed

@@ -43,7 +43,7 @@ def main():
             planning_agent_model=assistant_model
         ).get_tools(),
         *DocumentProcessingToolkit().get_tools(),
-        *VideoAnalysisToolkit().get_tools(),  # This requires OpenAI and Qwen Key
         *CodeExecutionToolkit().get_tools(),
         *ImageAnalysisToolkit(model=assistant_model).get_tools(),
         *AudioAnalysisToolkit().get_tools(),  # This requires OpenAI Key

             planning_agent_model=assistant_model
         ).get_tools(),
         *DocumentProcessingToolkit().get_tools(),
+        *VideoAnalysisToolkit(model=assistant_model).get_tools(),  # This requires OpenAI Key
         *CodeExecutionToolkit().get_tools(),
         *ImageAnalysisToolkit(model=assistant_model).get_tools(),
         *AudioAnalysisToolkit().get_tools(),  # This requires OpenAI Key