Spaces:

fioriclass
/

emotion_classifier

Paused

App Files Files Community

fioriclass commited on Apr 8

Commit

ed87211

1 Parent(s): 1a758de

correction config et yaml

Browse files

Files changed (4) hide show

src/base_trainer.py +6 -3
src/conf/config.yaml +10 -4
src/main.py +32 -21
src/mlflow_integration/mlflow_decorator.py +1 -1

src/base_trainer.py CHANGED Viewed

@@ -121,9 +121,12 @@ class BaseTrainer(ABC):
         if self.config.model.params:
             mlflow.log_params(self.config.model.params)
-        # Logue aussi les hyperparamètres du classifieur s'il offre get_params()
-        if self.classifier and hasattr(self.classifier, "get_params"):
-            mlflow.log_params(self.classifier.get_params())
     def _prepare_input_for_fit(
             self, X: Union[cp.ndarray,

         if self.config.model.params:
             mlflow.log_params(self.config.model.params)
+        # Les paramètres pertinents du modèle (ceux utilisés pour l'initialiser, ex: C, kernel pour SVM)
+        # sont déjà loggués via self.config.model.params ci-dessus, qui est correctement
+        # peuplé grâce à l'interpolation Hydra dans config.yaml.
+        # Éviter de logger self.classifier.get_params() car cela est redondant et
+        # inclut des objets internes non sérialisables comme le handle RAFT/GPU,
+        # causant l'apparition de "<pylibraft.common.handle.Handle object ...>" dans les logs MLflow.
     def _prepare_input_for_fit(
             self, X: Union[cp.ndarray,

src/conf/config.yaml CHANGED Viewed

@@ -1,11 +1,17 @@
-# conf/config.yaml
 defaults:
-  - model
-  - _self_
 model:
-  type: "svm"
 data:
   path: "dataset/dataset.csv"

+# src/conf/config.yaml
 defaults:
+  - model # Charge src/conf/model.yaml (qui définit la clé 'models')
+  # La ligne suivante utilise l'interpolation Hydra:
+  # 1. ${model.type} récupère la valeur de 'type' dans la section 'model' (ex: "svm")
+  # 2. ${models.svm} récupère le dictionnaire sous la clé 'svm' dans la section 'models' (chargée depuis model.yaml)
+  # 3. 'override /model/params:' place ce dictionnaire dans la clé 'params' de la section 'model'
+  - override /model/params: ${models.${model.type}}
+  - _self_ # Applique les valeurs définies dans ce fichier en dernier
 model:
+  type: "svm" # Définit quel modèle choisir
+  params: {} # Cible pour l'override, sera remplacé par les params de models.svm
 data:
   path: "dataset/dataset.csv"

src/main.py CHANGED Viewed

@@ -97,11 +97,17 @@ def main(cfg: DictConfig) -> None:
     Args:
         cfg: Configuration Hydra sous forme de DictConfig
     """
-    # Conversion de la configuration Hydra en configuration Pydantic
-    config_dict = OmegaConf.to_container(cfg, resolve=True)
-    config = Config(**config_dict)
-    logger.info(f"Configuration chargée: {config}")
     # Création du trainer approprié
     trainer = get_trainer(config)
@@ -109,31 +115,36 @@ def main(cfg: DictConfig) -> None:
     # Construction des composants (vectorizer, classifier, etc.)
     trainer.build_components()
     mlflow_decorator = MLflowDecorator(
         experiment_name=config.mlflow.experiment_name,
         tracking_uri=config.mlflow.tracking_uri
     )
-    # Appliquer le décorateur aux méthodes clés
-    train_with_mlflow = mlflow_decorator(trainer.train)
-    evaluate_with_mlflow = mlflow_decorator(trainer.evaluate)
-    log_params_with_mlflow = mlflow_decorator(trainer.log_parameters_to_mlflow)
-    optimize_if_needed_with_mlflow = mlflow_decorator(trainer.optimize_if_needed)
-    logger.info("Vérification et lancement de l'optimisation des hyperparamètres si nécessaire (avec MLflow)...")
-    optimize_if_needed_with_mlflow()
-    logger.info("Lancement de l'entraînement avec MLflow...")
-    train_with_mlflow()
-    logger.info("Lancement de l'évaluation avec MLflow...")
-    evaluate_with_mlflow()
-    logger.info("Logging des paramètres avec MLflow...")
-    log_params_with_mlflow()
-    logger.info("Entraînement, évaluation et logging des paramètres terminés avec succès via MLflow.")
 if __name__ == "__main__":

     Args:
         cfg: Configuration Hydra sous forme de DictConfig
     """
+    # La configuration Hydra 'cfg' est maintenant correctement structurée grâce aux defaults dans config.yaml.
+    # Conversion directe en configuration Pydantic.
+    try:
+        # Convertit directement cfg en dict et l'utilise pour instancier Config
+        config = Config(**OmegaConf.to_container(cfg, resolve=True))
+    except Exception as e:
+        logger.error(f"Erreur lors de la validation Pydantic de la configuration: {e}")
+        logger.error(f"Configuration après fusion Hydra: \n{OmegaConf.to_yaml(cfg)}")
+        raise
+    logger.info(f"Configuration Pydantic finale chargée: {config}")
     # Création du trainer approprié
     trainer = get_trainer(config)
     # Construction des composants (vectorizer, classifier, etc.)
     trainer.build_components()
+    # Définir la séquence d'opérations à exécuter dans un seul run MLflow
+    def run_pipeline(trainer_instance):
+        logger.info("Vérification et lancement de l'optimisation des hyperparamètres si nécessaire...")
+        trainer_instance.optimize_if_needed()
+        logger.info("Lancement de l'entraînement...")
+        trainer_instance.train()
+        logger.info("Lancement de l'évaluation...")
+        trainer_instance.evaluate()
+        logger.info("Logging des paramètres...")
+        trainer_instance.log_parameters_to_mlflow()
+        logger.info("Pipeline complet (optimisation, entraînement, évaluation, logging) terminé.")
+    # Initialiser le décorateur MLflow
     mlflow_decorator = MLflowDecorator(
         experiment_name=config.mlflow.experiment_name,
         tracking_uri=config.mlflow.tracking_uri
     )
+    # Appliquer le décorateur à la fonction pipeline complète
+    run_pipeline_with_mlflow = mlflow_decorator(run_pipeline)
+    # Exécuter le pipeline complet sous un seul run MLflow
+    logger.info("Lancement du pipeline complet avec MLflow...")
+    run_pipeline_with_mlflow(trainer)
+    logger.info("Pipeline MLflow terminé avec succès.")
 if __name__ == "__main__":

src/mlflow_integration/mlflow_decorator.py CHANGED Viewed

@@ -46,7 +46,7 @@ class MLflowDecorator:
         """
         Démarre explicitement un run MLflow.
         """
-        mlflow.start_run()
     def _log_params(self, params: Dict[str, Any]) -> None:
         """

         """
         Démarre explicitement un run MLflow.
         """
+        mlflow.start_run(log_system_metrics=True)
     def _log_params(self, params: Dict[str, Any]) -> None:
         """