Spaces:

fioriclass
/

emotion_classifier

Sleeping

fioriclass commited on 13 days ago

Commit

2e5a32e

1 Parent(s): bc3d9ee

pas d'eval avant la fin pour les transformers pas d'optimisation des parametres

Files changed (2) hide show

src/main.py CHANGED Viewed

@@ -153,11 +153,20 @@ def main(cfg: DictConfig) -> None:
         # Log des métriques
         mlflow.log_metrics(metrics)
-        logger.info("Logging des paramètres...")
-        trainer_instance.log_parameters_to_mlflow()
         # Log du modèle final (vectorizer+classifier) sous forme PyFunc
-        log_cuml_model_to_mlflow(trainer_instance)
         logger.info("Pipeline MLflow complet terminé.")

         # Log des métriques
         mlflow.log_metrics(metrics)
+        # Log des paramètres uniquement si ce n'est pas un trainer Hugging Face
+        # car le Trainer HF logue déjà ses propres paramètres (TrainingArguments)
+        if not isinstance(trainer_instance, HuggingFaceTransformerTrainer):
+            logger.info("Logging des paramètres...")
+            trainer_instance.log_parameters_to_mlflow()
+        else:
+            logger.info("Logging des paramètres désactivé pour HuggingFaceTransformerTrainer (géré par HF Trainer).")
         # Log du modèle final (vectorizer+classifier) sous forme PyFunc
+        # Note: Cette fonction est spécifique aux modèles cuML pour le moment
+        if hasattr(trainer_instance, 'vectorizer') and trainer_instance.vectorizer is not None:
+             log_cuml_model_to_mlflow(trainer_instance)
+        else:
+             logger.info("Logging du modèle PyFunc non applicable pour ce type de trainer.")
         logger.info("Pipeline MLflow complet terminé.")

src/trainers/huggingface/huggingface_transformer_trainer.py CHANGED Viewed

@@ -257,16 +257,24 @@ class HuggingFaceTransformerTrainer(BaseTrainer):
         """
         params = self.config.model.params
         return TrainingArguments(
-            output_dir=params.get("output_dir", "./results"),
-            num_train_epochs=float(params.get("epochs", 3)),
-            per_device_train_batch_size=int(params.get("batch_size", 8)),
-            per_device_eval_batch_size=int(params.get("batch_size", 8)),
-            learning_rate=float(params.get("learning_rate", 5e-5)),
-            warmup_steps=int(params.get("warmup_steps", 0)),
-            weight_decay=float(params.get("weight_decay", 0.0)),
-            # Paramètres d'évaluation simplifiés pour compatibilité
-            eval_steps=100,  # Évaluer tous les 100 pas
-            save_steps=100,  # Sauvegarder tous les 100 pas
-            logging_dir=params.get("logging_dir", "./logs"),
-            logging_steps=int(params.get("logging_steps", 10))
         )

         """
         params = self.config.model.params
         return TrainingArguments(
+            output_dir="./results",
+            num_train_epochs=float(params.get("epochs")),
+            per_device_train_batch_size=int(params.get("batch_size")),
+            per_device_eval_batch_size=int(params.get("batch_size")),
+            learning_rate=float(params.get("learning_rate")),
+            warmup_steps=int(params.get("warmup_steps")),
+            weight_decay=float(params.get("weight_decay")),
+            evaluation_strategy="epoch",
+            save_strategy="epoch",
+            logging_dir="./logs",
+            logging_steps=10
+            # Ne pas désactiver les rapports MLflow intégrés
         )
+    def optimize_if_needed(self) -> None:
+        """
+        Surcharge la méthode optimize_if_needed de BaseTrainer pour désactiver
+        l'optimisation des hyperparamètres pour les modèles transformers.
+        """
+        # Ne rien faire, ce qui désactive l'optimisation des hyperparamètres
+        return