Spaces:

AIWebDev
/

smartdocai

Running

App Files Files Community

FatimaGr commited on 4 days ago

Commit

926c563

verified ·

1 Parent(s): 8c1bdc0

add

Browse files

Files changed (1) hide show

app.py +16 -26

app.py CHANGED Viewed

@@ -197,8 +197,8 @@ async def generate_viz(file: UploadFile = File(...), query: str = Form(...)):
         if query not in VALID_PLOTS:
             return JSONResponse(content={"error": f"Type de graphique invalide. Choisissez parmi : {', '.join(VALID_PLOTS)}"}, status_code=400)
-        file_content = await file.read()  # <- on lit tout
-        df = pd.read_excel(BytesIO(file_content))  # <- on lit depuis un buffer
         numeric_cols = df.select_dtypes(include=["number"]).columns
         if len(numeric_cols) < 1:
@@ -206,22 +206,16 @@ async def generate_viz(file: UploadFile = File(...), query: str = Form(...)):
         x_col = numeric_cols[0]
         y_col = numeric_cols[1] if query != "histplot" and len(numeric_cols) > 1 else None
-        prompt_y = f', y="{y_col}"' if y_col else ""
-        # Prompt pour l'IA
         prompt = f"""
-### Génère uniquement du code Python fonctionnel pour tracer un {query} avec Matplotlib et Seaborn ###
-# Contraintes :
-# - Utilise 'df' sans recréer de nouvelles données
-# - Axe X : '{x_col}'
-# - Enregistre le graphique sous 'plot.png'
-# - Ne génère que du code Python valide, sans texte explicatif
-import matplotlib.pyplot as plt
-import seaborn as sns
-plt.figure(figsize=(8,6))
-sns.{query}(data=df, x="{x_col}"{prompt_y})
-plt.savefig("plot.png")
-plt.close()
 """
         print("🟣 Prompt envoyé au modèle :")
@@ -234,28 +228,25 @@ plt.close()
             pad_token_id=codegen_tokenizer.eos_token_id
         )
-        print("🟠 Raw output du modèle :")
-        print(outputs)
         generated_code = codegen_tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
-        # Nettoyage
         generated_code = re.sub(r"(import matplotlib.pyplot as plt\nimport seaborn as sns\n)+", "import matplotlib.pyplot as plt\nimport seaborn as sns\n", generated_code)
-        generated_code = generated_code.split("###")[0].strip()  # <- Ajout pour enlever tout ce qui suit s'il y a des '###'
-        if generated_code.strip().endswith("sns.") or len(generated_code.strip()) < 20:
-            return JSONResponse(content={"error": "Erreur : Code généré invalide ou incomplet."}, status_code=500)
         print("🔵 Code généré propre :")
         print(generated_code)
         try:
             compile(generated_code, "<string>", "exec")
         except SyntaxError as e:
             return JSONResponse(content={"error": f"Erreur de syntaxe détectée : {e}\nCode généré :\n{generated_code}"}, status_code=422)
         exec_env = {"df": df, "plt": plt, "sns": sns, "pd": pd}
-        print("🔹🔹🔹 Code réellement exécuté :")
         exec(generated_code, exec_env)
         img_path = "plot.png"
@@ -277,7 +268,6 @@ plt.close()
 # Charger le modèle de résumé
 summarizer = None
 try:

         if query not in VALID_PLOTS:
             return JSONResponse(content={"error": f"Type de graphique invalide. Choisissez parmi : {', '.join(VALID_PLOTS)}"}, status_code=400)
+        file_content = await file.read()
+        df = pd.read_excel(BytesIO(file_content))
         numeric_cols = df.select_dtypes(include=["number"]).columns
         if len(numeric_cols) < 1:
         x_col = numeric_cols[0]
         y_col = numeric_cols[1] if query != "histplot" and len(numeric_cols) > 1 else None
+        # ✅ Nouveau prompt (uniquement des instructions)
         prompt = f"""
+Génère uniquement du code Python fonctionnel pour tracer un {query} avec Matplotlib et Seaborn.
+Contraintes :
+- Utilise 'df' sans recréer de nouvelles données
+- Axe X : '{x_col}'
+- {f"Axe Y : '{y_col}'" if y_col else ''}
+- Enregistre le graphique sous 'plot.png'
+- Ne génère que du code Python valide, sans texte explicatif
 """
         print("🟣 Prompt envoyé au modèle :")
             pad_token_id=codegen_tokenizer.eos_token_id
         )
         generated_code = codegen_tokenizer.decode(outputs[0], skip_special_tokens=True).strip()
+        # Nettoyage de sécurité
         generated_code = re.sub(r"(import matplotlib.pyplot as plt\nimport seaborn as sns\n)+", "import matplotlib.pyplot as plt\nimport seaborn as sns\n", generated_code)
+        generated_code = generated_code.strip()
         print("🔵 Code généré propre :")
         print(generated_code)
+        if not generated_code or len(generated_code.splitlines()) < 3:
+            return JSONResponse(content={"error": "Erreur : Code généré invalide ou incomplet."}, status_code=500)
         try:
             compile(generated_code, "<string>", "exec")
         except SyntaxError as e:
             return JSONResponse(content={"error": f"Erreur de syntaxe détectée : {e}\nCode généré :\n{generated_code}"}, status_code=422)
+        # 🛡️ Exécution dans environnement contrôlé
         exec_env = {"df": df, "plt": plt, "sns": sns, "pd": pd}
         exec(generated_code, exec_env)
         img_path = "plot.png"
 # Charger le modèle de résumé
 summarizer = None
 try: