Spaces:

Lod34
/

Animator2D-v1.0.0

Running

App Files Files Community

Lod34 commited on Apr 4

Commit

2268f5b

verified ·

1 Parent(s): 0db91c9

Update app.py

Browse files

Files changed (1) hide show

app.py +54 -31

app.py CHANGED Viewed

@@ -4,10 +4,17 @@ from transformers import BertTokenizer, BertModel
 import torchvision.transforms as transforms
 from PIL import Image
 import numpy as np
-import os
 # Imposta il dispositivo
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # Trasformazioni per le immagini
 transform = transforms.Compose([
@@ -15,7 +22,7 @@ transform = transforms.Compose([
     transforms.ToTensor(),
 ])
-# Definizione del modello Animator2D (uguale al training)
 class Animator2DModel(torch.nn.Module):
     def __init__(self):
         super(Animator2DModel, self).__init__()
@@ -41,40 +48,49 @@ class Animator2DModel(torch.nn.Module):
         return generated_frames.view(-1, num_frames, 3, 64, 64)
 # Funzione per generare i frame
-def generate_animation(description, base_frame_image, num_frames=3):
-    # Carica il modello da Hugging Face
-    model = Animator2DModel().to(device)
-    model.load_state_dict(torch.hub.load_state_dict_from_url(
-        "https://huggingface.co/Lod34/Animator2D-v1.0.0/resolve/main/animator2d_v1_0_0.pth",
-        map_location=device))
-    model.eval()
-    # Prepara il testo
-    tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
-    inputs = tokenizer(description, return_tensors='pt', padding='max_length',
-                       truncation=True, max_length=512)
-    input_ids = inputs['input_ids'].to(device)
-    attention_mask = inputs['attention_mask'].to(device)
-    # Prepara l'immagine di base
-    base_frame = transform(base_frame_image).unsqueeze(0).to(device)
-    # Genera i frame
-    with torch.no_grad():
-        generated_frames = model(input_ids, attention_mask, base_frame, num_frames)
-    # Converte i frame generati in immagini PIL
-    generated_frames = generated_frames.squeeze(0).cpu().numpy()
-    output_frames = []
-    for i in range(num_frames):
-        frame = generated_frames[i].transpose(1, 2, 0)  # Da (C, H, W) a (H, W, C)
-        frame = np.clip(frame, 0, 1)  # Normalizza tra 0 e 1
-        frame = (frame * 255).astype(np.uint8)  # Converte in formato immagine
-        output_frames.append(Image.fromarray(frame))
-    return output_frames
 # Interfaccia Gradio
 with gr.Blocks(title="Animator2D-v1.0.0") as demo:
     gr.Markdown("# Animator2D-v1.0.0\nInserisci una descrizione e un'immagine di base per generare un'animazione!")
@@ -88,4 +104,11 @@ with gr.Blocks(title="Animator2D-v1.0.0") as demo:
         with gr.Column():
             output_gallery = gr.Gallery(label="Frame generati", show_label=True)
-    submit_button.click

 import torchvision.transforms as transforms
 from PIL import Image
 import numpy as np
+import logging
+# Configura il logging
+logging.basicConfig(level=logging.INFO)
+logger = logging.getLogger(__name__)
+logger.info("Inizio inizializzazione dell'app")
 # Imposta il dispositivo
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+logger.info(f"Dispositivo selezionato: {device}")
 # Trasformazioni per le immagini
 transform = transforms.Compose([
     transforms.ToTensor(),
 ])
+# Definizione del modello Animator2D
 class Animator2DModel(torch.nn.Module):
     def __init__(self):
         super(Animator2DModel, self).__init__()
         return generated_frames.view(-1, num_frames, 3, 64, 64)
 # Funzione per generare i frame
+def generate_animation(description, base_frame_image, num_frames):
+    logger.info("Inizio generazione animazione")
+    try:
+        # Carica il modello da Hugging Face
+        model = Animator2DModel().to(device)
+        logger.info("Modello inizializzato, caricamento pesi...")
+        model.load_state_dict(torch.hub.load_state_dict_from_url(
+            "https://huggingface.co/Lod34/Animator2D-v1.0.0/resolve/main/animator2d_v1_0_0.pth",
+            map_location=device))
+        model.eval()
+        logger.info("Modello caricato con successo")
+        # Prepara il testo
+        tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
+        inputs = tokenizer(description, return_tensors='pt', padding='max_length',
+                          truncation=True, max_length=512)
+        input_ids = inputs['input_ids'].to(device)
+        attention_mask = inputs['attention_mask'].to(device)
+        # Prepara l'immagine di base
+        base_frame = transform(base_frame_image).unsqueeze(0).to(device)
+        # Genera i frame
+        with torch.no_grad():
+            generated_frames = model(input_ids, attention_mask, base_frame, num_frames)
+        # Converte i frame generati in immagini PIL
+        generated_frames = generated_frames.squeeze(0).cpu().numpy()
+        output_frames = []
+        for i in range(num_frames):
+            frame = generated_frames[i].transpose(1, 2, 0)  # Da (C, H, W) a (H, W, C)
+            frame = np.clip(frame, 0, 1)  # Normalizza tra 0 e 1
+            frame = (frame * 255).astype(np.uint8)  # Converte in formato immagine
+            output_frames.append(Image.fromarray(frame))
+        logger.info("Animazione generata con successo")
+        return output_frames
+    except Exception as e:
+        logger.error(f"Errore durante la generazione: {str(e)}")
+        raise
 # Interfaccia Gradio
+logger.info("Inizio configurazione interfaccia Gradio")
 with gr.Blocks(title="Animator2D-v1.0.0") as demo:
     gr.Markdown("# Animator2D-v1.0.0\nInserisci una descrizione e un'immagine di base per generare un'animazione!")
         with gr.Column():
             output_gallery = gr.Gallery(label="Frame generati", show_label=True)
+    submit_button.click(
+        fn=generate_animation,
+        inputs=[description_input, base_frame_input, num_frames_input],
+        outputs=output_gallery
+    )
+logger.info("Interfaccia Gradio configurata, avvio...")
+demo.launch(server_name="0.0.0.0", server_port=7860)