Spaces:

Kidbea
/

text-to-video

Running

App Files Files Community

Anurag181011 commited on Mar 28

Commit

49c57cc

1 Parent(s): 4e7c0a2

ty

Browse files

Files changed (1) hide show

app.py +18 -13

app.py CHANGED Viewed

@@ -3,38 +3,43 @@ import torch
 from diffusers import StableDiffusionImg2ImgPipeline
 from PIL import Image
-# Check if GPU is available
 device = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"Using device: {device}")
-# Load the model correctly
 model_id = "nitrosocke/Ghibli-Diffusion"
 pipe = StableDiffusionImg2ImgPipeline.from_pretrained(
-    model_id, torch_dtype=torch.float16 if device == "cuda" else torch.float32
 )
-# Enable optimization if using CUDA
 if device == "cuda":
     pipe.to(device)
-    pipe.enable_model_cpu_offload()  # Helps with memory efficiency
-else:
-    pipe.to("cpu")  # Ensure CPU compatibility
 def transform_image(input_image: Image.Image) -> Image.Image:
     input_image = input_image.resize((512, 512))
-    # Move image to proper format for inference
     prompt = "ghibli style, cinematic lighting, hand-painted, anime aesthetics"
     output = pipe(
         prompt=prompt,
         image=input_image,
-        strength=0.75,
-        guidance_scale=7.5,
-        num_inference_steps=30,  # Reduced steps for faster generation
     )
     return output.images[0]
-# Build the Gradio UI
 demo = gr.Interface(
     fn=transform_image,
     inputs=gr.Image(type="pil", label="Upload your portrait/photo"),

 from diffusers import StableDiffusionImg2ImgPipeline
 from PIL import Image
+# Check and print device status
 device = "cuda" if torch.cuda.is_available() else "cpu"
 print(f"Using device: {device}")
+print(f"CUDA available: {torch.cuda.is_available()}")
+# Ensure torch is installed correctly
+try:
+    torch.zeros(1).to(device)
+    print("Torch initialized successfully on", device)
+except Exception as e:
+    print("Torch initialization error:", e)
+# Load the Stable Diffusion model with optimizations
 model_id = "nitrosocke/Ghibli-Diffusion"
 pipe = StableDiffusionImg2ImgPipeline.from_pretrained(
+    model_id, torch_dtype=torch.float16 if device == "cuda" else torch.float32, safety_checker=None
 )
 if device == "cuda":
     pipe.to(device)
+    pipe.enable_model_cpu_offload()  # Efficient VRAM usage
+    pipe.enable_xformers_memory_efficient_attention()  # Optimized attention for speed
 def transform_image(input_image: Image.Image) -> Image.Image:
     input_image = input_image.resize((512, 512))
     prompt = "ghibli style, cinematic lighting, hand-painted, anime aesthetics"
     output = pipe(
         prompt=prompt,
         image=input_image,
+        strength=0.65,  # Reduce strength to avoid excessive details
+        guidance_scale=5.0,  # Lowered for faster inference
+        num_inference_steps=25,  # Reduced steps for speed
     )
     return output.images[0]
+# Gradio Interface
 demo = gr.Interface(
     fn=transform_image,
     inputs=gr.Image(type="pil", label="Upload your portrait/photo"),