qwen2vl-flux

Build error

App Files Files Community

LPX55 commited on 26 days ago

Commit

a7eb958

verified ·

1 Parent(s): d944e21

Update mini.py

Browse files

Files changed (1) hide show

mini.py +23 -17

mini.py CHANGED Viewed

@@ -3,10 +3,12 @@ import torch
 import spaces
 from PIL import Image
 import os
-from transformers import CLIPTokenizer, CLIPTextModel, AutoProcessor, T5EncoderModel, T5TokenizerFast
 from diffusers import AutoencoderKL, FlowMatchEulerDiscreteScheduler
 from flux.transformer_flux_simple import FluxTransformer2DModel
 from flux.pipeline_flux_chameleon_og import FluxPipeline
 import torch.nn as nn
 import math
 import logging
@@ -29,6 +31,9 @@ MODEL_CACHE_DIR = "model_cache"
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 DTYPE = torch.bfloat16
 # Aspect ratio options
 ASPECT_RATIOS = {
     "1:1": (1024, 1024),
@@ -81,12 +86,13 @@ tokenizer_two = T5TokenizerFast.from_pretrained(
 # Load larger models to CPU
 vae = AutoencoderKL.from_pretrained(
-    os.path.join(MODEL_CACHE_DIR, "flux/vae")
-).to(DTYPE).to(DEVICE)
 transformer = FluxTransformer2DModel.from_pretrained(
-    os.path.join(MODEL_CACHE_DIR, "flux/transformer")
-).to(DTYPE).to(DEVICE)
 scheduler = FlowMatchEulerDiscreteScheduler.from_pretrained(
     os.path.join(MODEL_CACHE_DIR, "flux/scheduler"),
@@ -95,7 +101,8 @@ scheduler = FlowMatchEulerDiscreteScheduler.from_pretrained(
 # Load Qwen2VL to CPU
 qwen2vl = Qwen2VLSimplifiedModel.from_pretrained(
-    os.path.join(MODEL_CACHE_DIR, "qwen2-vl")
 ).to(DTYPE).cpu()
 # Load connector and embedder
@@ -134,16 +141,6 @@ pipeline = FluxPipeline(
     tokenizer=tokenizer,
 )
-# # Move Transformer and VAE to GPU
-# logger.info("Moving Transformer and VAE to GPU...")
-# transformer.to(DEVICE)
-# vae.to(DEVICE)
-# # Update pipeline models
-# pipeline.transformer = transformer
-# pipeline.vae = vae
-# logger.info("Models moved to GPU")
 def process_image(image):
     """Process image with Qwen2VL model"""
     try:
@@ -267,7 +264,16 @@ def generate(input_image, prompt="", guidance_scale=3.5, num_inference_steps=28,
         pooled_prompt_embeds = compute_text_embeddings(prompt)
         t5_prompt_embeds = compute_t5_text_embeddings(prompt)
         logger.info("Text embeddings computed")
         # Get dimensions
         width, height = ASPECT_RATIOS[aspect_ratio]

 import spaces
 from PIL import Image
 import os
+from transformers import CLIPTokenizer, CLIPTextModel, AutoProcessor, T5EncoderModel, T5TokenizerFast, BitsAndBytesConfig
 from diffusers import AutoencoderKL, FlowMatchEulerDiscreteScheduler
 from flux.transformer_flux_simple import FluxTransformer2DModel
 from flux.pipeline_flux_chameleon_og import FluxPipeline
+from flux.pipeline_flux_img2img import FluxImg2ImgPipeline
 import torch.nn as nn
 import math
 import logging
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 DTYPE = torch.bfloat16
+quant_config = BitsAndBytesConfig(load_in_8bit=True,)
 # Aspect ratio options
 ASPECT_RATIOS = {
     "1:1": (1024, 1024),
 # Load larger models to CPU
 vae = AutoencoderKL.from_pretrained(
+    os.path.join(MODEL_CACHE_DIR, "flux/vae"),
+).to(DTYPE).cpu()
 transformer = FluxTransformer2DModel.from_pretrained(
+    os.path.join(MODEL_CACHE_DIR, "flux/transformer"),
+    quantization_config=quant_config,
+).to(DTYPE).cpu()
 scheduler = FlowMatchEulerDiscreteScheduler.from_pretrained(
     os.path.join(MODEL_CACHE_DIR, "flux/scheduler"),
 # Load Qwen2VL to CPU
 qwen2vl = Qwen2VLSimplifiedModel.from_pretrained(
+    os.path.join(MODEL_CACHE_DIR, "qwen2-vl"),
+    quantization_config=quant_config,
 ).to(DTYPE).cpu()
 # Load connector and embedder
     tokenizer=tokenizer,
 )
 def process_image(image):
     """Process image with Qwen2VL model"""
     try:
         pooled_prompt_embeds = compute_text_embeddings(prompt)
         t5_prompt_embeds = compute_t5_text_embeddings(prompt)
         logger.info("Text embeddings computed")
+        # Move Transformer and VAE to GPU
+        logger.info("Moving Transformer and VAE to GPU...")
+        transformer.to(DEVICE)
+        vae.to(DEVICE)
+        # Update pipeline models
+        pipeline.transformer = transformer
+        pipeline.vae = vae
+        logger.info("Models moved to GPU")
         # Get dimensions
         width, height = ASPECT_RATIOS[aspect_ratio]