HiDream-ai-fast

Paused

blanchon commited on 26 days ago

Commit

2cece51

1 Parent(s): fe2f104

up

Files changed (1) hide show

app-fast.py CHANGED Viewed

@@ -50,7 +50,8 @@ text_encoder = AutoModelForCausalLM.from_pretrained(
     output_attentions=True,
     low_cpu_mem_usage=True,
     quantization_config=quant_config,
-    torch_dtype=torch.float16,
 )
 quant_config = DiffusersBitsAndBytesConfig(
@@ -60,7 +61,8 @@ transformer = HiDreamImageTransformer2DModel.from_pretrained(
     MODEL_PATH,
     subfolder="transformer",
     quantization_config=quant_config,
-    torch_dtype=torch.float16,
 )
 scheduler = MODEL_CONFIGS["scheduler"](
@@ -74,7 +76,8 @@ pipe = HiDreamImagePipeline.from_pretrained(
     scheduler=scheduler,
     tokenizer_4=tokenizer,
     text_encoder_4=text_encoder,
-    torch_dtype=torch.float16,
 ).to(device)
 pipe.transformer = transformer

     output_attentions=True,
     low_cpu_mem_usage=True,
     quantization_config=quant_config,
+    device_map="auto",
+    torch_dtype=torch.bfloat16,
 )
 quant_config = DiffusersBitsAndBytesConfig(
     MODEL_PATH,
     subfolder="transformer",
     quantization_config=quant_config,
+    device_map="auto",
+    torch_dtype=torch.bfloat16,
 )
 scheduler = MODEL_CONFIGS["scheduler"](
     scheduler=scheduler,
     tokenizer_4=tokenizer,
     text_encoder_4=text_encoder,
+    device_map="auto",
+    torch_dtype=torch.bfloat16,
 ).to(device)
 pipe.transformer = transformer