Spaces:

bilegentile
/

test

Runtime error

App Files Files Community

test / modules /face /faceid.py

bilegentile

Upload folder using huggingface_hub

c19ca42 verified 12 months ago

raw

history blame contribute delete

10.6 kB

	from typing import List
	import os
	import cv2
	import torch
	import numpy as np
	import diffusers
	import huggingface_hub as hf
	from PIL import Image
	from modules import processing, shared, devices, extra_networks, sd_models, sd_hijack_freeu, script_callbacks, ipadapter
	from modules.sd_hijack_hypertile import context_hypertile_vae, context_hypertile_unet

	FACEID_MODELS = {
	"FaceID Base": "h94/IP-Adapter-FaceID/ip-adapter-faceid_sd15.bin",
	"FaceID Plus v1": "h94/IP-Adapter-FaceID/ip-adapter-faceid-plus_sd15.bin",
	"FaceID Plus v2": "h94/IP-Adapter-FaceID/ip-adapter-faceid-plusv2_sd15.bin",
	"FaceID XL": "h94/IP-Adapter-FaceID/ip-adapter-faceid_sdxl.bin",
	# "FaceID Portrait v10": "h94/IP-Adapter-FaceID/ip-adapter-faceid-portrait_sd15.bin",
	# "FaceID Portrait v11": "h94/IP-Adapter-FaceID/ip-adapter-faceid-portrait-v11_sd15.bin",
	# "FaceID XL Plus v2": "h94/IP-Adapter-FaceID/ip-adapter-faceid_sdxl.bin",
	}

	faceid_model_weights = None
	faceid_model_name = None
	debug = shared.log.trace if os.environ.get("SD_FACE_DEBUG", None) is not None else lambda args, *kwargs: None


	def hijack_load_ip_adapter(self):
	self.image_proj_model.load_state_dict(faceid_model_weights["image_proj"])
	ip_layers = torch.nn.ModuleList(self.pipe.unet.attn_processors.values())
	ip_layers.load_state_dict(faceid_model_weights["ip_adapter"], strict=False)


	def face_id(
	p: processing.StableDiffusionProcessing,
	app,
	source_images: List[Image.Image],
	model: str,
	override: bool,
	cache: bool,
	scale: float,
	structure: float,
	):
	global faceid_model_weights, faceid_model_name # pylint: disable=global-statement
	if source_images is None or len(source_images) == 0:
	shared.log.warning('FaceID: no input images')
	return None

	from insightface.utils import face_align
	try:
	from ip_adapter.ip_adapter_faceid import (
	IPAdapterFaceID,
	IPAdapterFaceIDPlus,
	IPAdapterFaceIDXL,
	IPAdapterFaceIDPlusXL,
	)
	from ip_adapter.ip_adapter_faceid_separate import (
	IPAdapterFaceID as IPAdapterFaceIDPortrait,
	)
	except Exception as e:
	shared.log.error(f"FaceID incorrect version of ip_adapter: {e}")
	return None

	processed_images = []

	faceid_model = None
	original_load_ip_adapter = None

	try:
	shared.prompt_styles.apply_styles_to_extra(p)

	if not shared.opts.cuda_compile:
	sd_models.apply_token_merging(p.sd_model, p.get_token_merging_ratio())
	sd_hijack_freeu.apply_freeu(p, shared.backend == shared.Backend.ORIGINAL)

	script_callbacks.before_process_callback(p)

	with context_hypertile_vae(p), context_hypertile_unet(p), devices.inference_context():
	p.init(p.all_prompts, p.all_seeds, p.all_subseeds)
	ip_ckpt = FACEID_MODELS[model]
	folder, filename = os.path.split(ip_ckpt)
	basename, _ext = os.path.splitext(filename)
	model_path = hf.hf_hub_download(repo_id=folder, filename=filename, cache_dir=shared.opts.diffusers_dir)
	if model_path is None:
	shared.log.error(f"FaceID download failed: model={model} file={ip_ckpt}")
	return None
	if override:
	shared.sd_model.scheduler = diffusers.DDIMScheduler(
	num_train_timesteps=1000,
	beta_start=0.00085,
	beta_end=0.012,
	beta_schedule="scaled_linear",
	clip_sample=False,
	set_alpha_to_one=False,
	steps_offset=1,
	)
	if faceid_model_weights is None or faceid_model_name != model or not cache:
	shared.log.debug(f"FaceID load: model={model} file={ip_ckpt}")
	faceid_model_weights = torch.load(model_path, map_location="cpu")
	else:
	shared.log.debug(f"FaceID cached: model={model} file={ip_ckpt}")

	if "XL Plus" in model:
	image_encoder_path = "laion/CLIP-ViT-H-14-laion2B-s32B-b79K"
	original_load_ip_adapter = IPAdapterFaceIDPlusXL.load_ip_adapter
	IPAdapterFaceIDPlusXL.load_ip_adapter = hijack_load_ip_adapter
	faceid_model = IPAdapterFaceIDPlusXL(
	sd_pipe=shared.sd_model,
	image_encoder_path=image_encoder_path,
	ip_ckpt=model_path,
	lora_rank=128,
	num_tokens=4,
	device=devices.device,
	torch_dtype=devices.dtype,
	)
	elif "XL" in model:
	original_load_ip_adapter = IPAdapterFaceIDXL.load_ip_adapter
	IPAdapterFaceIDXL.load_ip_adapter = hijack_load_ip_adapter
	faceid_model = IPAdapterFaceIDXL(
	sd_pipe=shared.sd_model,
	ip_ckpt=model_path,
	lora_rank=128,
	num_tokens=4,
	device=devices.device,
	torch_dtype=devices.dtype,
	)
	elif "Plus" in model:
	original_load_ip_adapter = IPAdapterFaceIDPlus.load_ip_adapter
	IPAdapterFaceIDPlus.load_ip_adapter = hijack_load_ip_adapter
	image_encoder_path = "laion/CLIP-ViT-H-14-laion2B-s32B-b79K"
	faceid_model = IPAdapterFaceIDPlus(
	sd_pipe=shared.sd_model,
	image_encoder_path=image_encoder_path,
	ip_ckpt=model_path,
	lora_rank=128,
	num_tokens=4,
	device=devices.device,
	torch_dtype=devices.dtype,
	)
	elif "Portrait" in model:
	original_load_ip_adapter = IPAdapterFaceIDPortrait.load_ip_adapter
	IPAdapterFaceIDPortrait.load_ip_adapter = hijack_load_ip_adapter
	faceid_model = IPAdapterFaceIDPortrait(
	sd_pipe=shared.sd_model,
	ip_ckpt=model_path,
	num_tokens=16,
	n_cond=5,
	device=devices.device,
	torch_dtype=devices.dtype,
	)
	else:
	original_load_ip_adapter = IPAdapterFaceID.load_ip_adapter
	IPAdapterFaceID.load_ip_adapter = hijack_load_ip_adapter
	faceid_model = IPAdapterFaceID(
	sd_pipe=shared.sd_model,
	ip_ckpt=model_path,
	lora_rank=128,
	num_tokens=4,
	device=devices.device,
	torch_dtype=devices.dtype,
	)

	shortcut = "v2" in model
	faceid_model_name = model
	face_embeds = []
	face_images = []
	for i, source_image in enumerate(source_images):
	np_image = cv2.cvtColor(np.array(source_image), cv2.COLOR_RGB2BGR)
	faces = app.get(np_image)
	if len(faces) == 0:
	shared.log.error("FaceID: no faces found")
	break
	face_embeds.append(torch.from_numpy(faces[0].normed_embedding).unsqueeze(0))
	face_images.append(face_align.norm_crop(np_image, landmark=faces[0].kps, image_size=224))
	shared.log.debug(f'FaceID face: i={i+1} score={faces[0].det_score:.2f} gender={"female" if faces[0].gender==0 else "male"} age={faces[0].age} bbox={faces[0].bbox}')
	p.extra_generation_params[f"FaceID {i+1}"] = f'{faces[0].det_score:.2f} {"female" if faces[0].gender==0 else "male"} {faces[0].age}y'

	if len(face_embeds) == 0:
	shared.log.error("FaceID: no faces found")
	return None

	face_embeds = torch.cat(face_embeds, dim=0)
	ip_model_dict = { # main generate dict
	"num_samples": p.batch_size,
	"width": p.width,
	"height": p.height,
	"num_inference_steps": p.steps,
	"scale": scale,
	"guidance_scale": p.cfg_scale,
	"faceid_embeds": face_embeds.shape, # placeholder
	}

	# optional generate dict
	if shortcut is not None:
	ip_model_dict["shortcut"] = shortcut
	if "Plus" in model:
	ip_model_dict["s_scale"] = structure
	shared.log.debug(f"FaceID args: {ip_model_dict}")
	if "Plus" in model:
	ip_model_dict["face_image"] = face_images
	ip_model_dict["faceid_embeds"] = face_embeds # overwrite placeholder
	faceid_model.set_scale(scale)
	extra_network_data = None

	for i in range(p.n_iter):
	p.iteration = i
	p.prompts = p.all_prompts[i * p.batch_size:(i + 1) * p.batch_size]
	p.negative_prompts = p.all_negative_prompts[i * p.batch_size:(i + 1) * p.batch_size]
	p.prompts, extra_network_data = extra_networks.parse_prompts(p.prompts)
	p.seeds = p.all_seeds[i * p.batch_size:(i + 1) * p.batch_size]
	if not p.disable_extra_networks:
	with devices.autocast():
	extra_networks.activate(p, extra_network_data)
	ip_model_dict.update({
	"prompt": p.prompts,
	"negative_prompt": p.negative_prompts,
	"seed": int(p.seeds[0]),
	})
	debug(f"FaceID: {ip_model_dict}")
	res = faceid_model.generate(**ip_model_dict)
	if isinstance(res, list):
	processed_images += res

	faceid_model.set_scale(0)
	faceid_model = None

	if not cache:
	faceid_model_weights = None
	faceid_model_name = None
	devices.torch_gc()

	ipadapter.unapply(p.sd_model)
	if not p.disable_extra_networks:
	extra_networks.deactivate(p, extra_network_data)

	p.extra_generation_params["IP Adapter"] = f"{basename}:{scale}"
	finally:
	if faceid_model is not None and original_load_ip_adapter is not None:
	faceid_model.__class__.load_ip_adapter = original_load_ip_adapter
	if not shared.opts.cuda_compile:
	sd_models.apply_token_merging(p.sd_model, 0)
	script_callbacks.after_process_callback(p)

	return processed_images