YXStableDiffusion
/

Reforge

Model card Files Files and versions Community

Reforge / extensions-builtin /StableCascade-for-webUI-main /scripts /stablecascade_diffusers.py

YXStableDiffusion

Upload folder using huggingface_hub

ecc4278 verified 7 months ago

raw

history blame contribute delete

42.5 kB

	from diffusers.utils import check_min_version
	check_min_version("0.28.1")


	class CascadeMemory:
	ModuleReload = False
	noUnload = False
	teCLIP = None
	lastPrior = None
	lastDecoder = None
	lastTextEncoder = None
	prior = None
	decoder = None
	lastSeed = -1
	galleryIndex = 0
	torchMessage = True # display information message about torch/bfloat16, set to False after first check
	locked = False # for preventing changes to the following volatile state while generating
	karras = False
	force_f16 = False
	embedsState = 0

	import gc
	import gradio
	import numpy
	from PIL import Image
	import torch
	try:
	from importlib import reload
	CascadeMemory.ModuleReload = True
	except:
	CascadeMemory.ModuleReload = False

	from modules import script_callbacks, images, shared
	from modules.processing import get_fixed_seed
	from modules.shared import opts
	from modules.ui_components import ResizeHandleRow
	import modules.infotext_utils as parameters_copypaste

	from transformers import T5TokenizerFast, T5ForConditionalGeneration
	from transformers import CLIPTextModelWithProjection, CLIPTokenizer
	from diffusers import StableCascadeUNet, DDPMWuerstchenScheduler
	from diffusers import DPMSolverSinglestepScheduler, DPMSolverMultistepScheduler, LCMScheduler, SASolverScheduler
	from diffusers.pipelines.wuerstchen.modeling_paella_vq_model import PaellaVQModel
	from diffusers import AutoencoderKL
	from diffusers.utils import logging

	import customStylesListSC as styles
	import modelsListSC as models
	import scripts.SC_pipeline as pipeline

	# modules/processing.py
	def create_infotext(priorModel, decoderModel, vaeModel, positive_prompt, negative_prompt, clipskip, guidance_scale, prior_steps, decoder_steps, seed, schedulerP, schedulerD, width, height, ):
	karras = " : Karras" if CascadeMemory.karras == True else ""
	generation_params = {
	"Size" : f"{width}x{height}",
	"Seed" : seed,
	"Scheduler(Prior/Decoder)" : f"{schedulerP}/{schedulerD}{karras}",
	"Steps(Prior/Decoder)" : f"{prior_steps}/{decoder_steps}",
	"CFG" : guidance_scale,
	"CLIP skip" : clipskip,
	}

	model_text = "(" + priorModel.split('.')[0] + "/" + decoderModel.split('.')[0] + "/" + vaeModel + ")"

	prompt_text = f"Prompt: {positive_prompt}"
	if negative_prompt != "":
	prompt_text += (f"\nNegative: {negative_prompt}")
	generation_params_text = ", ".join([k if k == v else f'{k}: {v}' for k, v in generation_params.items() if v is not None])

	return f"Model: StableCascade {model_text}\n{prompt_text}\n{generation_params_text}"


	def predict(priorModel, decoderModel, vaeModel, positive_prompt, negative_prompt, clipskip, width, height, guidance_scale,
	prior_steps, decoder_steps, seed, num_images, PriorScheduler, DecoderScheduler, style, i2iSource1, i2iSource2):
	#resolution, latentScale):
	logging.set_verbosity(logging.ERROR)

	torch.set_grad_enabled(False)

	if style != 0:
	positive_prompt = styles.styles_list[style][1].replace("{prompt}", positive_prompt)
	negative_prompt = negative_prompt + styles.styles_list[style][2]

	gc.collect()
	torch.cuda.empty_cache()

	fixed_seed = get_fixed_seed(seed)
	CascadeMemory.lastSeed = fixed_seed

	useLitePrior = "lite" in priorModel
	useLiteDecoder = "lite" in decoderModel

	if CascadeMemory.force_f16 == True:
	dtype = torch.float16
	elif torch.cuda.is_bf16_supported() == True and int(torch.__version__[0]) >= 2 and int(torch.__version__[2]) >= 2:
	dtype = torch.bfloat16
	else:
	if CascadeMemory.torchMessage == True:
	if torch.cuda.is_bf16_supported() == True:
	print ("INFO: StableCascade: Using float16. Hardware supports bfloat16, but needs Torch version >= 2.2.0 (using " + torch.__version__ + ").")
	else:
	print ("INFO: StableCascade: Using float16. Hardware does not support bfloat16.")
	CascadeMemory.torchMessage = False
	dtype = torch.float16

	#### image embeds, basically using images to prompt - not image to image
	image_embeds0 = torch.zeros(
	num_images,
	1,
	768,
	device='cpu',
	dtype=torch.float32,
	)
	image_embeds0 = image_embeds0.to('cuda').to(dtype)
	if i2iSource1 or i2iSource2:
	prior = pipeline.StableCascadePriorPipeline_DoE.from_pretrained(
	"stabilityai/stable-cascade-prior",
	local_files_only=False, cache_dir=".//models//diffusers//",
	prior=None,
	text_encoder=None,
	tokenizer=None,
	scheduler=None,
	variant="bf16",
	torch_dtype=torch.float32)

	if i2iSource1:
	image_embeds1, _ = prior.encode_image(images=[i2iSource1], device='cpu', dtype=torch.float32, batch_size=1, num_images_per_prompt=1)
	image_embeds1 = image_embeds1.to('cuda').to(dtype)
	del i2iSource1
	else:
	image_embeds1 = image_embeds0

	if i2iSource2:
	image_embeds2, _ = prior.encode_image(images=[i2iSource2], device='cpu', dtype=torch.float32, batch_size=1, num_images_per_prompt=1)
	image_embeds2 = image_embeds2.to('cuda').to(dtype)
	else:
	image_embeds2 = image_embeds0

	del prior

	match CascadeMemory.embedsState:
	case 3: # 0b11: both negative
	positive_image_embeds = torch.cat((image_embeds0, image_embeds0), dim=1)
	negative_image_embeds = torch.cat((image_embeds1, image_embeds2), dim=1)
	case 2: # 0b10: 1 negative, 2 positive
	positive_image_embeds = image_embeds2
	negative_image_embeds = image_embeds1
	case 1: # 0b01, 1 positive, 2 negative
	positive_image_embeds = image_embeds1
	negative_image_embeds = image_embeds2
	case 0: # 0b00, both positive
	positive_image_embeds = torch.cat((image_embeds1, image_embeds2), dim=1)
	negative_image_embeds = torch.cat((image_embeds0, image_embeds0), dim=1)

	del image_embeds1, image_embeds2
	else:
	positive_image_embeds = image_embeds0
	negative_image_embeds = image_embeds0
	del image_embeds0

	#### note: image_embeds are repeated for num_images in pipeline
	#### end image embeds

	#### text encoder
	source = priorModel if (priorModel in models.models_list_prior) else "stabilityai/stable-cascade-prior"
	tokenizer = CLIPTokenizer.from_pretrained(
	source,
	subfolder='tokenizer',
	local_files_only=False, cache_dir=".//models//diffusers//",
	torch_dtype=dtype)

	# def prompt_and_weights (tokenizer, prompt):
	# promptSplit = prompt.split('\|')
	# newPrompt = []
	# weights = []
	# max_length = tokenizer.model_max_length

	# for s in promptSplit:
	# subpromptSplit = s.strip().split(' ')
	# cleanedPrompt = ' '.join((t.split(':')[0] for t in subpromptSplit))
	# newPrompt.append(cleanedPrompt)

	# subWeights = [1.0]

	# for t in subpromptSplit:
	# t = t.split(':')
	# if len(t) == 1:
	# weight = 1.0
	# elif t[1] == '':
	# weight = 1.0
	# else:
	# try:
	# weight = float(t[1].rstrip(','))
	# except:
	# weight = 1.0

	# text_inputs = tokenizer(
	# t[0],
	# padding=False,
	# max_length=max_length,
	# truncation=True,
	# return_attention_mask=False,
	# add_special_tokens=False,
	# return_tensors="pt",
	# )

	# tokenLength = len(text_inputs.input_ids[0])
	# for w in range(tokenLength):
	# subWeights.append(weight)

	# weights.append(subWeights)
	# return newPrompt, weights

	# fixed_positive_prompt, positive_weights = prompt_and_weights(tokenizer, positive_prompt)
	# fixed_negative_prompt, negative_weights = prompt_and_weights(tokenizer, negative_prompt)

	# while len(fixed_positive_prompt) < len(fixed_negative_prompt):
	# fixed_positive_prompt.append('')
	# positive_weights.append([1.0])
	# while len(fixed_positive_prompt) > len(fixed_negative_prompt):
	# fixed_negative_prompt.append('')
	# negative_weights.append([1.0])

	# text_inputs = tokenizer(
	# fixed_positive_prompt + fixed_negative_prompt,
	# padding=True,
	# max_length=tokenizer.model_max_length,
	# truncation=True,
	# return_attention_mask=True,
	# return_tensors="pt",
	# )

	# positive_input_ids = text_inputs.input_ids[0:len(fixed_positive_prompt)]
	# negative_input_ids = text_inputs.input_ids[len(fixed_positive_prompt):]

	# positive_attention = text_inputs.attention_mask[0:len(fixed_positive_prompt)]
	# negative_attention = text_inputs.attention_mask[len(fixed_positive_prompt):]


	text_inputs = tokenizer(
	[positive_prompt] + [negative_prompt],
	padding=True,
	max_length=tokenizer.model_max_length,
	truncation=True,
	return_attention_mask=True,
	return_tensors="pt",
	)
	positive_input_ids = text_inputs.input_ids[0:1]
	negative_input_ids = text_inputs.input_ids[1:]
	positive_attention = text_inputs.attention_mask[0:1]
	negative_attention = text_inputs.attention_mask[1:]

	del text_inputs
	del tokenizer

	if CascadeMemory.teCLIP == None or source != CascadeMemory.lastTextEncoder:
	try:
	CascadeMemory.teCLIP = CLIPTextModelWithProjection.from_pretrained(
	source,
	subfolder='text_encoder',
	local_files_only=False, cache_dir=".//models//diffusers//",
	variant='bf16',
	torch_dtype=dtype)
	except:
	try:
	CascadeMemory.teCLIP = CLIPTextModelWithProjection.from_pretrained(
	source,
	subfolder='text_encoder',
	local_files_only=False, cache_dir=".//models//diffusers//",
	torch_dtype=dtype)
	except:
	CascadeMemory.teCLIP = CLIPTextModelWithProjection.from_pretrained(
	"stabilityai/stable-cascade-prior",
	subfolder='text_encoder',
	local_files_only=False, cache_dir=".//models//diffusers//",
	variant='bf16',
	torch_dtype=dtype)
	CascadeMemory.lastTextEncoder = source

	CascadeMemory.teCLIP.cuda()

	text_encoder_output = CascadeMemory.teCLIP(
	positive_input_ids.to('cuda'), attention_mask=positive_attention.to('cuda'), output_hidden_states=True
	)
	positive_embeds = text_encoder_output.hidden_states[-(clipskip+1)]
	positive_pooled = text_encoder_output.text_embeds.unsqueeze(1)

	# positive_mean_before = positive_embeds.mean()
	# for l in range(len(positive_embeds)):
	# for p in range(min(77, len(positive_weights[l]))):
	# positive_embeds[l][p] *= positive_weights[l][p]
	# positive_mean_after = positive_embeds.mean()
	# positive_embeds *= positive_mean_before / positive_mean_after

	positive_embeds = positive_embeds.view(1, -1, 1280)
	positive_pooled = positive_pooled[0].unsqueeze(0)

	positive_embeds = positive_embeds.to(dtype=dtype, device='cuda')
	positive_pooled = positive_pooled.to(dtype=dtype, device='cuda')
	positive_embeds = positive_embeds.repeat_interleave(num_images, dim=0)
	positive_pooled = positive_pooled.repeat_interleave(num_images, dim=0)

	if guidance_scale > 1.0:
	text_encoder_output = CascadeMemory.teCLIP(
	negative_input_ids.to('cuda'), attention_mask=negative_attention.to('cuda'), output_hidden_states=True
	)
	negative_embeds = text_encoder_output.hidden_states[-1]
	negative_pooled = text_encoder_output.text_embeds.unsqueeze(1)

	# negative_mean_before = negative_embeds.mean()
	# for l in range(len(negative_embeds)):
	# for p in range(min(77, len(negative_weights[l]))):
	# negative_embeds[l][p] *= negative_weights[l][p]
	# negative_mean_after = negative_embeds.mean()
	# negative_embeds *= negative_mean_before / negative_mean_after

	negative_embeds = negative_embeds.view(1, -1, 1280)
	negative_pooled = negative_pooled[0].unsqueeze(0)
	negative_embeds = negative_embeds.to(dtype=dtype, device='cuda')
	negative_pooled = negative_pooled.to(dtype=dtype, device='cuda')
	negative_embeds = negative_embeds.repeat_interleave(num_images, dim=0)
	negative_pooled = negative_pooled.repeat_interleave(num_images, dim=0)
	else:
	negative_embeds = None
	negative_pooled = None

	del positive_input_ids, negative_input_ids, positive_attention, negative_attention

	if CascadeMemory.noUnload:
	pass#CascadeMemory.teCLIP.cpu() # try keeping on GPU to free memory to store full unet
	else:
	CascadeMemory.teCLIP = None
	#### end text_encoder

	#### setup prior pipeline
	if CascadeMemory.prior == None:
	CascadeMemory.prior = pipeline.StableCascadePriorPipeline_DoE.from_pretrained(
	"stabilityai/stable-cascade-prior",
	local_files_only=False, cache_dir=".//models//diffusers//",
	image_encoder=None, feature_extractor=None, tokenizer=None, text_encoder=None,
	prior=None,
	variant='bf16',
	torch_dtype=dtype,)
	#### end setup prior pipeline

	#### get prior unet
	if not CascadeMemory.noUnload or priorModel != CascadeMemory.lastPrior:
	print ("StableCascade: loading prior unet ...", end="\r", flush=True)
	if priorModel in models.models_list_prior:
	# custom diffusers type
	CascadeMemory.prior.prior = StableCascadeUNet.from_pretrained(
	priorModel,
	subfolder="prior_lite" if "lite" in priorModel else "prior",
	local_files_only=False, cache_dir=".//models//diffusers//",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	elif priorModel == "lite":
	CascadeMemory.prior.prior = StableCascadeUNet.from_pretrained("stabilityai/stable-cascade-prior",
	local_files_only=False, cache_dir=".//models//diffusers//",
	subfolder="prior_lite",
	variant="bf16",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	elif priorModel == "full":
	CascadeMemory.prior.prior = StableCascadeUNet.from_pretrained("stabilityai/stable-cascade-prior",
	local_files_only=False, cache_dir=".//models//diffusers//",
	subfolder="prior",
	variant="bf16",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	else:# ".safetensors" in priorModel:
	customStageC = ".//models//diffusers//StableCascadeCustom//StageC//" + priorModel
	CascadeMemory.prior.prior = StableCascadeUNet.from_single_file(
	customStageC,
	local_files_only=True, cache_dir=".//models//diffusers//",
	use_safetensors=True,
	subfolder="prior_lite" if "lite" in priorModel else "prior",
	use_low_cpu_mem=True,
	torch_dtype=dtype,
	config="stabilityai/stable-cascade-prior")

	CascadeMemory.prior.prior.to(memory_format=torch.channels_last)
	CascadeMemory.lastPrior = priorModel if CascadeMemory.noUnload else None
	#### end get prior unet

	if useLitePrior == False:
	CascadeMemory.prior.enable_sequential_cpu_offload() # good for full models on 8GB, but unnecessary for lite (and slows down generation)
	else:
	CascadeMemory.prior.to('cuda')

	generator = [torch.Generator(device="cpu").manual_seed(fixed_seed+i) for i in range(num_images)]

	schedulerConfig = dict(CascadeMemory.prior.scheduler.config)
	schedulerConfig['use_karras_sigmas'] = CascadeMemory.karras
	schedulerConfig['clip_sample'] = False
	schedulerConfig.pop('algorithm_type', None)

	if PriorScheduler == 'DPM++ 2M':
	CascadeMemory.prior.scheduler = DPMSolverMultistepScheduler.from_config(schedulerConfig)
	elif PriorScheduler == "DPM++ 2M SDE":
	schedulerConfig['algorithm_type'] = 'sde-dpmsolver++'
	CascadeMemory.prior.scheduler = DPMSolverMultistepScheduler.from_config(schedulerConfig)
	elif PriorScheduler == "LCM":
	CascadeMemory.prior.scheduler = LCMScheduler.from_config(schedulerConfig)
	elif PriorScheduler == "SA-solver":
	schedulerConfig['algorithm_type'] = 'data_prediction'
	CascadeMemory.prior.scheduler = SASolverScheduler.from_config(schedulerConfig)
	else:
	CascadeMemory.prior.scheduler = DDPMWuerstchenScheduler.from_config(schedulerConfig)

	with torch.inference_mode():
	prior_output = CascadeMemory.prior(
	prompt_embeds = positive_embeds,
	prompt_embeds_pooled = positive_pooled,
	negative_prompt_embeds = negative_embeds,
	negative_prompt_embeds_pooled = negative_pooled,

	image_embeds=positive_image_embeds,
	negative_image_embeds=negative_image_embeds,

	width=width,
	height=height,
	guidance_scale=guidance_scale,
	num_inference_steps=prior_steps,
	num_images_per_prompt=num_images,
	generator=generator,
	)

	del generator

	if not CascadeMemory.noUnload:
	CascadeMemory.prior.prior= None
	CascadeMemory.lastPrior = None

	positive_embeds = prior_output.get("prompt_embeds", None)
	positive_pooled = prior_output.get("prompt_embeds_pooled", None)
	negative_embeds = prior_output.get("negative_prompt_embeds", None)
	negative_pooled = prior_output.get("negative_prompt_embeds_pooled", None)
	#i: (num output images, num input images, 768)
	#e: (num output images, 77, 1280)
	#p: (num output images, 1, 1280)

	gc.collect()
	torch.cuda.empty_cache()

	#### setup decoder pipeline
	if CascadeMemory.decoder == None:
	CascadeMemory.decoder = pipeline.StableCascadeDecoderPipeline_DoE.from_pretrained(
	"stabilityai/stable-cascade",
	local_files_only=False, cache_dir=".//models//diffusers//",
	decoder=None,
	vqgan=None,
	variant='bf16',
	torch_dtype=dtype,)
	#### end setup decoder pipeline

	#### get decoder unet
	if not CascadeMemory.noUnload or decoderModel != CascadeMemory.lastDecoder:
	print ("StableCascade: loading decoder unet ...", end="\r", flush=True)
	if decoderModel in models.models_list_decoder:
	# custom diffusers type
	CascadeMemory.decoder.decoder = StableCascadeUNet.from_pretrained(
	decoderModel,
	subfolder="decoder_lite" if "lite" in decoderModel else "decoder",
	local_files_only=False, cache_dir=".//models//diffusers//",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	elif decoderModel == "lite":
	CascadeMemory.decoder.decoder = StableCascadeUNet.from_pretrained(
	"stabilityai/stable-cascade",
	local_files_only=False, cache_dir=".//models//diffusers//",
	subfolder="decoder_lite",
	variant="bf16",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	elif decoderModel == "full":
	CascadeMemory.decoder.decoder = StableCascadeUNet.from_pretrained(
	"stabilityai/stable-cascade",
	local_files_only=False, cache_dir=".//models//diffusers//",
	subfolder="decoder",
	variant="bf16",
	use_low_cpu_mem=True,
	torch_dtype=dtype)
	else:# ".safetensors" in decoderModel:
	customStageC = ".//models//diffusers//StableCascadeCustom//StageC//" + decoderModel
	CascadeMemory.decoder.decoder = StableCascadeUNet.from_single_file(
	customStageC,
	local_files_only=True, cache_dir=".//models//diffusers//",
	use_safetensors=True,
	subfolder="decoder_lite" if "lite" in decoderModel else "decoder",
	use_low_cpu_mem=True,
	torch_dtype=dtype,
	config="stabilityai/stable-cascade")

	CascadeMemory.decoder.decoder.to(memory_format=torch.channels_last)
	CascadeMemory.lastDecoder = decoderModel if CascadeMemory.noUnload else None
	#### end get decoder unet

	#### VAE always loaded - it's only 35MB
	if vaeModel == 'madebyollin':
	# Load the Stage-A-ft-HQ model
	CascadeMemory.decoder.vqgan = PaellaVQModel.from_pretrained("madebyollin/stage-a-ft-hq",
	local_files_only=False, cache_dir=".//models//diffusers//", torch_dtype=dtype)
	else:
	#default
	CascadeMemory.decoder.vqgan = PaellaVQModel.from_pretrained("stabilityai/stable-cascade",
	local_files_only=False, cache_dir=".//models//diffusers//", subfolder="vqgan", torch_dtype=dtype)

	CascadeMemory.decoder.enable_model_cpu_offload()

	## regenerate the Generator, needed for deterministic outputs - reusing from earlier doesn't work
	#still not correct with custom checkpoint?
	generator = [torch.Generator(device="cpu").manual_seed(fixed_seed+i) for i in range(num_images)]

	# trying to colour the noise here is 100% ineffective

	schedulerConfig = dict(CascadeMemory.decoder.scheduler.config)
	schedulerConfig['use_karras_sigmas'] = CascadeMemory.karras
	schedulerConfig['clip_sample'] = False
	schedulerConfig.pop('algorithm_type', None)

	if DecoderScheduler == 'DPM++ 2M':
	CascadeMemory.decoder.scheduler = DPMSolverMultistepScheduler.from_config(schedulerConfig)
	elif DecoderScheduler == "DPM++ 2M SDE":
	schedulerConfig['algorithm_type'] = 'sde-dpmsolver++'
	CascadeMemory.decoder.scheduler = DPMSolverMultistepScheduler.from_config(schedulerConfig)
	elif DecoderScheduler == "LCM":
	CascadeMemory.decoder.scheduler = LCMScheduler.from_config(schedulerConfig)
	elif DecoderScheduler == "SA-solver":
	schedulerConfig['algorithm_type'] = 'data_prediction'
	CascadeMemory.decoder.scheduler = SASolverScheduler.from_config(schedulerConfig)
	else:
	CascadeMemory.decoder.scheduler = DDPMWuerstchenScheduler.from_config(schedulerConfig)

	with torch.inference_mode():
	decoder_output = CascadeMemory.decoder(
	image_embeddings=prior_output.image_embeddings.to(dtype),
	prompt_embeds = positive_embeds,
	prompt_embeds_pooled = positive_pooled,
	negative_prompt_embeds = negative_embeds,
	negative_prompt_embeds_pooled = negative_pooled,
	prompt=None,
	negative_prompt=None,
	guidance_scale=1,
	output_type="pil",
	num_inference_steps=decoder_steps,
	generator=generator,
	).images

	del prior_output, positive_embeds, positive_pooled, negative_embeds, negative_pooled
	del generator

	if not CascadeMemory.noUnload:
	CascadeMemory.decoder.decoder = None
	CascadeMemory.decoder.vqgan = None
	CascadeMemory.lastDecoder = None

	gc.collect()
	torch.cuda.empty_cache()

	result = []

	for image in decoder_output:
	info=create_infotext(priorModel, decoderModel, vaeModel, positive_prompt, negative_prompt, clipskip, guidance_scale, prior_steps, decoder_steps, fixed_seed,
	PriorScheduler, DecoderScheduler, width, height)
	result.append((image, info))
	images.save_image(
	image,
	opts.outdir_samples or opts.outdir_txt2img_samples,
	"",
	fixed_seed,
	positive_prompt,
	opts.samples_format,
	info
	)
	fixed_seed += 1

	gc.collect()
	torch.cuda.empty_cache()

	CascadeMemory.locked = False
	return gradio.Button.update(value='Generate', variant='primary', interactive=True), gradio.Button.update(interactive=True), result


	def on_ui_tabs():
	if CascadeMemory.ModuleReload:
	reload (pipeline)
	reload (models)
	reload (styles)

	from modules.ui_components import ToolButton

	def buildModelsLists ():
	prior = ["lite", "full"] + models.models_list_prior
	decoder = ["lite", "full"] + models.models_list_decoder

	import glob
	customStageC = glob.glob(".\models\diffusers\StableCascadeCustom\StageC\*.safetensors")
	customStageB = glob.glob(".\models\diffusers\StableCascadeCustom\StageB\*.safetensors")

	for i in customStageC:
	prior.append(i.split('\\')[-1])

	for i in customStageB:
	decoder.append(i.split('\\')[-1])
	return prior, decoder

	models_list_P, models_list_D = buildModelsLists ()

	def refreshModels ():
	prior, decoder = buildModelsLists ()
	return gradio.Dropdown.update(choices=prior), gradio.Dropdown.update(choices=decoder)

	def getGalleryIndex (evt: gradio.SelectData):
	CascadeMemory.galleryIndex = evt.index

	def reuseLastSeed ():
	return CascadeMemory.lastSeed + CascadeMemory.galleryIndex

	def randomSeed ():
	return -1

	def i2iImageFromGallery (gallery):
	try:
	newImage = gallery[CascadeMemory.galleryIndex][0]['name'].split('?')
	return newImage[0]
	except:
	return None

	def i2iSwap (i1, i2):
	return i2, i1

	def toggleNU ():
	if not CascadeMemory.locked:
	CascadeMemory.noUnload ^= True
	return gradio.Button.update(variant=['secondary', 'primary'][CascadeMemory.noUnload])
	def unloadM ():
	if not CascadeMemory.locked:
	CascadeMemory.teCLIP = None
	CascadeMemory.prior = None
	CascadeMemory.decoder = None
	CascadeMemory.lastPrior = None
	CascadeMemory.lastDecoder = None
	CascadeMemory.lastTextEncoder = None
	gc.collect()
	torch.cuda.empty_cache()
	else:
	gradio.Info('Unable to unload models while using them.')
	def clearE ():
	if CascadeMemory.locked:
	CascadeMemory.locked = False
	return gradio.Button.update(value='Generate', variant='primary', interactive=True)

	def toggleSP ():
	if not CascadeMemory.locked:
	return gradio.Button.update(variant='primary')
	def superPrompt (prompt, seed):
	tokenizer = getattr (shared, 'SuperPrompt_tokenizer', None)
	superprompt = getattr (shared, 'SuperPrompt_model', None)
	if tokenizer is None:
	tokenizer = T5TokenizerFast.from_pretrained(
	'roborovski/superprompt-v1',
	cache_dir='.//models//diffusers//',
	)
	shared.SuperPrompt_tokenizer = tokenizer
	if superprompt is None:
	superprompt = T5ForConditionalGeneration.from_pretrained(
	'roborovski/superprompt-v1',
	cache_dir='.//models//diffusers//',
	device_map='auto',
	torch_dtype=torch.float16
	)
	shared.SuperPrompt_model = superprompt
	print("SuperPrompt-v1 model loaded successfully.")
	if torch.cuda.is_available():
	superprompt.to('cuda')

	torch.manual_seed(get_fixed_seed(seed))
	device = superprompt.device
	systemprompt1 = "Expand the following prompt to add more detail: "

	input_ids = tokenizer(systemprompt1 + prompt, return_tensors="pt").input_ids.to(device)
	outputs = superprompt.generate(input_ids, max_new_tokens=77, repetition_penalty=1.2, do_sample=True)
	dirty_text = tokenizer.decode(outputs[0])
	result = dirty_text.replace("<pad>", "").replace("</s>", "").strip()

	return gradio.Button.update(variant='secondary'), result


	def toggleKarras ():
	if not CascadeMemory.locked:
	CascadeMemory.karras ^= True
	return gradio.Button.update(variant='primary' if CascadeMemory.karras == True else 'secondary',
	value='\U0001D40A' if CascadeMemory.karras == True else '\U0001D542')
	def toggleF16 ():
	if not CascadeMemory.locked:
	CascadeMemory.force_f16 ^= True
	return gradio.Button.update(variant='primary' if CascadeMemory.force_f16 == True else 'secondary')


	def toggleE1 ():
	if not CascadeMemory.locked:
	CascadeMemory.embedsState ^= 2
	return gradio.Button.update(variant='primary' if (CascadeMemory.embedsState & 2) else 'secondary')
	def toggleE2 ():
	if not CascadeMemory.locked:
	CascadeMemory.embedsState ^= 1
	return gradio.Button.update(variant='primary' if (CascadeMemory.embedsState & 1) else 'secondary')

	def toggleGenerate ():
	CascadeMemory.locked = True
	return gradio.Button.update(value='...', variant='secondary', interactive=False), gradio.Button.update(interactive=False)

	schedulerList = ["default", "DPM++ 2M", "DPM++ 2M SDE", "LCM", "SA-solver", ]

	def parsePrompt (positive, negative, clipskip, width, height, seed, schedulerP, schedulerD, stepsP, stepsD, cfg):
	p = positive.split('\n')
	lineCount = len(p)

	negative = ''

	if "Prompt" != p[0] and "Prompt: " != p[0][0:8]: # civitAI style special case
	positive = p[0]
	l = 1
	while (l < lineCount) and not (p[l][0:17] == "Negative prompt: " or p[l][0:7] == "Steps: " or p[l][0:6] == "Size: "):
	if p[l] != '':
	positive += '\n' + p[l]
	l += 1

	for l in range(lineCount):
	if "Prompt" == p[l][0:6]:
	if ": " == p[l][6:8]: # mine
	positive = str(p[l][8:])
	c = 1
	elif "Prompt" == p[l] and (l+1 < lineCount): # webUI
	positive = p[l+1]
	c = 2
	else:
	continue

	while (l+c < lineCount) and not (p[l+c][0:10] == "Negative: " or p[l+c][0:15] == "Negative Prompt" or p[l+c] == "Params" or p[l+c][0:7] == "Steps: " or p[l+c][0:6] == "Size "):
	if p[l+c] != '':
	positive += '\n' + p[l+c]
	c += 1
	l += 1

	elif "Negative" == p[l][0:8]:
	if ": " == p[l][8:10]: # mine
	negative = str(p[l][10:])
	c = 1
	elif " prompt: " == p[l][8:17]: # civitAI
	negative = str(p[l][17:])
	c = 1
	elif " Prompt" == p[l][8:15] and (l+1 < lineCount): # webUI
	negative = p[l+1]
	c = 2
	else:
	continue

	while (l+c < lineCount) and not (p[l+c] == "Params" or p[l+c][0:7] == "Steps: " or p[l+c][0:6] == "Size: "):
	if p[l+c] != '':
	negative += '\n' + p[l+c]
	c += 1
	l += 1

	else:
	params = p[l].split(',')
	for k in range(len(params)):
	pairs = params[k].strip().split(' ')
	match pairs[0]:
	case "Size:":
	size = pairs[1].split('x')
	width = 128 * ((int(size[0]) + 64) // 128)
	height = 128 * ((int(size[1]) + 64) // 128)
	case "Seed:":
	seed = int(pairs[1])
	case "Sampler:":
	sched = ' '.join(pairs[1:])
	if sched in schedulerList:
	scheduler = sched
	case "Scheduler(Prior/Decoder):":
	sched = ' '.join(pairs[1:])
	sched = sched.split('/')
	if sched[0] in schedulerList:
	schedulerP = sched[0]
	if sched[1] in schedulerList:
	schedulerD = sched[1]
	case "Scheduler:":
	sched = ' '.join(pairs[1:])
	if sched in schedulerList:
	schedulerP = sched
	case "Steps(Prior/Decoder):":
	steps = str(pairs[1]).split('/')
	stepsP = int(steps[0])
	stepsD = int(steps[1])
	case "Steps:":
	stepsP = int(pairs[1])
	case "CFG":
	if "scale:" == pairs[1]:
	cfg = float(pairs[2])
	case "CFG:":
	cfg = float(pairs[1])
	case "width:":
	width = 128 * ((int(pairs[1]) + 64) // 128)
	case "height:":
	height = 128 * ((int(pairs[1]) + 64) // 128)
	case "CLIP skip:":
	clipskip = int(pairs[1])
	return positive, negative, clipskip, width, height, seed, schedulerP, schedulerD, stepsP, stepsD, cfg



	with gradio.Blocks() as stable_cascade_block:
	with ResizeHandleRow():
	with gradio.Column():
	with gradio.Row():
	refresh = ToolButton(value='\U0001f504')
	modelP = gradio.Dropdown(models_list_P, label='Stage C (Prior)', value="lite", type='value', scale=2)
	modelD = gradio.Dropdown(models_list_D, label='Stage B (Decoder)', value="lite", type='value', scale=2)
	modelV = gradio.Dropdown(['default', 'madebyollin'], label='Stage A (VAE)', value='default', type='value', scale=0)
	clipskip = gradio.Number(label='CLIP skip', minimum=0, maximum=2, step=1, value=0, precision=0, scale=1)

	with gradio.Row():
	parse = ToolButton(value="↙️", variant='secondary', tooltip="parse")
	SP = ToolButton(value='ꌗ', variant='secondary', tooltip='zero out negative embeds')
	karras = ToolButton(value="\U0001D542", variant='secondary', tooltip="use Karras sigmas")
	schedulerP = gradio.Dropdown(schedulerList, label='Sampler (Prior)', value="default", type='value', scale=1)
	schedulerD = gradio.Dropdown(schedulerList, label='Sampler (Decoder)', value="default", type='value', scale=1)
	style = gradio.Dropdown([x[0] for x in styles.styles_list], label='Style', value="(None)", type='index', scale=1)
	f16 = ToolButton(value="f16", variant='secondary', tooltip="force float16")

	with gradio.Row():
	prompt = gradio.Textbox(label='Prompt', placeholder='Enter a prompt here...', default='', lines=2)

	with gradio.Row():
	negative_prompt = gradio.Textbox(label='Negative', placeholder='', lines=1.0)
	with gradio.Row():
	width = gradio.Slider(label='Width', minimum=128, maximum=4096, step=128, value=1024, elem_id="StableCascade_width")
	swapper = ToolButton(value="\U000021C4")
	height = gradio.Slider(label='Height', minimum=128, maximum=4096, step=128, value=1024, elem_id="StableCascade_height")
	with gradio.Row():
	prior_steps = gradio.Slider(label='Steps (Prior)', minimum=1, maximum=60, step=1, value=20)
	decoder_steps = gradio.Slider(label='Steps (Decoder)', minimum=1, maximum=40, step=1, value=10)
	with gradio.Row():
	guidance_scale = gradio.Slider(label='CFG', minimum=1, maximum=16, step=0.1, value=4.0)
	sampling_seed = gradio.Number(label='Seed', value=-1, precision=0, scale=0)
	random = ToolButton(value="\U0001f3b2\ufe0f")
	reuseSeed = ToolButton(value="\u267b\ufe0f")
	batch_size = gradio.Number(label='Batch Size', minimum=1, maximum=9, value=1, precision=0, scale=0)
	# with gradio.Row():
	# resolution = gradio.Slider(label='Resolution multiple (prior)', minimum=32, maximum=64, step=0.01, value=42.67)
	# latentScale = gradio.Slider(label='Latent scale (VAE)', minimum=6, maximum=16, step=0.01, value=10.67)

	with gradio.Accordion(label='Image prompt', open=False):
	#add start/end? would need to modify pipeline

	with gradio.Row():
	i2iSource1 = gradio.Image(label='image source', sources=['upload'], type='pil', interactive=True, show_download_button=False)
	i2iSource2 = gradio.Image(sources=['upload'], type='pil', interactive=True, show_download_button=False)
	with gradio.Row():
	embed1State = ToolButton('Neg', variant='secondary')
	i2iFromGallery1 = gradio.Button(value='Get image (1) from gallery', scale=6)
	i2iFromGallery2 = gradio.Button(value='Get image (2) from gallery', scale=6)
	embed2State = ToolButton('Neg', variant='secondary')
	with gradio.Row():
	swapImages = gradio.Button(value='Swap images')

	with gradio.Row():
	noUnload = gradio.Button(value='keep models loaded', variant='primary' if CascadeMemory.noUnload else 'secondary', tooltip='noUnload', scale=1)
	unloadModels = gradio.Button(value='unload models', tooltip='force unload of models', scale=1)
	# clearError = gradio.Button(value='remove Error', tooltip='clear Error', scale=1)

	ctrls = [modelP, modelD, modelV, prompt, negative_prompt, clipskip, width, height, guidance_scale, prior_steps, decoder_steps,
	sampling_seed, batch_size, schedulerP, schedulerD, style, i2iSource1, i2iSource2]#, resolution, latentScale]

	with gradio.Column():
	generate_button = gradio.Button(value="Generate", variant='primary')
	output_gallery = gradio.Gallery(label='Output', height="75vh", show_label=False,
	object_fit='contain', visible=True, columns=1, preview=True)

	with gradio.Row():
	buttons = parameters_copypaste.create_buttons(["img2img", "inpaint", "extras"])

	for tabname, button in buttons.items():
	parameters_copypaste.register_paste_params_button(parameters_copypaste.ParamBinding(
	paste_button=button, tabname=tabname, source_text_component=prompt, source_image_component=output_gallery,
	))

	noUnload.click(toggleNU, inputs=[], outputs=noUnload)
	unloadModels.click(unloadM, inputs=[], outputs=[], show_progress=True)
	# clearError.click(clearE, inputs=[], outputs=[generate_button])

	SP.click(toggleSP, inputs=[], outputs=SP)
	SP.click(superPrompt, inputs=[prompt, sampling_seed], outputs=[SP, prompt])

	parse.click(parsePrompt, inputs=[prompt, negative_prompt, clipskip, width, height, sampling_seed, schedulerP, schedulerD, prior_steps, decoder_steps, guidance_scale], outputs=[prompt, negative_prompt, clipskip, width, height, sampling_seed, schedulerP, schedulerD, prior_steps, decoder_steps, guidance_scale], show_progress=False)
	refresh.click(refreshModels, inputs=[], outputs=[modelP, modelD])
	karras.click(toggleKarras, inputs=[], outputs=karras)
	f16.click(toggleF16, inputs=[], outputs=f16)
	swapper.click(fn=None, _js="function(){switchWidthHeight('StableCascade')}", inputs=None, outputs=None, show_progress=False)
	random.click(randomSeed, inputs=[], outputs=sampling_seed, show_progress=False)
	reuseSeed.click(reuseLastSeed, inputs=[], outputs=sampling_seed, show_progress=False)

	i2iFromGallery1.click (fn=i2iImageFromGallery, inputs=[output_gallery], outputs=[i2iSource1])
	i2iFromGallery2.click (fn=i2iImageFromGallery, inputs=[output_gallery], outputs=[i2iSource2])
	swapImages.click (fn=i2iSwap, inputs=[i2iSource1, i2iSource2], outputs=[i2iSource1, i2iSource2])
	embed1State.click(fn=toggleE1, inputs=[], outputs=[embed1State], show_progress=False)
	embed2State.click(fn=toggleE2, inputs=[], outputs=[embed2State], show_progress=False)
	output_gallery.select (fn=getGalleryIndex, inputs=[], outputs=[])

	generate_button.click(predict, inputs=ctrls, outputs=[generate_button, SP, output_gallery])
	generate_button.click(toggleGenerate, inputs=[], outputs=[generate_button, SP])
	return [(stable_cascade_block, "StableCascade", "stable_cascade_DoE")]

	script_callbacks.on_ui_tabs(on_ui_tabs)