s1.1-32B

Runtime error

bobber commited on Mar 28

Commit

76deac1

1 Parent(s): 4482b12

load gguf weight

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,14 +7,20 @@ import torch
 #Qwen/Qwen2-0.5B
 model_name = "simplescaling/s1.1-32B"
 subfolder = "Qwen-0.5B-GRPO/checkpoint-1868"
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     # subfolder=subfolder,
-    torch_dtype=torch.bfloat16,
     device_map="auto"
 )
-tokenizer = AutoTokenizer.from_pretrained(model_name, subfolder=subfolder)
 SYSTEM_PROMPT = """
 Respond in the following format:
 <reasoning>

 #Qwen/Qwen2-0.5B
 model_name = "simplescaling/s1.1-32B"
 subfolder = "Qwen-0.5B-GRPO/checkpoint-1868"
+filename = "s1-32B-Q6_K_L.gguf"
+torch_dtype = torch.float32 # could be torch.float16 or torch.bfloat16 too
 model = AutoModelForCausalLM.from_pretrained(
     model_name,
     # subfolder=subfolder,
+    gguf_file=filename,
+    torch_dtype=torch_dtype,
     device_map="auto"
 )
+tokenizer = AutoTokenizer.from_pretrained(model_name
+    , gguf_file=filename
+    # , subfolder=subfolder
+    )
 SYSTEM_PROMPT = """
 Respond in the following format:
 <reasoning>