s1.1-32B

Runtime error

bobber commited on 23 days ago

Commit

c2779df

verified ·

1 Parent(s): 5c1ba29

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -41,8 +41,7 @@ model = Llama4ForConditionalGeneration.from_pretrained(
     # quantization_config=bnb_config,
     device_map="auto",
 )
-# processor = AutoProcessor.from_pretrained(model_name, cache_dir = cache_dir)
-tokenizer = AutoProcessor.from_pretrained(model_name
     # , gguf_file=filename
     # , subfolder=subfolder
     )
@@ -81,7 +80,7 @@ def generate(prompt, history):
     # response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
     # return response
-    inputs = tokenizer.apply_chat_template(
         messages,
         add_generation_prompt=True,
         tokenize=True,
@@ -92,7 +91,7 @@ def generate(prompt, history):
         **inputs,
         max_new_tokens=512,
     )
-    response = tokenizer.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])[0]
 chat_interface = gr.ChatInterface(

     # quantization_config=bnb_config,
     device_map="auto",
 )
+processor = AutoProcessor.from_pretrained(model_name, cache_dir = cache_dir)
     # , gguf_file=filename
     # , subfolder=subfolder
     )
     # response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
     # return response
+    inputs = processor.apply_chat_template(
         messages,
         add_generation_prompt=True,
         tokenize=True,
         **inputs,
         max_new_tokens=512,
     )
+    response = processor.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])[0]
 chat_interface = gr.ChatInterface(