s1.1-32B

Runtime error

bobber commited on 24 days ago

Commit

078e1ae

verified ·

1 Parent(s): a8ba17b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -60,7 +60,7 @@ SYSTEM_PROMPT = "You are a friendly Chatbot."
 @spaces.GPU
 def generate(prompt, history):
     messages = [
-        {"role": "system", "content": SYSTEM_PROMPT},
         {"role": "user", "content": prompt}
     ]
     # text = tokenizer.apply_chat_template(
@@ -87,10 +87,10 @@ def generate(prompt, history):
         # tokenize=True,
         return_dict=True,
         return_tensors="pt",
-    ).to(model.device)
     outputs = model.generate(
-        **inputs,
-        max_new_tokens=512,
     )
     response = processor.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])[0]

 @spaces.GPU
 def generate(prompt, history):
     messages = [
+        # {"role": "system", "content": SYSTEM_PROMPT},
         {"role": "user", "content": prompt}
     ]
     # text = tokenizer.apply_chat_template(
         # tokenize=True,
         return_dict=True,
         return_tensors="pt",
+    )
     outputs = model.generate(
+        **inputs.to(model.device),
+        max_new_tokens=100,
     )
     response = processor.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])[0]