Spaces:

ivpich
/

t-lite

Runtime error

ivpich commited on Aug 3, 2024

Commit

aec6377

verified ·

1 Parent(s): 2b211d5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -38,8 +38,6 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
     ignore_mismatched_sizes=True)
-eos_token_id = tokenizer.eos_token_id
 @spaces.GPU()
 def stream_chat(
     message: str,
@@ -64,20 +62,25 @@ def stream_chat(
     conversation.append({"role": "user", "content": message})
-    input_text = tokenizer.apply_chat_template(conversation, tokenize=False)
-    inputs = tokenizer.encode(input_text, return_tensors="pt").to(device)
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
-        input_ids=inputs,
         max_new_tokens=max_new_tokens,
         do_sample=False if temperature == 0 else True,
         top_p=top_p,
         top_k=top_k,
         temperature=temperature,
         streamer=streamer,
-        pad_token_id=eos_token_id,
-        eos_token_id=eos_token_id,
     )
     with torch.no_grad():
@@ -88,8 +91,6 @@ def stream_chat(
     for new_text in streamer:
         buffer += new_text
         yield buffer
-        if eos_token_id in tokenizer.encode(new_text):
-            break
 chatbot = gr.Chatbot(height=600, placeholder=PLACEHOLDER)

     device_map="auto",
     ignore_mismatched_sizes=True)
 @spaces.GPU()
 def stream_chat(
     message: str,
     conversation.append({"role": "user", "content": message})
+    input_text = tokenizer.apply_chat_template(conversation, add_generation_prompt=True, return_tensors="pt").to(device)
+    terminators = [
+        tokenizer.eos_token_id,
+        tokenizer.convert_tokens_to_ids("")
+    ]
     streamer = TextIteratorStreamer(tokenizer, timeout=60.0, skip_prompt=True, skip_special_tokens=True)
     generate_kwargs = dict(
+        input_ids=input_text,
         max_new_tokens=max_new_tokens,
+        eos_token_id=terminators,
         do_sample=False if temperature == 0 else True,
         top_p=top_p,
         top_k=top_k,
         temperature=temperature,
         streamer=streamer,
+        pad_token_id=10,
     )
     with torch.no_grad():
     for new_text in streamer:
         buffer += new_text
         yield buffer
 chatbot = gr.Chatbot(height=600, placeholder=PLACEHOLDER)