Spaces:

inflaton-ai
/

logical-reasoning

Build error

dh-mc commited on Jul 17, 2024

Commit

51d9a2e

1 Parent(s): 16ec7f8

Update llm_utils.py

Files changed (1) hide show

llm_toolkit/llm_utils.py CHANGED Viewed

@@ -133,7 +133,7 @@ def extract_answer(text, debug=False):
     return text
-def eval_model(model, tokenizer, eval_dataset, device="cuda"):
     total = len(eval_dataset)
     predictions = []
     for i in tqdm(range(total)):
@@ -142,7 +142,12 @@ def eval_model(model, tokenizer, eval_dataset, device="cuda"):
             return_tensors="pt",
         ).to(device)
-        outputs = model.generate(**inputs, max_new_tokens=4096, use_cache=False)
         decoded_output = tokenizer.batch_decode(outputs)
         debug = i == 0
         decoded_output = [

     return text
+def eval_model(model, tokenizer, eval_dataset, device="cuda", repetition_penalty=1.1):
     total = len(eval_dataset)
     predictions = []
     for i in tqdm(range(total)):
             return_tensors="pt",
         ).to(device)
+        outputs = model.generate(
+            **inputs,
+            max_new_tokens=4096,
+            repetition_penalty=repetition_penalty,
+            use_cache=False,
+        )
         decoded_output = tokenizer.batch_decode(outputs)
         debug = i == 0
         decoded_output = [