Spaces:

sandz7
/

loki

Runtime error

sandz7 commited on May 23, 2024

Commit

ec72fe8

1 Parent(s): b28bc26

placed input_ids in cuda and just added the vector for input_ids on generate() for model

Files changed (1) hide show

app.py CHANGED Viewed

@@ -34,9 +34,10 @@ def llama_generation(input_text):
     """
     input_ids = llama_tokenizer.encode(input_text,
-                                       return_tensors='pt')
-    output_ids = llama_model.generate(**input_ids)
     # Decode
     output_text = llama_tokenizer.decode(output_ids,

     """
     input_ids = llama_tokenizer.encode(input_text,
+                                       return_tensors='pt').to('cuda')
+    # llama generation looks for the numeric vectors not the tensors so there is no need for **input_ids rather just input_ids
+    output_ids = llama_model.generate(input_ids=input_ids)
     # Decode
     output_text = llama_tokenizer.decode(output_ids,