Spaces:

davidizzle
/

LIA_LLM_PoC

Running

davidizzle commited on 20 days ago

Commit

1eb2d22

1 Parent(s): 4c090d8

Niente

Files changed (1) hide show

app.py CHANGED Viewed

@@ -55,8 +55,8 @@ def load_model():
         device_map="auto",
         torch_dtype=torch.float16,
         # quantization_config=quantization_config,
-        trust_remote_code = True,
-        attn_implementation="flash_attention_2"
     )
     # model.to("cpu")
     return tokenizer, model

         device_map="auto",
         torch_dtype=torch.float16,
         # quantization_config=quantization_config,
+        # attn_implementation="flash_attention_2",
+        trust_remote_code = True
     )
     # model.to("cpu")
     return tokenizer, model