Spaces:

davidizzle
/

LIA_LLM_PoC

Running

davidizzle commited on 20 days ago

Commit

3fa478b

1 Parent(s): 697b1f4

Works?

Files changed (2) hide show

app.py CHANGED Viewed

@@ -44,7 +44,7 @@ def load_model():
     # model_id = "deepseek-ai/deepseek-llm-7b-chat"
     # model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
-    model_id = "deepseek-ai/DeepSeek-V2-Lite-Chat"
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
@@ -53,7 +53,7 @@ def load_model():
         device_map="auto",
         torch_dtype=torch.float16,
         # quantization_config=quantization_config,
-        # attn_implementation="flash_attention_2",
         trust_remote_code = True
     )
     # model.to("cpu")

     # model_id = "deepseek-ai/deepseek-llm-7b-chat"
     # model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B"
+    model_id = "deepseek-ai/DeepSeek-R1-Distill-Qwen-14B"
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,
         device_map="auto",
         torch_dtype=torch.float16,
         # quantization_config=quantization_config,
+        # attn_implementation="flash_attention_2",
         trust_remote_code = True
     )
     # model.to("cpu")

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
 streamlit
-git+https://github.com/huggingface/transformers.git
 torch
 accelerate

 streamlit
+transformers
 torch
 accelerate