Spaces:

karths
/

types_issues

Running on Zero

karths commited on Feb 26

Commit

1203b35

verified ·

1 Parent(s): 4878941

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -77,7 +77,7 @@ LLAMA_MAX_MAX_NEW_TOKENS = 512
 LLAMA_DEFAULT_MAX_NEW_TOKENS = 512
 LLAMA_MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "1024"))
 llama_device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
-llama_model_id = "HuggingFaceTB/SmolLM2-360M-Instruct"
 llama_tokenizer = AutoTokenizer.from_pretrained(llama_model_id)
 llama_model = AutoModelForCausalLM.from_pretrained(
     llama_model_id,

 LLAMA_DEFAULT_MAX_NEW_TOKENS = 512
 LLAMA_MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "1024"))
 llama_device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+llama_model_id = "HuggingFaceTB/SmolLM2-1.7B-Instruct"
 llama_tokenizer = AutoTokenizer.from_pretrained(llama_model_id)
 llama_model = AutoModelForCausalLM.from_pretrained(
     llama_model_id,