Spaces:

Tonic
/

Command-A

Runtime error

Tonic commited on Mar 13

Commit

d559f10

unverified ·

1 Parent(s): 0ac061c

reduce position embeddings

Files changed (1) hide show

app.py CHANGED Viewed

@@ -30,7 +30,8 @@ model = AutoModelForCausalLM.from_pretrained(
     quantization_config=quantization_config,  # Apply quantization
     # device_map="auto",  # Automatically map to available devices
     torch_dtype=torch.bfloat16,
-    token=HF_TOKEN
 )
 @spaces.GPU

     quantization_config=quantization_config,  # Apply quantization
     # device_map="auto",  # Automatically map to available devices
     torch_dtype=torch.bfloat16,
+    token=HF_TOKEN,
+    max_position_embeddings=8192  # Reduce context window to 8k tokens (from 128k)
 )
 @spaces.GPU