Spaces:

eslamirad
/

qwen25

Sleeping

eslamirad commited on Feb 28

Commit

0fca800

verified ·

1 Parent(s): fa5e4da

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,13 +8,12 @@ MODEL_NAME = "Qwen/Qwen2.5-7B-Instruct"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
-    torch_dtype=torch.float16,
-    device_map="auto"
 )
 # تابع چت‌بات
 def chat_with_qwen(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     output = model.generate(**inputs, max_new_tokens=200)
     response = tokenizer.decode(output[0], skip_special_tokens=True)
     return response

 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
+    torch_dtype=torch.float32,  # از float32 استفاده کن تا روی CPU اجرا بشه
 )
 # تابع چت‌بات
 def chat_with_qwen(prompt):
+    inputs = tokenizer(prompt, return_tensors="pt")
     output = model.generate(**inputs, max_new_tokens=200)
     response = tokenizer.decode(output[0], skip_special_tokens=True)
     return response