Spaces:
Running
Running
# 1) สตาร์ท Ollama server พื้นฐาน | |
ollama serve & | |
# 2) รอให้ server พร้อม (เช่น 5 วินาที) | |
sleep 5 | |
# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น | |
ollama pull qwen2.5-coder:3b | |
# 4) หยุด server ชั่วคราว | |
pkill ollama | |
# 5) สตาร์ท server ใหม่ พร้อม inference flags | |
ollama serve --threads 2 --batch-size 1 --mmap | |