Spaces:
Running
Running
File size: 501 Bytes
f5182f4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
#!/bin/sh
# 1) สตาร์ท Ollama server พื้นฐาน
ollama serve &
# 2) รอให้ server พร้อม (เช่น 5 วินาที)
sleep 5
# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
ollama pull qwen2.5-coder:3b
# 4) หยุด server ชั่วคราว
pkill ollama
# 5) สตาร์ท server ใหม่ พร้อม inference flags
ollama serve --threads 2 --batch-size 1 --mmap
|