ollama-server / run.sh
R1000's picture
Create run.sh
f5182f4 verified
raw
history blame
501 Bytes
#!/bin/sh
# 1) สตาร์ท Ollama server พื้นฐาน
ollama serve &
# 2) รอให้ server พร้อม (เช่น 5 วินาที)
sleep 5
# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
ollama pull qwen2.5-coder:3b
# 4) หยุด server ชั่วคราว
pkill ollama
# 5) สตาร์ท server ใหม่ พร้อม inference flags
ollama serve --threads 2 --batch-size 1 --mmap