ollama-server

Running

File size: 501 Bytes

f5182f4

#!/bin/sh
# 1) สตาร์ท Ollama server พื้นฐาน
ollama serve &

# 2) รอให้ server พร้อม (เช่น 5 วินาที)
sleep 5

# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
ollama pull qwen2.5-coder:3b

# 4) หยุด server ชั่วคราว
pkill ollama

# 5) สตาร์ท server ใหม่ พร้อม inference flags
ollama serve --threads 2 --batch-size 1 --mmap