File size: 501 Bytes
f5182f4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#!/bin/sh
# 1) สตาร์ท Ollama server พื้นฐาน
ollama serve &

# 2) รอให้ server พร้อม (เช่น 5 วินาที)
sleep 5

# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
ollama pull qwen2.5-coder:3b

# 4) หยุด server ชั่วคราว
pkill ollama

# 5) สตาร์ท server ใหม่ พร้อม inference flags
ollama serve --threads 2 --batch-size 1 --mmap