R1000 commited on
Commit
f5182f4
·
verified ·
1 Parent(s): f76a6b3

Create run.sh

Browse files
Files changed (1) hide show
  1. run.sh +15 -0
run.sh ADDED
@@ -0,0 +1,15 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ #!/bin/sh
2
+ # 1) สตาร์ท Ollama server พื้นฐาน
3
+ ollama serve &
4
+
5
+ # 2) รอให้ server พร้อม (เช่น 5 วินาที)
6
+ sleep 5
7
+
8
+ # 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
9
+ ollama pull qwen2.5-coder:3b
10
+
11
+ # 4) หยุด server ชั่วคราว
12
+ pkill ollama
13
+
14
+ # 5) สตาร์ท server ใหม่ พร้อม inference flags
15
+ ollama serve --threads 2 --batch-size 1 --mmap