Spaces:

Duplicated from gingdev/ollama-server

R1000
/

ollama-server

Running

App Files Files Community

ollama-server / run.sh

R1000's picture

Create run.sh

f5182f4 verified about 1 month ago

501 Bytes

	#!/bin/sh
	# 1) สตาร์ท Ollama server พื้นฐาน
	ollama serve &

	# 2) รอให้ server พร้อม (เช่น 5 วินาที)
	sleep 5

	# 3) ดึงโมเดลเข้า cache เพื่อ cold-start รวดเร็วขึ้น
	ollama pull qwen2.5-coder:3b

	# 4) หยุด server ชั่วคราว
	pkill ollama

	# 5) สตาร์ท server ใหม่ พร้อม inference flags
	ollama serve --threads 2 --batch-size 1 --mmap