Spaces:

Didier
/

Vision_language_Gemma3

Running on Zero

Didier commited on Mar 16

Commit

6f080e6

verified ·

1 Parent(s): a5dc4f3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,7 +16,7 @@ from transformers import TextIteratorStreamer
 from threading import Thread
 import torch
-device = 'cuda'
 model_id = "google/gemma-3-4b-it"
 processor = AutoProcessor.from_pretrained(model_id, use_fast=True, padding_side="left")
 model = Gemma3ForConditionalGeneration.from_pretrained(
@@ -24,6 +24,7 @@ model = Gemma3ForConditionalGeneration.from_pretrained(
     torch_dtype=torch.bfloat16
 ).to(device).eval()
 def process(message, history):
     """Generate the model response in streaming mode given message and history
     """

 from threading import Thread
 import torch
+device = 'auto'
 model_id = "google/gemma-3-4b-it"
 processor = AutoProcessor.from_pretrained(model_id, use_fast=True, padding_side="left")
 model = Gemma3ForConditionalGeneration.from_pretrained(
     torch_dtype=torch.bfloat16
 ).to(device).eval()
+@torch.inference_mode()
 def process(message, history):
     """Generate the model response in streaming mode given message and history
     """