Spaces:

atlasia
/

Al-Atlas-LLM

Running on Zero

BounharAbdelaziz commited on Feb 18

Commit

3c739a1

verified ·

1 Parent(s): a70b57c

added @spaces.GPU

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,12 @@
 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
 # token
 token = os.environ['TOKEN']
@@ -9,7 +15,7 @@ token = os.environ['TOKEN']
 MODEL_NAME = "atlasia/Al-Atlas-LLM"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=token)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=token).to('cuda')
 # Predefined examples
 examples = [
@@ -23,6 +29,7 @@ examples = [
      , 256, 0.7, 0.9, 150, 8, 1.5],
 ]
 def generate_text(prompt, max_length=256, temperature=0.7, top_p=0.9, top_k=150, num_beams=8, repetition_penalty=1.5):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     output = model.generate(

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
+import spaces
+import torch
+device = "cuda:0" if torch.cuda.is_available() else "cpu"
+print(f'[INFO] Using device: {device}')
 # token
 token = os.environ['TOKEN']
 MODEL_NAME = "atlasia/Al-Atlas-LLM"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=token)
+model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=token).to(device)
 # Predefined examples
 examples = [
      , 256, 0.7, 0.9, 150, 8, 1.5],
 ]
+@spaces.GPU
 def generate_text(prompt, max_length=256, temperature=0.7, top_p=0.9, top_k=150, num_beams=8, repetition_penalty=1.5):
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     output = model.generate(