Spaces:

Ruurd
/

radiolm

Sleeping

App Files Files Community

Ruurd commited on Apr 10

Commit

d0f4aff

1 Parent(s): 0c196de

Fix loading of models (only once per model)

Browse files

Files changed (1) hide show

app.py +37 -24

app.py CHANGED Viewed

@@ -6,53 +6,66 @@ def install(package):
 install("transformers")
-import gradio as gr
-from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 import spaces
-# Dictionary to store loaded models and tokenizers
-loaded_models = {}
-def load_model(model_name, progress=gr.Progress()):
-    """Load the model and tokenizer with a progress bar."""
-    if model_name not in loaded_models:
-        access_token = os.getenv("HF_TOKEN")
-        progress(0, desc="Initializing model loading...")
-        tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=access_token)
-        progress(0.5, desc="Tokenizer loaded. Loading model...")
         model = AutoModelForCausalLM.from_pretrained(
-            model_name, torch_dtype=torch.float16, device_map="auto", use_auth_token=access_token
         )
-        progress(1, desc="Model loaded successfully.")
-        loaded_models[model_name] = (tokenizer, model)
-    return loaded_models[model_name]
 @spaces.GPU
-def generate_text(model_name, prompt, progress=gr.Progress()):
-    """Generate text using the selected model with a loading indicator."""
-    tokenizer, model = load_model(model_name, progress)
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=256)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
-# List of models to choose from
 model_choices = [
     "deepseek-ai/DeepSeek-R1-Distill-Llama-8B",
     "meta-llama/Llama-3.2-3B-Instruct",
     "google/gemma-7b"
 ]
 with gr.Blocks() as demo:
-    gr.Markdown("## Clinical Text Analysis with Multiple Models")
-    model_selector = gr.Dropdown(choices=model_choices, label="Select Model")
     input_text = gr.Textbox(label="Input Clinical Text")
     output_text = gr.Textbox(label="Generated Output")
     analyze_button = gr.Button("Analyze")
     analyze_button.click(fn=generate_text, inputs=[model_selector, input_text], outputs=output_text)
 demo.launch()

 install("transformers")
+import os
 import torch
+import gradio as gr
 import spaces
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# Global cache for loaded models
+model_cache = {}
+# Load a model with progress bar
+def load_model(model_name, progress=gr.Progress(track_tqdm=False)):
+    if model_name not in model_cache:
+        token = os.getenv("HF_TOKEN")
+        progress(0, desc="Loading tokenizer...")
+        tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=token)
+        progress(0.5, desc="Loading model...")
         model = AutoModelForCausalLM.from_pretrained(
+            model_name,
+            torch_dtype=torch.float16,
+            device_map="auto",
+            use_auth_token=token
         )
+        model_cache[model_name] = (tokenizer, model)
+        progress(1, desc="Model ready.")
+        return f"{model_name} loaded and ready!"
+    else:
+        return f"{model_name} already loaded."
+# Inference function using GPU
 @spaces.GPU
+def generate_text(model_name, prompt):
+    tokenizer, model = model_cache[model_name]
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(**inputs, max_new_tokens=256)
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# Available models
 model_choices = [
     "deepseek-ai/DeepSeek-R1-Distill-Llama-8B",
     "meta-llama/Llama-3.2-3B-Instruct",
     "google/gemma-7b"
 ]
+# Gradio Interface
 with gr.Blocks() as demo:
+    gr.Markdown("## Clinical Text Analysis with LLMs (LLaMA, DeepSeek, Gemma)")
+    with gr.Row():
+        model_selector = gr.Dropdown(choices=model_choices, label="Select Model")
+        model_status = gr.Textbox(label="Model Status", interactive=False)
     input_text = gr.Textbox(label="Input Clinical Text")
     output_text = gr.Textbox(label="Generated Output")
     analyze_button = gr.Button("Analyze")
+    # Load model when changed
+    model_selector.change(fn=load_model, inputs=model_selector, outputs=model_status)
+    # Generate output
     analyze_button.click(fn=generate_text, inputs=[model_selector, input_text], outputs=output_text)
 demo.launch()