Spaces:

universeofml
/

DeepFocusTrain

Runtime error

katsukiai commited on Mar 5

Commit

dddf90e

verified ·

1 Parent(s): 4bce260

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,16 +11,17 @@ from huggingface_hub import HfApi
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 logger = logging.getLogger(__name__)
-# Load DeepSeek-V3 model and tokenizer for CPU
-MODEL_NAME = "deepseek-ai/deepseek-v3"
 logger.info(f"Loading model: {MODEL_NAME} (CPU mode)")
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME,trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, trust_remote_code=True,torch_dtype=torch.float32, device_map="cpu")
-# Function to process text with DeepSeek-V3
 def process_text_with_model(text):
-    logger.info("Processing text with DeepSeek-V3 model (CPU)...")
-    inputs = tokenizer(text, return_tensors="pt").to("cpu")  # Ensures CPU usage
     outputs = model.generate(**inputs, max_length=200)
     processed_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return processed_text
@@ -46,7 +47,7 @@ def generate_and_upload(text):
         logger.info(f"Received text input: {text}")
-        # Process text with DeepSeek-V3
         processed_text = process_text_with_model(text)
         logger.info(f"Processed text: {processed_text}")
@@ -85,8 +86,8 @@ def generate_and_upload(text):
 with gr.Blocks() as demo:
     with gr.Tab("About"):
         gr.Markdown("""
-        # Text Processor with DeepSeek-V3 (CPU)
-        - Processes text with DeepSeek-V3 Transformer
         - Converts output to JSON
         - Uploads to Hugging Face

 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 logger = logging.getLogger(__name__)
+# Load GPT-2 model and tokenizer
+MODEL_NAME = "gpt2"
 logger.info(f"Loading model: {MODEL_NAME} (CPU mode)")
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+tokenizer.pad_token = tokenizer.eos_token  # GPT-2 không có padding token, nên dùng eos_token
+model = AutoModelForCausalLM.from_pretrained(MODEL_NAME)
+# Function to process text with GPT-2
 def process_text_with_model(text):
+    logger.info("Processing text with GPT-2 model (CPU)...")
+    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
     outputs = model.generate(**inputs, max_length=200)
     processed_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return processed_text
         logger.info(f"Received text input: {text}")
+        # Process text with GPT-2
         processed_text = process_text_with_model(text)
         logger.info(f"Processed text: {processed_text}")
 with gr.Blocks() as demo:
     with gr.Tab("About"):
         gr.Markdown("""
+        # Text Processor with GPT-2 (CPU)
+        - Processes text with GPT-2 Transformer
         - Converts output to JSON
         - Uploads to Hugging Face