Spaces:

sidd1311
/

lang-translator

Running

sidd1311 commited on 4 days ago

Commit

0abae6b

verified ·

1 Parent(s): 04fddc9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 import os
 import re
 from polyglot.detect import Detector
-from bhasa_dataset import load_bhasa_dataset
 HF_TOKEN = os.environ.get("HF_TOKEN", None)
@@ -21,12 +21,6 @@ model = AutoModelForCausalLM.from_pretrained(
         device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(MODEL)
-# Simulated integration of BhasaAnuvaad dataset from paper: https://huggingface.co/papers/2411.04699
-dataset = load_bhasa_dataset()
-sample_pair = dataset[0]
-print(f"Example from dataset - Source: {sample_pair['source_text']}, Target: {sample_pair['target_text']}")
 def lang_detector(text):
     min_chars = 5
     if len(text) < min_chars:

 import os
 import re
 from polyglot.detect import Detector
 HF_TOKEN = os.environ.get("HF_TOKEN", None)
         device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(MODEL)
 def lang_detector(text):
     min_chars = 5
     if len(text) < min_chars: