Spaces:

danielle2003
/

sentiment

Sleeping

danielle2003 commited on Mar 20

Commit

24cc0f4

1 Parent(s): c178054

require

Files changed (1) hide show

scripts/train.py CHANGED Viewed

@@ -3,7 +3,8 @@ from datasets import load_dataset
 # Load dataset (French dataset example: Allociné)
 dataset = load_dataset("allocine")
 # Load tokenizer
 model_name = "distilbert-base-multilingual-cased"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -38,6 +39,7 @@ trainer = Trainer(
     eval_dataset=dataset["test"],
 )
 # Train model
 trainer.train()

 # Load dataset (French dataset example: Allociné)
 dataset = load_dataset("allocine")
+dataset["train"] = dataset["train"].select(range(10))  # Train on 500 samples
+dataset["test"] = dataset["test"].select(range(5))  # Test on 200 samples
 # Load tokenizer
 model_name = "distilbert-base-multilingual-cased"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
     eval_dataset=dataset["test"],
 )
 # Train model
 trainer.train()