lewtun
/

Llama-3.2-1B-SFT-Capybara-No-Packing-Llama

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Llama-3.2-1B-SFT-Capybara-No-Packing-Llama

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

lewtun's picture

lewtun HF Staff

Training in progress, step 248

3a083d3 verified 21 days ago

.gitattributes

1.57 kB

Training in progress, step 248 21 days ago
config.json

839 Bytes

Training in progress, step 248 21 days ago
model.safetensors

3 GB
xet

Training in progress, step 248 21 days ago
special_tokens_map.json

182 Bytes

Training in progress, step 248 21 days ago
tokenizer.json

17.2 MB
xet

Training in progress, step 248 21 days ago
tokenizer_config.json

54.6 kB

Training in progress, step 248 21 days ago
training_args.bin
Detected Pickle imports (14)
- "torch.bfloat16",
- "open_r1.configs.SFTConfig",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SaveStrategy",
- "accelerate.state.PartialState",
- "transformers.training_args.OptimizerNames",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "torch.device",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_utils.HubStrategy"
How to fix it?
11.1 kB
xet

Training in progress, step 248 21 days ago