mlabonne
/

SmolGRPO-135M

Text Generation

text-generation-inference

Model card Files Files and versions Community

SmolGRPO-135M / README.md

Commit History

Update README.md

38101da
verified

mlabonne commited on Feb 26

Update README.md

de29dac
verified

mlabonne commited on Feb 26

Upload LlamaForCausalLM

7fd6266
verified

mlabonne commited on Feb 24