Likhith003
/

dpo-llmjudge-lora-adapter

Text Generation

preference-optimization

instruction-tuning

text-generation-inference

Model card Files Files and versions Community

dpo-llmjudge-lora-adapter

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

Likhith003's picture

Update README.md

dda2169 verified 29 days ago