finetuning - a pgarbacki Collection

pgarbacki 's Collections

RL

data

image

video

foundational models

routing

finetuning

updated Feb 12

Badllama 3: removing safety finetuning from Llama 3 in minutes

Paper • 2407.01376 • Published Jul 1, 2024
Weighted-Reward Preference Optimization for Implicit Model Fusion

Paper • 2412.03187 • Published Dec 4, 2024 • 12
Sparse Matrix in Large Language Model Fine-tuning

Paper • 2405.15525 • Published May 24, 2024