GeorgiaTech
/

0.0_llama_nodpo_3iters_bs128_531lr_iter_3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions

0.0_llama_nodpo_3iters_bs128_531lr_iter_3

16.1 GB

1 contributor

History: 4 commits

ZhangShenao's picture

End of training

a298a1e verified over 1 year ago