AaronHuangWei
/

Qwen2.5-7B-GRPO-MATH500

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-7B-GRPO-MATH500

Commit History

Training in progress, step 100

709a029
verified

AaronHuangWei commited on Aug 14

Training in progress, step 50

c6112c4
verified

AaronHuangWei commited on Aug 14

initial commit

57e994b
verified

AaronHuangWei commited on Aug 14