neopolita
/

qwen2.5-3b-instruct-numinamath-tir-20p-lr16-la32-qkvo-gspo

Generated from Trainer

Model card Files Files and versions

qwen2.5-3b-instruct-numinamath-tir-20p-lr16-la32-qkvo-gspo / vocab.json

Commit History

Training in progress, step 10

ed3c585
verified

neopolita commited on Aug 1