angelchen
/

DeepSeek-R1-Distill-Qwen3-4B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

DeepSeek-R1-Distill-Qwen3-4B-GRPO

Commit History

End of training

14f9be2
verified

angelchen commited on May 15, 2025

Model save

a8ee1c3
verified

angelchen commited on May 15, 2025

Training in progress, epoch 0

b639c01
verified

angelchen commited on May 15, 2025

initial commit

30bc861
verified

angelchen commited on May 15, 2025