KlearReasoner - a Kwai-Klear Collection

Kwai-Klear 's Collections

mini-swe-agent-plus

Klear-AgentForge

RLEP

KlearReasoner

updated 3 days ago

KlearReasoner

Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

Paper • 2512.05591 • Published 7 days ago • 16
CE-GPPO: Controlling Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning

Paper • 2509.20712 • Published Sep 25 • 19
Klear-Reasoner: Advancing Reasoning Capability via Gradient-Preserving Clipping Policy Optimization

Paper • 2508.07629 • Published Aug 11 • 42
Kwai-Klear/Klear-Reasoner-8B

8B • Updated Sep 27 • 31 • 19
Kwai-Klear/KlearReasoner-MathSub-30K

Viewer • Updated Sep 27 • 30k • 115 • 3
Kwai-Klear/KlearReasoner-CodeSub-15K

Viewer • Updated Sep 27 • 15k • 153 • 5
Kwai-Klear/Klear-Reasoner-8B-SFT

8B • Updated Sep 27 • 12 • 2