Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Debasish's picture

1

Debasish

dkhan05

·

AI & ML interests

None yet

Organizations

dkhan05 's collections 1

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 431
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 5.3k • 623

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 431
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 5.3k • 623

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs