Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

48

Full-text search

Active filters: reward_model

nvidia/Qwen3-Nemotron-14B-BRRM

Text Generation • Updated Dec 18, 2025 • 92 • 11

kp-forks/reward-model-deberta-v3-large-v2

Updated Feb 1, 2023 • 1

mradermacher/Qwen3-Nemotron-8B-BRRM-GGUF

8B • Updated Oct 30, 2025 • 123

mradermacher/Qwen3-Nemotron-8B-BRRM-i1-GGUF

8B • Updated Dec 10, 2025 • 346

mradermacher/Qwen3-Nemotron-14B-BRRM-GGUF

15B • Updated Oct 31, 2025 • 179 • 1

mradermacher/Qwen3-Nemotron-14B-BRRM-i1-GGUF

15B • Updated Dec 5, 2025 • 429 • 2

seangogo/Qwen2.5-1.5B_reward_model_v2

Feature Extraction • 2B • Updated Nov 7, 2025

seangogo/Qwen2.5-1.5B_reward_model_v2_normalized

Feature Extraction • 2B • Updated Nov 8, 2025

xander2432/djpo-reward-model

Text Classification • Updated Jan 5

aliangdw/qwen4b_pref_prog_succ_8_frames_all

4B • Updated Jan 18 • 2

aliangdw/qwen4b_pref_prog_succ_8_frames_all_part2

4B • Updated Jan 20

aliangdw/libero_ablation_prog_pref_with_fail_lora_ft_4frames

5B • Updated Jan 21 • 13

aliangdw/libero_ablation_prog_pref_lora_ft_4frames

5B • Updated Jan 21 • 2

aliangdw/libero_ablation_prog_only_lora_ft_4frames

5B • Updated Jan 21 • 4

aliangdw/rfm_qwen4b_pref_prog_succ_8frames_all_discrete_10bins_part2

4B • Updated Jan 25 • 21

aliangdw/rewind_rfm-1m-id_continuous_scaled

0.5B • Updated 6 days ago • 79

mihirgrao/trace-model

Image-Text-to-Text • 4B • Updated 28 days ago • 208

Sohamgk/safe-ai-reward-model

0.1B • Updated 5 days ago • 121