5456es
/

implicit_reward_Llama-3.2-3B-Instruct_prune_0.7-sigmoid

preference-learning

Model card Files Files and versions

5456es commited on Sep 8

Commit

b3193e6

·

verified ·

1 Parent(s): 600e95e

Upload latest with huggingface_hub

Files changed (1) hide show

latest +1 -0

latest ADDED Viewed

	@@ -0,0 +1 @@


1	+ global_step4552