mesolitica
/

Malaysian-Qwen2.5-72B-Reasoning-SFT-v0.1

Model card Files Files and versions

Malaysian Qwen 2.5 72B Reasoning Instruct v0.1

Initial LoRA mesolitica/Malaysian-Qwen2.5-72B-Instruct on https://huggingface.co/datasets/mesolitica/Malaysian-Reasoning/commit/e1bb8a2141a1db351321d988687432d312495905 to introduce Malaysian reasoning.

This model been use to generate mesolitica/Malaysian-Reasoning by using few shots prompts.

Special thanks

Special thanks to https://www.sns.com.my and Nvidia for 8x H100 node!

Downloads last month: -

Safetensors

Model size

73B params

Tensor type

BF16

·

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for mesolitica/Malaysian-Qwen2.5-72B-Reasoning-SFT-v0.1

Quantizations

Collection including mesolitica/Malaysian-Qwen2.5-72B-Reasoning-SFT-v0.1

Malaysian Reasoning

Full parameter post training using SFT warmup and GRPO. • 10 items • Updated 5 days ago • 1