1 141 33

Shuai Wang

Shuaiii

AI & ML interests

None yet

Recent Activity

upvoted a paper 9 days ago

STEP3-VL-10B Technical Report

liked a model 10 days ago

stepfun-ai/Step3-VL-10B

upvoted a paper 16 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

None yet

upvoted a paper 9 days ago

STEP3-VL-10B Technical Report

Paper • 2601.09668 • Published 11 days ago • 185

upvoted a paper 16 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 17 days ago • 206

upvoted a paper 22 days ago

Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models

Paper • 2512.24618 • Published 26 days ago • 140

upvoted 3 papers about 1 month ago

Latent Implicit Visual Reasoning

Paper • 2512.21218 • Published Dec 24, 2025 • 69

TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published Dec 18, 2025 • 94

Physics of Language Models: Part 4.1, Architecture Design and the Magic of Canon Layers

Paper • 2512.17351 • Published Dec 19, 2025 • 27

upvoted a collection about 1 month ago

Qwen3-VL

Collection

37 items • Updated 26 days ago • 603

upvoted a paper about 1 month ago

Olmo 3

Paper • 2512.13961 • Published Dec 15, 2025 • 27

upvoted 3 papers about 2 months ago

CaptionQA: Is Your Caption as Useful as the Image Itself?

Paper • 2511.21025 • Published Nov 26, 2025 • 28

DeepSeekMath-V2: Towards Self-Verifiable Mathematical Reasoning

Paper • 2511.22570 • Published Nov 27, 2025 • 89

Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer

Paper • 2511.22699 • Published Nov 27, 2025 • 229

upvoted 2 papers 2 months ago

Black-Box On-Policy Distillation of Large Language Models

Paper • 2511.10643 • Published Nov 13, 2025 • 51

PAN: A World Model for General, Interactable, and Long-Horizon World Simulation

Paper • 2511.09057 • Published Nov 12, 2025 • 79

upvoted 7 papers 3 months ago

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published Oct 13, 2025 • 179

Diffusion Transformers with Representation Autoencoders

Paper • 2510.11690 • Published Oct 13, 2025 • 166

Shuai Wang

AI & ML interests

Recent Activity

Organizations

Shuaiii's activity