8 31 1

nieshen

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

Diffusion Language Models are Super Data Learners

upvoted a paper 8 days ago

Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

upvoted a paper 10 days ago

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

View all activity

Organizations

upvoted a paper 7 days ago

Diffusion Language Models are Super Data Learners

Paper • 2511.03276 • Published 8 days ago • 110

upvoted a paper 8 days ago

Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

Paper • 2510.22115 • Published 19 days ago • 81

upvoted a paper 10 days ago

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

Paper • 2510.25602 • Published 15 days ago • 68

upvoted a paper 14 days ago

Parallel Loop Transformer for Efficient Test-Time Computation Scaling

Paper • 2510.24824 • Published 16 days ago • 14

upvoted 2 papers 15 days ago

Uniform Discrete Diffusion with Metric Path for Video Generation

Paper • 2510.24717 • Published 16 days ago • 39

FARMER: Flow AutoRegressive Transformer over Pixels

Paper • 2510.23588 • Published 17 days ago • 56

updated 2 models 23 days ago

GSAI-ML/LLaDA-8B-Instruct

Text Generation • 8B • Updated 23 days ago • 273k • 330

GSAI-ML/LLaDA-8B-Base

Text Generation • 8B • Updated 23 days ago • 193k • 84

upvoted a paper 27 days ago

LaSeR: Reinforcement Learning with Last-Token Self-Rewarding

Paper • 2510.14943 • Published 28 days ago • 37

upvoted 2 papers about 1 month ago

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

Paper • 2510.06308 • Published Oct 7 • 52

dParallel: Learnable Parallel Decoding for dLLMs

Paper • 2509.26488 • Published Sep 30 • 19

upvoted 3 papers about 2 months ago

upvoted a paper 2 months ago

Revolutionizing Reinforcement Learning Framework for Diffusion Large Language Models

Paper • 2509.06949 • Published Sep 8 • 56

upvoted 5 papers 3 months ago

UltraMemV2: Memory Networks Scaling to 120B Parameters with Superior Long-Context Learning

Paper • 2508.18756 • Published Aug 26 • 36

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Paper • 2508.14896 • Published Aug 20 • 22

A Survey on Diffusion Language Models

Paper • 2508.10875 • Published Aug 14 • 34

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Paper • 2508.09192 • Published Aug 8 • 30

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published Aug 12 • 36

nieshen

AI & ML interests

Recent Activity

Organizations

nieshen's activity