Shaobai Jiang's picture

Shaobai Jiang

shaobaij

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 hours ago

Dr. Zero: Self-Evolving Search Agents without Training Data

upvoted a paper about 3 hours ago

Learning Latent Action World Models In The Wild

upvoted a paper about 3 hours ago

OpenDecoder: Open Large Language Model Decoding to Incorporate Document Quality in RAG

View all activity

Organizations

None yet

upvoted a paper about 2 hours ago

Dr. Zero: Self-Evolving Search Agents without Training Data

Paper • 2601.07055 • Published Jan 11 • 22

upvoted 7 papers about 3 hours ago

Learning Latent Action World Models In The Wild

Paper • 2601.05230 • Published Jan 8 • 1

OpenDecoder: Open Large Language Model Decoding to Incorporate Document Quality in RAG

Paper • 2601.09028 • Published Jan 13 • 34

UM-Text: A Unified Multimodal Model for Image Understanding

Paper • 2601.08321 • Published Jan 13 • 10

TranslateGemma Technical Report

Paper • 2601.09012 • Published Jan 13 • 20

Molmo2: Open Weights and Data for Vision-Language Models with Video Understanding and Grounding

Paper • 2601.10611 • Published Jan 15 • 29

STEM: Scaling Transformers with Embedding Modules

Paper • 2601.10639 • Published Jan 15 • 2

OpenTinker: Separating Concerns in Agentic Reinforcement Learning

Paper • 2601.07376 • Published Jan 12 • 7

upvoted a paper about 4 hours ago

MegaFlow: Large-Scale Distributed Orchestration System for the Agentic Era

Paper • 2601.07526 • Published Jan 12 • 24

upvoted 6 papers about 6 hours ago

PRL: Process Reward Learning Improves LLMs' Reasoning Ability and Broadens the Reasoning Boundary

Paper • 2601.10201 • Published Jan 15 • 9

JudgeRLVR: Judge First, Generate Second for Efficient Reasoning

Paper • 2601.08468 • Published Jan 13 • 7

Beyond Static Tools: Test-Time Tool Evolution for Scientific Reasoning

Paper • 2601.07641 • Published Jan 12 • 47

MemoBrain: Executive Memory as an Agentic Brain for Reasoning

Paper • 2601.08079 • Published Jan 12 • 38

Toward Ultra-Long-Horizon Agentic Science: Cognitive Accumulation for Machine Learning Engineering

Paper • 2601.10402 • Published Jan 15 • 37

X-Coder: Advancing Competitive Programming with Fully Synthetic Tasks, Solutions, and Tests

Paper • 2601.06953 • Published Jan 11 • 45

upvoted a paper about 7 hours ago

ArenaRL: Scaling RL for Open-Ended Agents via Tournament-based Relative Ranking

Paper • 2601.06487 • Published Jan 10 • 53

upvoted a paper about 19 hours ago

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Paper • 2602.13515 • Published 8 days ago • 35

upvoted 2 papers about 23 hours ago

DR-LoRA: Dynamic Rank LoRA for Mixture-of-Experts Adaptation

Paper • 2601.04823 • Published Jan 8 • 7

Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

Paper • 2601.07226 • Published Jan 12 • 33

upvoted a paper 1 day ago

From Spatial to Actions: Grounding Vision-Language-Action Model in Spatial Foundation Priors

Paper • 2510.17439 • Published Oct 20, 2025 • 28