Frank Li's picture

53

Frank Li

Frank1092

·

Frankly

AI & ML interests

None yet

Recent Activity

upvoted a paper 8 days ago

Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds

upvoted a paper 9 days ago

DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

upvoted a paper 9 days ago

Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B

View all activity

Organizations

upvoted a paper 8 days ago

Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds

Paper • 2511.08892 • Published 10 days ago • 174

upvoted 3 papers 9 days ago

DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

Paper • 2511.06307 • Published 12 days ago • 50

Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B

Paper • 2511.06221 • Published 13 days ago • 113

Grounding Computer Use Agents on Human Demonstrations

Paper • 2511.07332 • Published 11 days ago • 99

upvoted 2 papers 10 days ago

The Path Not Taken: RLVR Provably Learns Off the Principals

Paper • 2511.08567 • Published 10 days ago • 27

IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction

Paper • 2511.07327 • Published 11 days ago • 70

upvoted 3 papers 11 days ago

Too Good to be Bad: On the Failure of LLMs to Role-Play Villains

Paper • 2511.04962 • Published 15 days ago • 50

DeepEyesV2: Toward Agentic Multimodal Model

Paper • 2511.05271 • Published 14 days ago • 38

Visual Spatial Tuning

Paper • 2511.05491 • Published 14 days ago • 49

upvoted 3 papers 14 days ago

Scaling Agent Learning via Experience Synthesis

Paper • 2511.03773 • Published 16 days ago • 77

V-Thinker: Interactive Thinking with Images

Paper • 2511.04460 • Published 15 days ago • 95

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

Paper • 2511.04570 • Published 15 days ago • 195

upvoted 2 papers 16 days ago

Scaling Latent Reasoning via Looped Language Models

Paper • 2510.25741 • Published 23 days ago • 215

ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning

Paper • 2510.27492 • Published 22 days ago • 79

upvoted 6 papers about 2 months ago

Quantile Advantage Estimation for Entropy-Safe Reasoning

Paper • 2509.22611 • Published Sep 26 • 117

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26 • 133

SciReasoner: Laying the Scientific Reasoning Ground Across Disciplines

Paper • 2509.21320 • Published Sep 25 • 99

MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources

Paper • 2509.21268 • Published Sep 25 • 101

VCRL: Variance-based Curriculum Reinforcement Learning for Large Language Models

Paper • 2509.19803 • Published Sep 24 • 118

Video models are zero-shot learners and reasoners

Paper • 2509.20328 • Published Sep 24 • 96