3 10 1

Abdelhakim Benechehab

abenechehab

https://abenechehab.github.io/

AI & ML interests

Reinforcement Learning

Recent Activity

authored a paper 16 days ago

LLMs as In-Context Meta-Learners for Model and Hyperparameter Selection

upvoted a paper 16 days ago

LLMs as In-Context Meta-Learners for Model and Hyperparameter Selection

upvoted a paper about 1 month ago

From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation

View all activity

Organizations

authored a paper 16 days ago

LLMs as In-Context Meta-Learners for Model and Hyperparameter Selection

Paper • 2510.26510 • Published 20 days ago • 2

upvoted a paper 16 days ago

LLMs as In-Context Meta-Learners for Model and Hyperparameter Selection

Paper • 2510.26510 • Published 20 days ago • 2

upvoted a paper about 1 month ago

From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation

Paper • 2510.07624 • Published Oct 8 • 6

authored a paper about 1 month ago

From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation

Paper • 2510.07624 • Published Oct 8 • 6

commented a paper about 1 month ago

From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation

Paper • 2510.07624 • Published Oct 8 • 6 •

upvoted a paper 2 months ago

A Survey of Reinforcement Learning for Large Reasoning Models

Paper • 2509.08827 • Published Sep 10 • 188

upvoted an article 4 months ago

Article

Introducing Trackio: A Lightweight Experiment Tracking Library from Hugging Face

Jul 29

•

198

liked a model 9 months ago

paris-noah/Mantis-8M

Updated Sep 4 • 12.3k • 20

authored 2 papers 9 months ago

TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning

Paper • 2502.15425 • Published Feb 21 • 9

Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level

Paper • 2411.03562 • Published Nov 5, 2024 • 68

upvoted a paper 9 months ago

AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting

Paper • 2502.10235 • Published Feb 14 • 9

commented a paper 9 months ago

AdaPTS: Adapting Univariate Foundation Models to Probabilistic Multivariate Time Series Forecasting

Paper • 2502.10235 • Published Feb 14 • 9 •

upvoted a paper 10 months ago

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 123

upvoted an article 11 months ago

Article

Finding Moroccan Arabic (Darija) in Fineweb 2

Dec 8, 2024

•

upvoted a paper about 1 year ago

Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level

Paper • 2411.03562 • Published Nov 5, 2024 • 68

updated a Space about 1 year ago

README

🏃

commented a paper about 1 year ago

Zero-shot Model-based Reinforcement Learning using Large Language Models

Paper • 2410.11711 • Published Oct 15, 2024 • 9 •

upvoted a paper about 1 year ago

Zero-shot Model-based Reinforcement Learning using Large Language Models

Paper • 2410.11711 • Published Oct 15, 2024 • 9

commented a paper about 1 year ago

Zero-shot Model-based Reinforcement Learning using Large Language Models

Paper • 2410.11711 • Published Oct 15, 2024 • 9 •

authored a paper about 1 year ago

Large Language Models as Markov Chains

Paper • 2410.02724 • Published Oct 3, 2024 • 33

Abdelhakim Benechehab

AI & ML interests

Recent Activity

Organizations

abenechehab's activity

Introducing Trackio: A Lightweight Experiment Tracking Library from Hugging Face

Finding Moroccan Arabic (Darija) in Fineweb 2

README