Publications d'Mathieu Reymond
-
Mathieu Reymond
Domaines de recherche: Apprentissage par renforcement, Apprentissage par renforcement basé sur des modèles, Apprentissage par renforcement multi-agents, IA pour la découverte scientifique
Activité
- Chercheur postdoctoral: mar. 2024 - maintenant
Prépublications
-
Just-in-time Episodic Feedback Hinter: Leveraging Offline Knowledge to Improve LLM Agents Adaptation
Hadi Nekoei, Aman Jaiswal, Patrice Bechard, Oleh Shliazhko, Orlando Marquez Ayala, Mathieu Reymond, Massimo Caccia, Alexandre Drouin, Sarath Chandar et Alexandre Lacoste
In ArXiv, 2025.
#NLP, #RL
[arXiv] -
GRPO-λ: Credit Assignment improves LLM Reasoning
Prasanna Parthasarathi*, Mathieu Reymond*, Boxing Chen, Yufei Cui et Sarath Chandar
In ArXiv, 2025.
#RL, #NLP
[arXiv] -
CrystalGym: A New Benchmark for Materials Discovery Using Reinforcement Learning
Prashant Govindarajan, Mathieu Reymond, Antoine Clavaud, Mariano Phielipp, Santiago Miret et Sarath Chandar
In ArXiv, 2025.
#RL, #Other
[arXiv]
Articles de conférence et de revue
2025
-
A Generalist Hanabi Agent
Arjun Vaithilingam Sudhakar*, Hadi Nekoei*, Mathieu Reymond, Miao Liu, Janarthanan Rajendran et Sarath Chandar
International Conference on Learning Representations (ICLR), 2025.
#RL, #Other
[website], [openreview], [arXiv], [code]