Activité

  • Stagiaire: jan. 2020 - juin 2020

Articles de conférence et de revue

2020

  1. The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning
    Harm van Seijen, Hadi Nekoei, Evan Racah et Sarath Chandar
    Neural Information Processing Systems (NeurIPS), 2020.
    #RL
    [arXiv], [code]