Christoph Dann

Citée par

	Toutes	Depuis 2019
Citations	2585	2285
indice h	22	22
indice i10	33	31

560

280

140

420

2013201420152016201720182019202020212022202320248 18 13 52 82 122 170 243 407 425 478 558

Accès public

Tout afficher

10 articles

1 article

disponibles

non disponibles

Sur la base des exigences liées au financement

Coauteurs

Emma BrunskillAssociate Professor of Computer Science, Stanford UniversityAdresse e-mail validée de cs.stanford.edu
Mehryar MohriHead, ML Theory, Google Research; Professor, Courant Institute of Mathematical Sciences.Adresse e-mail validée de google.com
Claudio GentileGoogle Research, New York, USAAdresse e-mail validée de google.com
Yishay MansourTel Aviv UniversityAdresse e-mail validée de tauex.tau.ac.il
Jan PetersProfessor for Intelligent Autonomous Systems/TU Darmstadt, Dept. Head/German AI Research Center DFKIAdresse e-mail validée de ias.tu-darmstadt.de
Gerhard NeumannProfessor, Karlsruhe Institute of Technology (KIT)Adresse e-mail validée de robot-learning.de
Sebastian NowozinGoogle DeepMindAdresse e-mail validée de deepmind.com
Lihong Li (李力鸿)AmazonAdresse e-mail validée de amazon.com
Philip ThomasUniversity of Massachusetts AmherstAdresse e-mail validée de cs.umass.edu
Peter GehlerZalandoAdresse e-mail validée de zalando.de

Suivre

Christoph Dann

Research Scientist, Google

Adresse e-mail validée de google.com - Page d'accueil

Reinforcement Learning Machine Learning. Sequential Decision Making under Uncertainty


Titre Trier par citations Trier par année Trier par titre	Citée par Citée par	Année
Unifying PAC and regret: Uniform PAC bounds for episodic reinforcement learning C Dann, T Lattimore, E Brunskill Advances in Neural Information Processing Systems, 5717-5727, 2017	339	2017
Policy evaluation with temporal differences: a survey and comparison. C Dann, G Neumann, J Peters Journal of Machine Learning Research 15 (1), 809-883, 2014	299	2014
Sample complexity of episodic fixed-horizon reinforcement learning C Dann, E Brunskill Advances in Neural Information Processing Systems, 2818-2826, 2015	282	2015
Scaling up behavioral science interventions in online education RF Kizilcec, J Reich, M Yeomans, C Dann, E Brunskill, G Lopez, S Turkay, ... Proceedings of the National Academy of Sciences, 2020	200	2020
Policy certificates: Towards accountable reinforcement learning C Dann, L Li, W Wei, E Brunskill International Conference on Machine Learning, 1507-1516, 2019	168	2019
On Oracle-Efficient PAC RL with Rich Observations C Dann, N Jiang, A Krishnamurthy, A Agarwal, J Langford, RE Schapire Advances in Neural Information Processing Systems, 1429-1439, 2018	137	2018
Thoughts on massively scalable Gaussian processes AG Wilson, C Dann, H Nickisch arXiv preprint arXiv:1511.01870, 2015	126	2015
RLPy: a value-function-based reinforcement learning framework for education and research. A Geramifard, C Dann, RH Klein, W Dabney, JP How Journal of Machine Learning Research 16, 1573-1578, 2015	113*	2015
Being optimistic to be conservative: Quickly learning a cvar policy R Keramati, C Dann, A Tamkin, E Brunskill Proceedings of the AAAI Conference on Artificial Intelligence 34 (04), 4436-4443, 2020	92	2020
The human kernel AG Wilson, C Dann, C Lucas, EP Xing Advances in Neural Information Processing Systems, 2854-2862, 2015	84	2015
Guarantees for Epsilon-Greedy Reinforcement Learning with Function Approximation C Dann, Y Mansour, M Mohri, A Sekhari, K Sridharan International Conference on Machine Learning, 4666-4689, 2022	62	2022
A Model Selection Approach for Corruption Robust Reinforcement Learning CY Wei, C Dann, J Zimmert International Conference on Algorithmic Learning Theory, 2022	61	2022
Automated matching of pipeline corrosion features from in-line inspection data MR Dann, C Dann Reliability Engineering & System Safety 162, 40-50, 2017	54	2017
Regret Bound Balancing and Elimination for Model Selection in Bandits and RL A Pacchiano, C Dann, C Gentile, P Bartlett arXiv preprint arXiv:2012.13045, 2020	53	2020
A minimaximalist approach to reinforcement learning from human feedback G Swamy, C Dann, R Kidambi, ZS Wu, A Agarwal arXiv preprint arXiv:2401.04056, 2024	52	2024
A Provably Efficient Model-Free Posterior Sampling Method for Episodic Reinforcement Learning C Dann, M Mohri, T Zhang, J Zimmert Advances in Neural Information Processing Systems 34, 2021	51*	2021
Bayesian time-of-flight for realtime shape, illumination and albedo A Adam, C Dann, O Yair, S Mazor, S Nowozin IEEE transactions on pattern analysis and machine intelligence 39 (5), 851-864, 2017	47	2017
Dynamic balancing for model selection in bandits and rl A Cutkosky, C Dann, A Das, C Gentile, A Pacchiano, M Purohit International Conference on Machine Learning, 2276-2285, 2021	40	2021
Beyond value-function gaps: Improved instance-dependent regret bounds for episodic reinforcement learning C Dann, TV Marinov, M Mohri, J Zimmert Advances in Neural Information Processing Systems 34, 2021	38	2021
Distributionally-aware exploration for cvar bandits A Tamkin, R Keramati, C Dann, E Brunskill NeurIPS 2019 Workshop on Safety and Robustness on Decision Making, 2019	38	2019

Le système ne peut pas réaliser cette opération maintenant. Veuillez réessayer plus tard.

Articles 1–20

Nombre de citations par an

Citations en double

Citations fusionnées

Ajouter les coauteursCoauteurs

Suivre

Citée par

Coauteurs