David Silver
David Silver, né en 1976, est un informaticien et entrepreneur britannique qui dirige le groupe de recherche sur l'apprentissage par renforcement chez DeepMind et a été chercheur principal pour AlphaGo, AlphaZero et co-responsable d'AlphaStar.
Formation |
Université de Cambridge (jusqu'en ) Université de l'Alberta (doctorat) (jusqu'en ) |
---|---|
Activités |
A travaillé pour | |
---|---|
Membre de | |
Sport | |
Directeurs de thèse |
Richard S. Sutton, Martin Müller (d) |
Site web | |
Distinction |
Éducation
David Silver obtient un diplôme à l'Université de Cambridge en 1997 en remportant le prix Addison-Wesley, et fait la connaissance de Demis Hassabis à ce moment-là[1]. Il reprend les études en 2004 à l'Université d'Alberta avec un doctorat sur l'apprentissage par renforcement, durant lequel il conçoit les algorithmes utilisés par les premiers programmes de Go 9×9 au niveau master et obtient son diplôme en 2009[2] - [3]. Sa version du programme MoGo, co-écrit avec Sylvain Gelly, est l'un des programmes Go les plus performants depuis 2009[4].
Carrière
Après avoir obtenu son diplôme universitaire, David Silver participe à la création de la société de jeux vidéo Elixir Studios, où il est CTO et programmeur principal, lui valant plusieurs prix pour la technologie et l'innovation[1] - [5].
David Silver reçoit une bourse de recherche universitaire de la Royal Society en 2011, puis devient professeur à l'University College de Londres[6]. Ses conférences sur l'apprentissage par renforcement sont disponibles sur YouTube[7]. Il est consultant pour DeepMind depuis sa création, rejoignant à plein temps l'entreprise en 2013.
Son travail récent est axé sur la combinaison de l'apprentissage par renforcement avec l'apprentissage profond, par exemple avec un programme qui apprend à jouer à des jeux Atari directement à partir de pixels[8]. Silver mène le projet AlphaGo, dont un des succès initiaux a été de battre un des meilleurs joueurs professionnels dans le jeu de Go à taille réelle[9]. Par la suite, AlphaGo reçoit la certification professionnelle honoraire 9 Dan et remporte le prix Cannes Lion pour l'innovation[10]. Il dirige ensuite le développement d'AlphaZero, utilisant la même intelligence artificielle pour apprendre à jouer Go sans exemple humain, avant d'apprendre à jouer aux échecs et au shōgi de la même manière, surpassant tous les autres programmes informatiques.
David Silver est l'un des employés de DeepMind les plus publiés, avec plus de 110 000 citations et un indice h de 74[11].
Il reçoit le prix ACM en informatique pour ses contributions dans la résolution informatique de jeux vidéo[12].
En 2021, il est élu membre de la Royal Society pour ses contributions aux Deep Q-Networks et AlphaGo[13].
Références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « David Silver (computer scientist) » (voir la liste des auteurs).
- (en) Sam Shead, « David Silver: The unsung hero and intellectual powerhouse at Google DeepMind », Business Insider (consulté le )
- (en) David Silver, « Reinforcement Learning and Simulation-Based Search in Computer Go », ERA, (DOI 10.7939/R39D8T, lire en ligne)
- (en) Sylvain Gelly et David Silver, « Achieving Master Level Play in 9 × 9 Computer Go », Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence, (lire en ligne)
- (en) Stuart J. Russell et Peter Norvig, Artificial Intelligence: A Modern Approach, Prentice Hall, , 3e éd.
- (en) « What the AI Behind AlphaGo Can Teach Us About Being Human », sur Wired.com (consulté le )
- (en-US) « CSML | David Silver », www.csml.ucl.ac.uk (consulté le )
- (en) « RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning »,
- (en) Volodymyr Mnih, Koray Kavukcuoglu, David Silver et Andrei A. Rusu, « Human-level control through deep reinforcement learning », Nature, vol. 518, no 7540, , p. 529–533 (ISSN 0028-0836, PMID 25719670, DOI 10.1038/nature14236, Bibcode 2015Natur.518..529M, S2CID 205242740)
- (en) David Silver, Aja Huang, Chris J. Maddison et Guez, « Mastering the game of Go with deep neural networks and tree search », Nature, vol. 529, no 7587, , p. 484–489 (ISSN 0028-0836, PMID 26819042, DOI 10.1038/nature16961, Bibcode 2016Natur.529..484S, S2CID 515925)
- (en) « Google DeepMind AlphaGo in U.K. Wins Innovation Grand Prix » (consulté le )
- (en) « David Silver – Google Scholar Citations », sur scholar.google.com (consulté le )
- (en) Jim Ormond, « ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing », acm.org (consulté le )
- (en) « Royal Society elects outstanding new Fellows and Foreign Members », royalsociety.org (consulté le )