David Silver

David Silver, né en 1976, est un informaticien et entrepreneur britannique qui dirige le groupe de recherche sur l'apprentissage par renforcement chez DeepMind et a été chercheur principal pour AlphaGo, AlphaZero et co-responsable d'AlphaStar.

David Silver

Biographie
Formation	Université de Cambridge (jusqu'en 1997) Université de l'Alberta (doctorat) (jusqu'en 2009)
Activités	Informaticien, professeur d'université

Autres informations
A travaillé pour	DeepMind Technologies (depuis 2013) University College de Londres
Membre de	Royal Society (2021)
Sport	Go
Directeurs de thèse	Richard S. Sutton, Martin Müller (d)
Site web	www0.cs.ucl.ac.uk/staff/D.Silver/web/Home.html
Distinction	Prix ACM en informatique (2019)

Éducation

David Silver obtient un diplôme à l'Université de Cambridge en 1997 en remportant le prix Addison-Wesley, et fait la connaissance de Demis Hassabis à ce moment-là[1]. Il reprend les études en 2004 à l'Université d'Alberta avec un doctorat sur l'apprentissage par renforcement, durant lequel il conçoit les algorithmes utilisés par les premiers programmes de Go 9×9 au niveau master et obtient son diplôme en 2009[2] - [3]. Sa version du programme MoGo, co-écrit avec Sylvain Gelly, est l'un des programmes Go les plus performants depuis 2009[4].

Carrière

Après avoir obtenu son diplôme universitaire, David Silver participe à la création de la société de jeux vidéo Elixir Studios, où il est CTO et programmeur principal, lui valant plusieurs prix pour la technologie et l'innovation[1] - [5].

David Silver reçoit une bourse de recherche universitaire de la Royal Society en 2011, puis devient professeur à l'University College de Londres[6]. Ses conférences sur l'apprentissage par renforcement sont disponibles sur YouTube[7]. Il est consultant pour DeepMind depuis sa création, rejoignant à plein temps l'entreprise en 2013.

Son travail récent est axé sur la combinaison de l'apprentissage par renforcement avec l'apprentissage profond, par exemple avec un programme qui apprend à jouer à des jeux Atari directement à partir de pixels[8]. Silver mène le projet AlphaGo, dont un des succès initiaux a été de battre un des meilleurs joueurs professionnels dans le jeu de Go à taille réelle[9]. Par la suite, AlphaGo reçoit la certification professionnelle honoraire 9 Dan et remporte le prix Cannes Lion pour l'innovation[10]. Il dirige ensuite le développement d'AlphaZero, utilisant la même intelligence artificielle pour apprendre à jouer Go sans exemple humain, avant d'apprendre à jouer aux échecs et au shōgi de la même manière, surpassant tous les autres programmes informatiques.

David Silver est l'un des employés de DeepMind les plus publiés, avec plus de 110 000 citations et un indice h de 74[11].

Il reçoit le prix ACM en informatique pour ses contributions dans la résolution informatique de jeux vidéo[12].

En 2021, il est élu membre de la Royal Society pour ses contributions aux Deep Q-Networks et AlphaGo[13].

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « David Silver (computer scientist) » (voir la liste des auteurs).

(en) Sam Shead, « David Silver: The unsung hero and intellectual powerhouse at Google DeepMind », Business Insider (consulté le 26 septembre 2020)
(en) David Silver, « Reinforcement Learning and Simulation-Based Search in Computer Go », ERA,‎ 2009 (DOI 10.7939/R39D8T, lire en ligne)
(en) Sylvain Gelly et David Silver, « Achieving Master Level Play in 9 × 9 Computer Go », Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence,‎ 2008 (lire en ligne)
(en) Stuart J. Russell et Peter Norvig, Artificial Intelligence: A Modern Approach, Prentice Hall, 2009, 3^e éd.
(en) « What the AI Behind AlphaGo Can Teach Us About Being Human », sur Wired.com (consulté le 17 mai 2016)
(en-US) « CSML | David Silver », www.csml.ucl.ac.uk (consulté le 27 mai 2017)
(en) « RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning », 13 mai 2015
(en) Volodymyr Mnih, Koray Kavukcuoglu, David Silver et Andrei A. Rusu, « Human-level control through deep reinforcement learning », Nature, vol. 518, n^o 7540,‎ 26 février 2015, p. 529–533 (ISSN 0028-0836, PMID 25719670, DOI 10.1038/nature14236, Bibcode 2015Natur.518..529M, S2CID 205242740)
(en) David Silver, Aja Huang, Chris J. Maddison et Guez, « Mastering the game of Go with deep neural networks and tree search », Nature, vol. 529, n^o 7587,‎ 28 janvier 2016, p. 484–489 (ISSN 0028-0836, PMID 26819042, DOI 10.1038/nature16961, Bibcode 2016Natur.529..484S, S2CID 515925)
(en) « Google DeepMind AlphaGo in U.K. Wins Innovation Grand Prix » (consulté le 27 mai 2017)
(en) « David Silver – Google Scholar Citations », sur scholar.google.com (consulté le 1^er février 2022)
(en) Jim Ormond, « ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing », acm.org (consulté le 2 avril 2020)
(en) « Royal Society elects outstanding new Fellows and Foreign Members », royalsociety.org (consulté le 8 juin 2021)

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.