David Silver
David Silver (* 1976) ist ein britischer Informatiker, bekannt als Leiter der Gruppe für Maschinenlernen im Bereich von Software für Spiele bei DeepMind, darunter AlphaGo, AlphaZero.
Silver studierte an der Universität Cambridge mit dem Abschluss 1997 und war dann Mitgründer, CTO und leitender Programmierer der Videospielfirma Elixir Studios. 2004 ging er an die University of Alberta, an der er 2008 bei Richard S. Sutton (und Martin Müller) promoviert wurde (Reinforcement Learning and Simulation-Based Search in Computer Go).[1] Das Thema seiner Dissertation war das Brettspiel Go. Er entwickelte damals (2009) auch Algorithmen für Go-Programme, die auf Meister-Niveau auf kleineren 9x9 Brettern (statt den üblichen 19x19 Brettern) spielen konnten (MoGo mit Sylvain Gelly). 2011 erhielt er eine Royal Society University Research Fellowship und wurde Lecturer und später Professor am University College London, ist dort aber auf unbestimmte Zeit beurlaubt (2021).
Er ist der leitende Programmierer bei DeepMind, einem Spiele-Software-Entwickler, dessen Programm (ein neuronales Netzwerk mit selbstbestätigendem Lernen, Deep Learning) die führenden menschlichen Spieler im Go besiegte. DeepMind wurde von Demis Hassabis, mit dem sich Silver in Cambridge befreundete, Mustafa Suleyman und Shane Legg gegründet und 2014 von Google für 400 Millionen Pfund übernommen. Silver war anfangs Berater bei DeepMind und ab 2013 fest angestellt.
Das um 2014 entwickelte AlphaGo[2] konnte erstmals professionelle menschliche Spieler ohne Vorgabe eines Handicaps besiegen, zuerst den europäischen Go-Spieler Fan Hui im Oktober 2015, dann im April 2016 mit Lee Sedol einen der besten Spieler (9 Dan). Es wurde zu AlphaGo Zero weiterentwickelt,[3] dass nicht von Spielen menschlicher Spieler lernte, sondern vollkommen selbstlernend war. Die Technik wurde in AlphaZero auf weitere Spiele erweitert (wie Schach, Shogi)[4] und in AlphaStar auf StarCraft II angewandt.[5] Er implementierte auch mit anderen eine Version von Q-Learning (Deep Q-Network) bei DeepMind,[6] einem Maschinenlernprogramm das seinen Input über hochdimensionale Sensordaten erhält. Das wurde auf Videospiele von Atari angewandt.[7]
2021 gelangen DeepMind auch Durchbrüche beim Proteinfaltungsproblem mit Hilfe von Maschinenlernen (AlphaFold).[8][9]
2019 erhielt er für Durchbrüche im Computerspiel-Bereich den ACM Prize in Computing. 2021 wurde er Fellow der Royal Society. Er erhielt die Silbermedaille der Royal Academy of Engineering und den Marvin Minsky Award. Er gehört zu den hochzitierten Wissenschaftlern in der Informatik. 2022 war er eingeladener Sprecher auf dem Internationalen Mathematikerkongress (Simulation based search).
Weblinks
Bearbeiten- Homepage
- Sam Sheads: David Silver: The unsung hero and intellectual powerhouse at Google DeepMind, Business Insider, 9. März 2016
Einzelnachweise
Bearbeiten- ↑ David Silver im Mathematics Genealogy Project (englisch)
- ↑ David Silver, Demis Hassabis u. a., Mastering the game of Go with deep neural networks and tree search, Nature, Band 529, 2016, S. 484–489
- ↑ David Silver, Demis Hassabis u. a., Mastering the game of Go without human knowledge, Nature, Band 550, 2017, S. 354–359
- ↑ D. Silver u. a., A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play, Science, Band 362, 2018, S. 1140–1144
- ↑ O. Vinyals, D. Silver u. a., Grandmaster level in StarCraft II using multi-agent reinforcement learning, Nature, Band 575, 2019, S. 350–354
- ↑ Volodymyr Mnih, David Silver, Andreas K. Fdjeland u. a.: Human-level control through deep reinforcement learning, Nature, Band 518, 2015, S. 529–533.
- ↑ V. Minh, D. Silver u. a., Playing Atari with deep reinforcement learning, Arxiv 2013
- ↑ John Jumper, D. Silver, Demis Hassabis u. a., Highly accurate protein structure prediction with AlphaFold, Nature, Band 596, 2021, S. 583–589
- ↑ A. W. Senior, D. Silver, D. Hassabis u. a., Improved protein structure prediction using potentials from deep learning, Nature, Band 577, 2020, S. 706–710
Personendaten | |
---|---|
NAME | Silver, David |
KURZBESCHREIBUNG | britischer Informatiker |
GEBURTSDATUM | 1976 |