Intelligence artificielle amicale
Une intelligence artificielle amicale (aussi appelé IA amicale ou IAA) est une intelligence artificielle hypothétique qui aurait un effet positif plutôt que négatif sur l'humanité. Ce concept fait partie de l'éthique de l'intelligence artificielle et est étroitement lié au problème de l'alignement et à l'éthique des machines. Alors que l'éthique des machines se préoccupe de la façon dont un agent artificiellement intelligent doit se comporter, la recherche de l'intelligence artificielle amicale est axée sur la façon de provoquer ce comportement et de s'assurer qu'il est suffisamment maîtrisé.
Étymologie et usage
Le terme a été inventé par Eliezer Yudkowsky[1] pour discuter des agents artificiels superintelligents qui mettent en œuvre de manière fiable les valeurs humaines. Le manuel d'intelligence artificielle de Stuart J. Russell et Peter Norvig, Artificial Intelligence: A Modern Approach, décrit l'idée[2]
Yudkowsky (2008) va dans les détails sur la façon de concevoir une IA amicale. Il affirme que la gentillesse (le désir de ne pas nuire aux humains) doit être conçue dès le début, mais que les concepteurs doivent reconnaître que cette conception peut être défectueuse, et que le robot va apprendre et évoluer avec le temps. Le défi est donc celui de la conception d'un mécanisme — définir un mécanisme pour l'évolution des systèmes d'IA qui resteront amicales face à de tels changements.
Dans ce contexte, l'expression « amicale » est utilisée comme terminologie technique et définit des agents sûrs et utiles, pas forcément « amicaux » au sens familier. Le concept est principalement utilisé dans le contexte des discussions sur cette technologie hypothétique qui aurait un impact important, rapide et difficile à contrôler sur la société humaine[3].
Risques de l'IA hostile
Les bases de l'inquiétude concernant l'intelligence artificielle sont très anciennes. Kevin LaGrandeur a montré que les dangers spécifiques de l'IA peuvent être observés dans la littérature ancienne concernant les humanoïdes artificiels tels que le golem, ou les proto-robots de Gerbert d'Aurillac et Roger Bacon. Dans ces histoires, l'intelligence extrême et la puissance de ces créations humanoïdes s'opposent à leur statut d'esclaves (qui, par nature, sont considérés comme sous-humains) et provoquent des conflits désastreux[4]. En 1942, ces thèmes incitent Isaac Asimov à créer les « Trois Lois de la Robotique » - des principes intégrés dans tous les robots de sa fiction, à savoir qu'ils ne peuvent pas se retourner vers leurs créateurs ou leur permettre de nuire[5].
Avec la perspective d'une IA forte qui se rapproche, le philosophe d'Oxford Nick Bostrom a dit que les systèmes d'IA avec des buts qui ne sont pas parfaitement identiques ou étroitement liés à l'éthique humaine sont intrinsèquement dangereux, à moins que des mesures extrêmes ne soient prises pour assurer la sécurité de l'humanité. Dans Superintelligence : Paths, Dangers, Strategies, il déclare :
Fondamentalement, nous devrions admettre qu'une « superintelligence » serait en mesure d'atteindre les objectifs, quels qu'ils soient. Par conséquent, il est extrêmement important que les objectifs que nous lui donnons, et tout son système de motivation, soit « amical pour l'Homme ».
Plus récemment, Eliezer Yudkowsky a appelé à la création d'« IA amicale » pour atténuer le risque de catastrophes provoquées par l'intelligence artificielle avancée. Il explique que : « L'IA ne vous déteste pas, elle ne vous aime pas, mais vous êtes faits d'atomes qu'elle peut utiliser pour autre chose. »[6]
Steve Omohundro affirme que tous les systèmes d'IA avancés, à moins qu'ils ne soient explicitement contrecarrés, présentent un certain nombre de pulsions/tendances/désirs de base[7] en raison de la nature intrinsèque des systèmes axés sur les objectifs sans précautions particulières, car l'IA agit d'une manière qui peut induire la désobéissance et des actions contraires à l'éthique.
Alexander Wissner-Gross affirme que les IA qui cherchent à maximiser leur liberté d'action peuvent être considérées comme amicales, si leur horizon de planification est plus long qu'un certain seuil, et peu amicales si leur horizon de planification est plus court que ce seuil[8] - [9].
Luke Muehlhauser, rédacteur en chef de la Machine Intelligence Research Institute, recommande que les chercheurs en éthique des machines adoptent ce que Bruce Schneier appelle la « mentalité de la sécurité » : plutôt que de penser comment un système fonctionnerait, imaginez comment il pourrait échouer[10].
Autres approches
Ben Goertzel, un chercheur en intelligence artificielle, estime que l'IA amicale ne peut pas être créée avec les connaissances humaines actuelles. Goertzel suggère que les humains peuvent plutôt décider de créer une « AI Nanny » avec des pouvoirs « légèrement surhumains d'intelligence et de surveillance » pour protéger la race humaine des risques de catastrophes, tels que la nanotechnologie et retarder le développement d'autres intelligences artificielles (hostiles) jusqu'à ce que des solutions de sécurité soient trouvées[11].
Politique publique
James Barrat, auteur de Our Final Invention, a suggéré qu'« un partenariat public-privé doit être créé afin de rassembler les responsables de recherche et développement dans le but de partager des idées concernant la sécurité—quelque chose comme l'International Atomic Energy Agency, mais en partenariat avec les entreprises». Il exhorte les chercheurs d'IA à convoquer une réunion similaire à la Conférence d'Asilomar sur l'ADN recombinant, qui a traité des risques de la biotechnologie[12].
Selon Gary Marcus, le montant annuel d'argent dépensé pour développer la morale des machines est très petit[13].
Voir aussi
- Alignement des intelligences artificielles
- Éthique de l'intelligence artificielle
- Explosion d'intelligence
- Machine Intelligence Research Institute
- OpenAI
- Philosophie de l'intelligence artificielle
- Singularitarianisme – une philosophie morale défendues par les partisans de l'IA amicale
- Singularité technologique
- Trois lois de la robotique
Références
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Friendly artificial intelligence » (voir la liste des auteurs).
- Max Tegmark, Our Mathematical Universe: My Quest for the Ultimate Nature of Reality, First edition., , 421 p. (ISBN 978-0-307-74425-8), « Life, Our Universe and Everything »
« Its owner may cede control to what Eliezer Yudkowsky terms a "Friendly AI,"... »
. - : Stuart Russell et Peter Norvig, Artificial Intelligence : A Modern Approach, Prentice Hall, , 1132 p. (ISBN 978-0-13-604259-4 et 0-13-604259-7).
- (en) Wendell Wallach et Colin Allen, Moral Machines : Teaching Robots Right from Wrong, Oxford, Oxford University Press, Inc., , 275 p. (ISBN 978-0-19-537404-9).
- Kevin LaGrandeur, « The Persistent Peril of the Artificial Slave », Science Fiction Studies (consulté le ).
- Isaac Asimov, The Rest of the Robots, Doubleday, (ISBN 0-385-09041-2), « Introduction ».
- Eliezer Yudkowsky (2008) in Artificial Intelligence as a Positive and Negative Factor in Global Risk.
- (en) Stephen M. Omohundro, « The Basic AI Drives », Proceedings of the First AGI Conference, Volume 171, Frontiers in Artificial Intelligence and Applications, edited by P. Wang, B. Goertzel, and S. Franklin, IOS Press,‎ (lire en ligne)
- 'How Skynet Might Emerge From Simple Physics, io9, Published 2013-04-26.
- A. D. Wissner-Gross, « Causal entropic forces », Physical Review Letters, vol. 110,‎ , p. 168702 (DOI 10.1103/PhysRevLett.110.168702, Bibcode 2013PhRvL.110p8702W, lire en ligne).
- Luke Muehlhauser, « AI Risk and the Security Mindset », sur Machine Intelligence Research Institute, (consulté le ).
- Goertzel, Ben.
- (en) Erica R. Hendry, Smithsonian.com, « What Happens When Artificial Intelligence Turns On Us? », Smithsonian.com,‎ (lire en ligne, consulté le )
- (en) Gary Marcus, « Moral Machines », The New Yorker,‎ (lire en ligne, consulté le )
Lectures complémentaires
- Yudkowsky, E. Artificial Intelligence as a Positive and Negative Factor in Global Risk. In Global Catastrophic Risks, Oxford University Press, 2008.
Discusses Artificial Intelligence from the perspective of Existential risk, introducing the term "Friendly AI". In particular, Sections 1-4 give background to the definition of Friendly AI in Section 5. Section 6 gives two classes of mistakes (technical and philosophical) which would both lead to the accidental creation of non-Friendly AIs. Sections 7-13 discuss further related issues. - Omohundro, S. 2008 The Basic AI Drives Appeared in AGI-08 - Proceedings of the First Conference on Artificial General Intelligence
Liens externes
- Ethical Issues in Advanced Artificial Intelligence par Nick Bostrom
- What is Friendly AI? — Une brève description de l'IA amicale par la Machine Intelligence Research Institute.
- Creating Friendly AI 1.0: The Analysis and Design of Benevolent Goal Architectures — Une description proche de la description du MIRI
- Critique of the MIRI Guidelines on Friendly AI — par Bill Hibbard
- Commentary on MIRI's Guidelines on Friendly AI — par Peter Voss.
- The Problem with ‘Friendly’ Artificial Intelligence — par Adam Keiper et Ari N. Schulman.