Accueil🇫🇷Chercher

Paradoxe de Newcomb

Le paradoxe de Newcomb est une expérience de pensée faisant intervenir un jeu entre deux joueurs, l'un d'entre eux étant supposé capable de prédire l'avenir. Elle tire son nom de William Newcomb, du Laboratoire national de Lawrence Livermore de l'Université de Californie. Toutefois, cette expérience et le paradoxe qui en découle ont été analysés pour la première fois dans un article publié par le philosophe Robert Nozick en 1969, et sont apparus dans un article de Martin Gardner dans Pour la Science en 1974.

Le problème du paradoxe de Newcomb est très débattu dans la branche philosophique de la théorie de la décision ainsi que lors de discussions sur la causalité et la temporalité[1]. Pour Jean-Pierre Dupuy en effet, cette expérience de pensée, qui « met en scène l’action d’un agent libre dans un univers déterministe », « défie nos intuitions sur [...] la liberté et le déterminisme d’une façon rarement atteinte ailleurs » et « nous plonge dans des abîmes de réflexion sur le problème le plus difficile qui soit, celui du Temps. »[2]

Le problème

Voici un des énoncés possibles du paradoxe de Newcomb :

Un joueur joue une partie avec le devin. Ce devin est une entité qui pour une raison ou une autre est présentée comme étant exceptionnellement douée pour prévoir les actions d'une personne. La nature exacte de ce devin varie suivant les versions du paradoxe : il est soit omniscient, ses prédictions étant certaines (à l'image d'une divinité ou du démon de Laplace), soit quasi-omniscient comme dans le cas de la version de Nozick, qui déclare que les prédictions du devin sont « presque certainement » correctes, et également que « l'explication de la prédiction qu'il a faite ne se fonde pas sur la connaissance de ce que vous décidez de faire ». Cette version originale du problème élimine certaines explications du paradoxe.

PrédictionChoixGain du joueur
A et BA et B1 000 €
A et BA uniquement0 €
A uniquementA et B1 001 000 €
A uniquementA uniquement1 000 000 €

Deux boîtes A et B sont présentées au joueur. Ce dernier a le choix entre prendre le contenu de la boîte A et prendre le contenu des boîtes A et B. Au préalable, le devin a rempli les boîtes ainsi :

  • la boĂ®te B contient toujours 1 000 â‚¬ ;
  • le contenu de la boĂ®te A est dĂ©terminĂ© ainsi : si le devin a prĂ©dit que le joueur prendrait seulement la boĂ®te A, elle contient 1 000 000 â‚¬, mais elle ne contient rien si le devin a prĂ©dit que le joueur prendrait les deux boĂ®tes.

Le joueur garde après le jeu le contenu des boîtes qu'il a ouvertes.

Au moment oĂą le jeu commence et oĂą le joueur est appelĂ© Ă  dĂ©cider de ce qu'il va prendre, la prĂ©diction a dĂ©jĂ  Ă©tĂ© faite, et le contenu de la boĂ®te A est dĂ©terminĂ©. En d'autres termes, la boĂ®te A contient soit 0 soit 1 000 000 â‚¬ avant que le match commence, et une fois le jeu commencĂ©, mĂŞme le devin est impuissant Ă  modifier le contenu des boĂ®tes.

Avant que le jeu ne commence, le joueur est au courant de toutes les règles du jeu, y compris des deux contenus possibles de la boîte A, du fait que son contenu est fondé sur la prédiction du devin, et que le devin est (quasi)infaillible. La seule information inconnue du joueur est la prédiction du devin et donc le contenu de la boîte A.

Le paradoxe

Le paradoxe vient de ce que deux raisonnements apparemment logiques conduisent à des résultats contradictoires.

La première stratégie, inspirée de la théorie des jeux et dite de la dominance stratégique, consiste à remarquer que quelle qu'ait été la prédiction du devin, choisir de prendre les deux boîtes rapporterait plus d'argent.

  • Si la prĂ©diction a Ă©tĂ© que le joueur ne prendra que A, alors prendre les deux boĂ®tes rapporte 1 001 000 â‚¬, alors que ne prendre que A ne rapporte que 1 000 000 â‚¬.
  • Si la prĂ©diction a Ă©tĂ© que le joueur prendra les deux boĂ®tes A et B, alors prendre les deux boĂ®tes rapporte 1 000 â‚¬, et prendre juste A rapporte €.

Dans tous les cas, dĂ©cider de prendre les deux boĂ®tes rapporte toujours 1 000 â‚¬ de plus. Cette explication se fonde sur le fait que la prĂ©diction du devin a Ă©tĂ© faite hier (au passĂ©), et que par consĂ©quent le contenu des boĂ®tes est dĂ©jĂ  fixĂ© : ma dĂ©cision prĂ©sente ne pourrait donc pas influencer le contenu des boĂ®tes, qui a Ă©tĂ© fixĂ© hier. S'il a prĂ©dit hier que je n'allais prendre qu'une seule boĂ®te, le fait que je dĂ©cide aujourd'hui de prendre les deux boĂ®tes n'empĂŞchera pas qu'il y ait bien le million d'euros dans la boĂ®te A. S'il a prĂ©dit le contraire, ma dĂ©cision prĂ©sente n'influencera pas non plus l'Ă©tat des choses actuel, et je fais donc mieux de prendre les deux boĂ®tes (auquel cas j'aurai 1 000 â‚¬).

La seconde stratĂ©gie part de l'hypothèse que le devin a une capacitĂ© de prĂ©diction supĂ©rieure au hasard (et que le devin agit conformĂ©ment Ă  sa prĂ©diction). De ce fait, si l'on Ă©carte les cas oĂą sa prĂ©diction est fausse, c'est-Ă -dire les possibilitĂ©s qui rapportent € et 1 001 000 â‚¬, le choix rĂ©el est entre gagner 1 000 â‚¬ (en prenant les deux boĂ®tes) ou 1 000 000 â‚¬ (en ne prenant que A). Donc ne prendre que la boĂ®te A est un meilleur choix si le devin ne se trompe jamais. Plus gĂ©nĂ©ralement, si le devin ne se trompe que dans une proportion p de cas :

  • si je choisis les deux boĂ®tes, je gagne en moyenne p Ă— 1 001 000 â‚¬ + (1-p) Ă— 1 000 â‚¬ = 1 000 â‚¬ + p Ă— 1 000 000 â‚¬ ;
  • si je choisis la boĂ®te A, je gagne en moyenne (1-p) Ă— 1 000 000 â‚¬ + p Ă— €.

La différence entre les deux stratégies est nulle quand p = 0,4995, il suffit donc que le devin ait une capacité de prédiction à peine meilleure que le hasard (ici, d'un millième parce que la différence entre les montants est d'un facteur mille) pour qu'il soit statistiquement plus payant de lui faire confiance[3].

Dans son article de 1969, Robert Nozick note que « Pour presque tout le monde, le choix à faire est parfaitement clair et évident. Le problème est que les gens semblent se répartir à peu près à parts égales en deux groupes, chaque groupe faisant un choix différent, le consensus se limitant à penser que l'autre groupe fait preuve d'un rare aveuglement[4]. »

Commentaires

Une première remarque est que le paradoxe est lié à un conflit dans les modèles de prise de décision envisageables[5]. Si l'on suit l'hypothèse de maximisation de l'espérance du profit, cette espérance est maximale lorsqu'on ne prend que la boîte A. En revanche, avec l'approche de la dominance stratégique, le bénéfice est maximal lorsqu'on choisit de prendre les deux boîtes.

Le paradoxe repose d'abord sur la distinction entre la connaissance (la prédiction du devin) et l'acte ou la décision d'agir, couplée avec celle de la question de la temporalité : pour le joueur rationnel « maximaliste », la prédiction du devin, faite hier, ne peut influencer le contenu des boîtes aujourd'hui, et j'ai donc tout intérêt, quelle qu'ait été sa prédiction, à prendre les deux. Au contraire, pour l'autre joueur, tout aussi rationnel, qui décide de ne prendre que la boîte A, ce choix se fonde sur le caractère quasi-infaillible de la prédiction du devin : en d'autres termes, le contenu des boîtes est à la fois fonction de mon acte présent et de la prédiction passée (hier) du devin.

Ce paradoxe soulève ainsi le problème d'une logique de causalité inversée ou rétroaction, c'est-à-dire d'une causalité disjointe du sens ordinaire de la temporalité (les "causes précèdent les effets"). Le contenu présent de la boîte dépend de la prédiction passée du devin qui dépend elle-même de mon choix présent. A première vue, cela implique que mon choix présent ait pu influencer ("soit la cause") de la prédiction faite hier du devin. Une telle causalité inversée n'est toutefois pas nécessaire : pour qu'il existe une corrélation entre le choix du joueur et le contenu de la boite, il suffit qu'une variable cachée ou un inconscient, que le devin peut lire mais pas le joueur, influence le comportement du joueur. Et le joueur sera dans l'incapacité de distinguer entre ce cas et la causalité inversée.

Pour certains, le problème soulèverait un autre aspect paradoxal, en étant supposé contradictoire avec la notion de libre arbitre : si le devin a pu prédire ce que j'allais faire, c'est que mes actes seraient (en principe) prédéterminés. En même temps, le problème suppose un libre arbitre, sinon le joueur n'a pas réellement la possibilité de faire un choix. C'est l'analyse qu'en fait Jeffrey (The logic of decision) : la dominance n’est pertinente que s’il n'y a pas de corrélation entre le choix effectué et les états du système. Mais d’après l’énoncé du problème, il y a justement une telle dépendance.

En fait, ce paradoxe n'est qu'apparent, ou du moins repose sur certaines conceptions métaphysiques : la théologie chrétienne, par exemple, a parfaitement pu concevoir un Dieu omniscient, pouvant prédire nos actes, sans leur ôter pour autant toute liberté (c'est le problème de la grâce et de la liberté). La question de la causalité inverse est d'ailleurs abordée par le jésuite Luis Molina ou dans le cadre des théories sur la prière rogatoire rétrospective[1].

Des commentateurs philosophes ont proposé de nombreuses solutions, dont certaines éliminent le paradoxe apparent.

Il est possible de simuler un devin similaire à celui qui est décrit, en utilisant une drogue qui bloque la capacité mémorielle, comme le Midazolam. Sous l'influence d'une telle drogue, les sujets sont incapables de fixer de nouveaux souvenirs, il serait donc possible de soumettre un sujet au même problème un grand nombre de fois, ce qui serait suffisant pour prédire statistiquement le comportement d'une majorité de sujets (mais à vrai dire, la réponse du sujet sous drogue risque de ne pas être la même que celle du sujet non drogué). Ceci étant, cette technique ne permettrait pas de prédire le choix des sujets qui se fondent sur le hasard pour établir leur choix.

La rationalité du choix dépend aussi de ce que l'on pense du devin. Si on accepte l'affirmation que le devin se trompe rarement, et si l'on accepte que les sommes d'argent ont été effectivement disposées comme indiqué, alors le choix rationnel est celui de la seule boîte A. En revanche, si l'on nie la possibilité d'une quelconque prédiction (ce qui paraît rationnel), le choix rationnel consiste à ouvrir les deux boîtes. Mais en même temps, le fait d'agir rationnellement conduit, justement, à avoir un comportement prédictible, ce qui peut finalement justifier la performance du devin : être rationnel, dans ce cas, n'est pas nécessairement rationnel... Il s'agit ainsi également d'un paradoxe à l'égard de la théorie du choix rationnel.

Notes et références

Références

  1. Sacha Bourgeois-Gironde, Temps et causalité, PUF, 2002, 127 p., (ISBN 9782130524373)
  2. Jean-Pierre Dupuy, "Le temps, le paradoxe", in Déterminismes et complexités : du physique à l'éthique, autour d'Henri Atlan, Editions La Découverte, Paris, 2008, pp. 321-334.
  3. Cette discussion suppose pour simplifier que le taux d'erreur est le même quelle que soit la prédiction du devin. Ce n'est pas nécessairement le cas, mais une modélisation plus fine ne change pas qualitativement le résultat.
  4. Pour la petite histoire, les deux auteurs ont des approches différentes : Newcomb recommande de ne prendre qu'une boîte, alors que Nozick recommande de prendre les deux.
  5. C'est l'analyse qu'en fait Nozick dans sa publication de 1969.

Bibliographie

  • R. Nozick (1969), “Newcomb’s problem and two principles of choice”, in Essays in Honor of Carl G. Hempel, 1969.
  • D. Lewis (1981), “Causal Decision Theory”, Australiasan Journal of Philosophy, 1981.
  • Jeffrey, Richard C. (1983), The Logic of Decision, 1983.
  • Martin Gardner (1986), Knotted Doughnuts and Other Mathematical Entertainments, Freeman and Company, 1986.

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.