Théorie des jeux en relations internationales
Les relations « entre nations » ont depuis longtemps Ă©tĂ© un objet d'Ă©tude, mais les relations internationales, en tant que discipline scientifique, sont nĂ©es aprĂšs la PremiĂšre Guerre mondiale. Le terme international se rĂ©fĂšre, dâaprĂšs Bentham[1] et Hegel[2], aux Ătats. Les courants de philosophie politique considĂšrent que les relations dâun Ătat Ă lâextĂ©rieur de son territoire, relations « entre nations » ou internationales, se dĂ©roulent dans lâanarchie. Pour Hegel, « les conflits entre Ătats, lorsque les volontĂ©s particuliĂšres ne trouvent pas de terrain d'entente, ne peuvent ĂȘtre rĂ©glĂ©s que par la guerre ». Selon Carl Schmitt (1922, 1933, 1938), l'autonomie Ă©tatique repose sur la possibilitĂ© de l'Ătat de s'autoconserver, en dehors mĂȘme de la norme juridique, par une action qui prouvera cette souverainetĂ©. Le propos des thĂ©ories internationales a Ă©tĂ©, de tout temps, dâĂ©tudier celles-ci sous diffĂ©rents angles, le rĂ©alisme, le libĂ©ralisme et le constructivisme Ă©tant les principaux, dans le but dâexpliquer, dâĂ©clairer ou mĂȘme d'influer sur les politiques internationales pour trouver dâautres solutions que la guerre.
De façon quasi concomitante au dĂ©veloppement de cette discipline est apparue la thĂ©orie des jeux, conçue par des mathĂ©maticiens (John von Neumann, John Forbes Nash, John Harsanyi et Reinhard Selten parmi les pionniers) et se proposant dâexpliquer Ă lâaide dâoutils analytiques les interactions stratĂ©giques entre acteurs.
Son essor depuis les annĂ©es 50, dans un contexte de guerre froide marquĂ© par le jeu des puissances Ă©tatiques amĂ©ricaine et russe principalement, ne pouvait que naturellement conduire les thĂ©oriciens des Relations internationales[3] Ă sâintĂ©resser de plus prĂšs Ă cet ensemble dâoutils. DĂ©jĂ le gĂ©nĂ©ral prussien Carl von Clausewitz dans son traitĂ© De la Guerre (Vom Krieg, 1832) considĂ©rait la guerre comme la continuation de la politique par dâautres moyens, autrement dit : une arme de nĂ©gociation parmi dâautres. Ne parle-t-on pas de jeu des relations internationales ? « Le jeu Ă©tant alors une interaction stratĂ©gique entre deux Ătats, le choix de lâun influençant la situation de lâautre » (Eber 2004).
DĂ©finitions
Théorie des jeux
- « La thĂ©orie des jeux est un ensemble dâoutils analytiques qui ont Ă©tĂ© dĂ©veloppĂ©s pour faciliter la comprĂ©hension des situations dâinteraction entre des dĂ©cideurs (agents, joueurs) rationnels »[4].
Les hypothÚses de base de cette théorie sont :
- la rationalité des décideurs qui poursuivent des objectifs exogÚnes et indépendants,
- « leur prise en compte de la connaissance quâils ont ou des anticipations quâils font du comportement des autres acteurs »[4].
Relations internationales : définitions
La dĂ©finition des relations internationales[3] en tant qu'objet dâĂ©tude comporte le difficile problĂšme de la dĂ©finition de lâadjectif « international ». Cet adjectif dĂ©rivĂ© de nation porte en lui un sens qui semble implicite Ă savoir quâil se rapporte aux relations « entre nations », entre Ătats. En rĂ©alitĂ© il convient de prĂ©ciser les acteurs et le pĂ©rimĂštre des relations pour en comprendre le sens actuel. Dâune dĂ©finition stato-centrĂ©e (i.e. basĂ©e exclusivement sur les relations entre Ătats), le concept a Ă©voluĂ© vers une dĂ©finition plus large avec notamment lâimplication dâorganisations non Ă©tatiques (type ONG) ([Battistella] D., 2004).
Relations entre Ătats
Lâadjectif « international », introduit par le philosophe Jeremy Bentham en 1801, serait liĂ© originellement aux transactions transfrontaliĂšres et aux rĂšgles qui les rĂ©gulent, soit le « droit des gens ». Poussant plus avant sa dĂ©finition, il lâĂ©largit Ă la notion de transactions mutuelles entre Ătats souverains. Le terme de Bentham est Ă©quivalent Ă interĂ©tatique ou intergouvernemental et suppose une personnification de lâĂtat-nation.
- Personnification des Ătats (Hegel) :
Personnification quâon retrouve dans lâĆuvre de Hegel oĂč les Ătats sont considĂ©rĂ©s comme les acteurs principaux des relations entre nations, Ă©tant les seuls Ă pouvoir prendre la dĂ©cision ultime de la guerre.
- LâhostilitĂ© au centre des relations internationales (Schmitt) :
Selon Carl Schmitt, lâhostilitĂ© est le concept central des relations internationales, car ces derniĂšres sont caractĂ©risĂ©es par lâhostilitĂ© entre les Ătats. Schmitt fut le premier thĂ©oricien de la guerre froide, non parce quâil fut le premier Ă analyser le conflit Est/Ouest, mais parce quâil fut le premier Ă souligner que la situation de paix-guerre - oĂč lâhostilitĂ© prime - nâapparaĂźt pas quâau lendemain ou dans la foulĂ©e du second conflit mondial avec lâantagonisme amĂ©ricano-soviĂ©tique. Son approche se place sous les auspices de la pensĂ©e clausewitzienne. LâhostilitĂ© est le prĂ©supposĂ© de la guerre et lâennemi est le concept premier par rapport Ă la guerre. Ces relations internationales structurĂ©es par la relation ami-ennemi sont dâabord des relations entre Ătats, mais en mĂȘme temps lâĂtat, sâil est lâunique sujet du droit international, nâest pas lâunique acteur de la politique internationale.
- DĂ©finition des relations internationales retenue dans le cadre de ce sujet (Hull) :
« Le point de dĂ©part des relations internationales est lâexistence dâĂtats, ou de communautĂ©s politiques indĂ©pendantes, avec Ă leur tĂȘte un gouvernement revendiquant la souverainetĂ© sur une portion particuliĂšre de la surface terrestre »[5].
Autres contributions aux fondements de la théorie des relations internationales
Parmi les autres personnalitĂ©s qui ont contribuĂ© Ă Ă©tablir les fondements dâune thĂ©orie des relations internationales, il faut Ă©galement mentionner Carl von Clausewitz et Henry Kissinger.
Carl von Clausewitz : « la guerre, continuation de la politique par dâautres moyens »
Dans son ouvrage De la Guerre (1832), ce dernier a apportĂ© une contribution nodale Ă lâexplication de la stratĂ©gie militaire en expliquant que toutes les dĂ©cisions prises sur un champ de bataille sont caractĂ©risĂ©es par lâincertitude. Lâissue de toute guerre est imprĂ©visible, car aucune planification rationnelle des opĂ©rations militaires ne peut prĂ©voir tous les obstacles qui sont susceptibles dâentraver ou de faire Ă©chouer le dĂ©roulement de ces opĂ©rations. Lâinfluence de lâĆuvre de Carl von Clausewitz ne tient pas uniquement au fait quâil a conceptualisĂ© la notion dâincertitude qui deviendra, au XXe siĂšcle, un des Ă©lĂ©ments centraux de la thĂ©orie rĂ©aliste de lâacteur rationnel. Il a Ă©galement montrĂ© que la guerre est la continuation de la politique par dâautres moyens et que son issue repose, non seulement sur les capacitĂ©s militaires dâun Ătat, mais sur ses ressources sociales et Ă©conomiques.
Henry Kissinger et les conditions dâĂ©tablissement dâune alliance stratĂ©gique
Une question cruciale, qui a donnĂ© lieu Ă de nombreux dĂ©bats, est lâinterrogation sur les conditions dâĂ©tablissement dâune alliance stratĂ©gique. Selon Henry Kissinger, les alliances stratĂ©giques rĂ©sultent essentiellement de la volontĂ© des Ătats, mais elles ne peuvent exister quâentre Ătats dont les systĂšmes Ă©conomiques, politiques et idĂ©ologiques sont similaires, convergents ou compatibles. Durant la pĂ©riode la plus dure de la guerre froide (1947-1956/60), Henry Kissinger soutient quâaucune alliance nâest envisageable entre les Ătats-Unis et lâUnion soviĂ©tique en raison du caractĂšre antagonique de leurs systĂšmes Ă©conomiques et politico-idĂ©ologiques. La dissuasion nuclĂ©aire ou lâĂ©quilibre de la terreur lui apparaĂźt, ainsi quâĂ un trĂšs grand nombre dâautres rĂ©alistes, dont Raymond Aron, la seule alternative susceptible de maintenir la paix entre les deux superpuissances Ă lâĂ©chelle mondiale.
Raymond Aron et sa lecture multipolaire ou bipolaire des relations interétatiques
Raymond Aron (1962) propose une lecture de ces relations interétatiques sous deux angles (Devin, 2002) :
- Angle multipolaire constitué de plusieurs « unités politiques » comparables par leur taille et leur puissance économique et militaire. à titre d'exemple, le CongrÚs de Vienne (1815) dans lequel Autriche, France, Grande-Bretagne, Prusse et Russie se partagent équitablement les forces.
- Angle bipolaire constituĂ© de deux coalitions antagonistes dans lesquelles se rangent la plupart des « unitĂ©s politiques », elles-mĂȘmes organisĂ©es autour de deux acteurs politiques principaux. L'exemple Ă©vident est la Guerre froide avec le bloc russe et le bloc amĂ©ricain.
- Il envisage Ă©galement un angle unipolaire : aprĂšs lâĂ©clatement de lâURSS dans les annĂ©es 1990, le systĂšme international nâĂ©tait ni bipolaire ni multipolaire mais dominĂ© par les Ătats-Unis et donc unipolaire, bien que « transitoire » (Interlude de Layne, 1993) dâun point de vue rĂ©aliste (Devin, 2002).
Des relations internationales au-delĂ des Ătats (ONG etc.)
Relations au-delĂ de lâespace contrĂŽlĂ© par les Ătats pris individuellement quel que soit lâacteur (Ă©tatique ou non) considĂ©rĂ© au sens actuel.
Typologie des relations internationales
Les Ătats souverains adhĂšrent librement et volontairement Ă des ententes et Ă des rĂšgles qui maintiennent la dynamique des conflits interĂ©tatiques dans un cadre pacifique. Toutefois, lâinstauration dâune paix perpĂ©tuelle est inimaginable en raison de la souverainetĂ©, des ambitions, des inĂ©galitĂ©s et de la mĂ©fiance mutuelle des Ătats qui les placent dans un dilemme de sĂ©curitĂ©.
On peut distinguer deux principaux types de Relations internationales :
- l'interaction : c'est une relation telle que la modification du comportement de lâun agit sur lâautre. Il s'agit d'une relation typiquement de sĂ©curitĂ© : adoption dâune mesure de dĂ©fense par un Ătat, perçue par un autre comme une aggravation de la menace qui provoque en retour une contre-mesure et alimente un processus dâescalade (course Ă lâarmement).
- l'interdĂ©pendance : relation dans laquelle les acteurs opĂšrent des choix qui individuellement sont marginaux mais cumulĂ©s sont de nature Ă modifier lâensemble des relations (flux du commerce international). Aux effets de compĂ©tition dâune relation d'interaction se substituent des effets dâagrĂ©gation dâune relation dâinterdĂ©pendance.
Structure des relations internationales
Les relations internationales ont une structure de jeu au sens oĂč elles impliquent une valeur des gains (quantifiable ou non) associĂ©s Ă une action, une communication entre les deux parties et des stratĂ©gies mises en Ćuvre pour rĂ©aliser cette action.
Que faut-il pour pouvoir parler de relations internationales ?
- horizontales réguliÚres et délimitées politiquement les unes par rapport aux autres
- anarchie (absence dâautoritĂ© supĂ©rieure aux Ătats)
Ă noter des relations le plus souvent instables
Anatol Rapoport (1962) propose de distinguer trois modes de conflits : le combat, les jeux de stratégie et le débat[6].
Trois modes de conflits (Rapoport)
1. Le combat
- motivé par une animosité mutuelle
- dans lequel, lâadversaire reprĂ©sente « juste » un stimulus nocif
- caractĂ©ristique dâun « monde sous humain » (« sub-human world »), au sens d'Anatol Rapoport[7] mais aussi ceux au sein de lâespĂšce humaine.
La principale nuance pour les conflits humains est quâils sont souvent dĂ©terminĂ©s par des hypothĂšses auto-prĂ©dictives (suspicion, prĂ©jugĂ©s, etc.) « orientant » les comportements des parties en prĂ©sence.
En idĂ©alisant les combats Ă lâaide dâune description mathĂ©matique (Ă©quations diffĂ©rentielles), il est possible de les dĂ©crire comme des systĂšmes avec des boucles de feedback positives ou nĂ©gatives traduisant la stabilitĂ© ou lâinstabilitĂ© du systĂšme. L. F. Richardson a le premier rĂ©ussi Ă dĂ©crire la dynamique de la course aux armements de cette façon. Des biologistes lâont Ă©galement fait pour dĂ©crire les compĂ©titions entre espĂšces. Ces combats sont plus ou moins prĂ©cĂ©dĂ©s par un enchaĂźnement dâĂ©vĂ©nements (physiques ou symboliques) et, non comme dans les jeux de stratĂ©gie, par un choix rationnel.
2. Les jeux de stratégie
- motivés par un choix rationnel
- sans appartenance au monde sous-humain d'Anatol Rapoport
- dans lequel chaque joueur prĂ©voit les issues possibles rĂ©sultant des choix dâaction pris par son adversaire et lui-mĂȘme. Il suppose la rationalitĂ© de son adversaire Ă©gale Ă la sienne.
Exemples ;
- Les Ă©checs, forme « idĂ©ale » de conflit humain oĂč rĂ©flexion et imagination se substituent Ă la force physique. La seule blessure possible pourrait ĂȘtre de nature narcissique mais les joueurs chevronnĂ©s lui prĂ©fĂšrent la beautĂ© de lâexercice.
- Tous les conflits de la vie réelle de type jeux stratégiques : compétition économique, bataille électorale, diplomatie internationale avec ses alliances, ses trahisons et ses opérations coups de poing.
Ainsi, comme un jeu, la guerre au sens de Clausewitz (continuitĂ© de la diplomatie) a ses rĂšgles, les camps adverses dĂ©veloppent chacun leur stratĂ©gie dans le but de la gagner. Cette idĂ©e de protocole (rĂšgles, stratĂ©gies) associĂ© Ă la guerre est Ă lâorigine de vifs dĂ©bats. De lĂ Ă en dĂ©duire quâil puisse exister une « guerre civilisĂ©e » (voir les interrogations du prince Andrei, dans Guerre et paix de TolstoĂŻ), il nây a parfois quâun pas. Tuer par haine ou passion estâil plus excusable que tuer selon un protocole ? Anatol Rapoport souligne que « lâobjet de tout jeu est de gagner au moindre coĂ»t possible, donc sans guerre ». Il sâappuie sur le thĂ©orĂšme du minimax (soit trouver la meilleure stratĂ©gie en se basant sur des considĂ©rations rationnelles).
3. Le débat
- conflit de persuasion et non plus un conflit analogue à un jeu de stratégie.
- dans lequel pour convaincre, il faut conduire lâadversaire Ă vous Ă©couter soit en profitant de sa capacitĂ© Ă imiter les autres (donc vous) soit en Ă©clairant lâavantage quâil tirerait Ă faire ce qui vous voulez quâil fasse.
En résumé, Rapoport distingue trois modes de conflit avec trois buts différents :
- dans un combat le but est dâĂ©liminer son adversaire
- dans un jeu de stratĂ©gie, le but est dâĂȘtre plus malin que son adversaire,
- dans un dĂ©bat il sâagit de convaincre son adversaire.
Exemples :
- NĂ©gociations commerciales (de lâOMC etc.)
- NĂ©gociations climatiques
Outils « vulgarisés » par la théorie des jeux
Définition du jeu et présentation des types de jeux
Un jeu est une interaction stratégique entre deux entités.
Les principales typologies de jeu sont les suivantes :
- des jeux Ă somme nulle (ce quâun joueur gagne, son adversaire le perd), qui furent les premiers Ă©tudiĂ©s par John von Neumann et Oskar Morgenstern (VNM) dĂšs 1944 et des jeux Ă somme non nulle (ex : dilemme du prisonnier)
- des jeux coopératifs (dans lesquels les joueurs peuvent communiquer entre eux) et des jeux non coopératifs (dans lesquels les joueurs sont interrogés séparément et ne peuvent pas communiquer entre eux)
On distingue à ce niveau deux sous-catégories selon que les jeux sont dynamiques ou non:
- des jeux simultanés
- des jeux séquentiels
La notion de jeux simultanés ou jeux séquentiels introduit une dynamique temporelle.
Nature de lâinformation disponible pour les joueurs
Le type dâinformation dont disposent les joueurs lors du jeu est crucial. Cette information peut ĂȘtre de deux types :
- une information parfaite lorsque le joueur est parfaitement informé des actions passées des autres joueurs, elle est imparfaite dans le cas contraire
Ex : Aux Ă©checs, les joueurs ont une information parfaite. Chaque joueur voit lâĂ©chiquier et peut retenir les actions de son adversaire.
- une information incomplĂšte si au moins un des joueurs ne connaĂźt pas parfaitement la structure du jeu, elle est complĂšte dans le cas contraire.
Les premiers jeux étudiés (par von Neumann et Morgenstern) furent des jeux à information complÚte.
Ex : Au poker, lâinformation des joueurs est incomplĂšte. Les joueurs cachent leurs cartes et sont susceptibles de bluffer. Par la suite, la pertinence de cette hypothĂšse dâinformation complĂšte a Ă©tĂ© remise en question. Les modĂšles sont devenus plus complexes (John Harsanyi (1966), Reinhard Selten (1975)).
Stratégie pure et stratégie mixte
Dâune maniĂšre gĂ©nĂ©rale, « une stratĂ©gie dâun joueur doit spĂ©cifier une action pour ce joueur chaque fois quâil est susceptible de jouer (sâil joue, par exemple, Ă plusieurs tours du jeu, nous devons spĂ©cifier une action pour chacun des tours» (Yildizoglu, 2003)
- Profil de résultat
Un profil de stratégies (ou résultat) « spécifie un déroulement complet du jeu en précisant une stratégie par joueur » (ibid.).
Il existe deux types de stratégies :
- Stratégie pure
Une stratĂ©gie pure est constituĂ©e dâune action pure. Exemple : entrer ou non sur un marchĂ©.
Une stratĂ©gie mixte, si, dâun joueur i est dĂ©finie comme suit :
si=âα Ciαâiα avec Ciα>0 et âαCiα=1 et oĂč âiα est une αiĂšme stratĂ©gie pure du joueur i
Exemple : {Entrer ou non sur un marché} + {Produire ou non sur ce marché}
Issue du jeu et prĂ©diction de lâissue du jeu
von Neumann et Morgenstern ont introduit la fonction dâutilitĂ© pour attribuer un nombre Ă chaque consĂ©quence relative au choix de lâun des joueurs. Elle suppose la rationalitĂ© des acteurs.
PrĂ©diction de lâissue du jeu
John Nash (1950) a caractĂ©risĂ© lâissue du jeu. LâĂ©quilibre de Nash se dĂ©finit comme un ensemble de stratĂ©gies (une par joueur) tel quâaucun joueur ne puisse obtenir un gain supplĂ©mentaire en changeant unilatĂ©ralement de stratĂ©gie. Il est utilisĂ© pour dĂ©terminer lâissue des jeux Ă information complĂšte statique ou dynamique. Cet Ă©quilibre renvoie Ă un critĂšre « dâabsence de regret ».
Le thĂ©orĂšme dâexistence de lâĂ©quilibre de Nash postule que tout jeu fini admet au moins un Ă©quilibre de Nash (et Ă©ventuellement en stratĂ©gies mixtes).
Une extension de lâĂ©quilibre de Nash est lâĂ©quilibre bayĂ©sien (Thomas Bayes). Celui-ci est utilisĂ© pour dĂ©terminer lâissue de jeux, statiques ou dynamiques, Ă information incomplĂšte. Il est dĂ©fini comme un ensemble de stratĂ©gies (une par joueur) et un systĂšme de croyances (câest-Ă -dire des probabilitĂ©s affectĂ©es Ă la rĂ©alisation de chaque valeur possible des paramĂštres inconnus du jeu) associĂ©es Ă ces stratĂ©gies tels que, Ă chaque Ă©tape du jeu :
- aucun joueur nâa intĂ©rĂȘt Ă changer de stratĂ©gie Ă©tant donnĂ© les stratĂ©gies des autres joueurs et le systĂšme de croyances, etc.
- les croyances sont dĂ©duites des stratĂ©gies dâĂ©quilibre et des actions observĂ©es en appliquant la rĂšgle de Bayes[8] (Eber, 2004).
Le thĂ©orĂšme dâexistence de lâĂ©quilibre bayĂ©sien postule que tout jeu dynamique fini Ă information incomplĂšte admet au moins un Ă©quilibre bayĂ©sien parfait.
En résumé :
Jeu statique | Jeu dynamique | |
Information complĂšte | Ăquilibre de Nash | Ăquilibre de Nash parfait en sous-jeux |
Information incomplĂšte | Ăquilibre bayĂ©sien | Ăquilibre bayĂ©sien parfait (ou Ă©quilibre sĂ©quentiel) |
Représentation du jeu
Il existe deux principales formes de représentation du jeu employées par von Neumann et Morgenstern :
- une forme normale câest-Ă -dire sous la forme dâun tableau ou dâune matrice reprĂ©sentant les gains de joueurs,
- une forme dite extensive câest-Ă -dire sous la forme dâun arbre (arbre de Kuhn, 1953).
L'arborescence pose un problÚme. Sa forme peut induire en erreur. Elle suggÚre, par sa forme, que les actions des joueurs sont séquentielles. Mieux vaut utiliser une matrice pour représenter des actions simultanées et éviter toute confusion.
Les travaux de J. von Neumann & O. Morgenstern (VNM) - Jeux Ă somme nulle
- Jeu Ă somme nulle
Le jeu Ă somme nulle a Ă©tĂ© le premier Ă ĂȘtre Ă©tudiĂ© (thĂ©orĂšme du minimax) de J. von Neumann. Dans un tel jeu, ce quâun joueur gagne, son adversaire le perd. La somme des « payoffs » (ou rĂ©sultats du jeu) est toujours nulle.
Rappel au sujet du thĂ©orĂšme du minimax de J. von Neumann : ce thĂ©orĂšme dit que dans tout jeu Ă somme nulle, il existe une stratĂ©gie meilleure pour chaque adversaire, et garantissant â au moins sur le long terme- que celui qui la choisira gagnera autant quâil est possible de gagner avec les rĂšgles du jeu existantes. |
NĂ©anmoins, ces jeux Ă somme nulle ignorent le concept dâintĂ©rĂȘt personnel ou collectif (exemple : choix dâune solidaritĂ© basĂ©e sur lâintĂ©rĂȘt collectif) ce qui revient alors Ă faire intervenir un troisiĂšme joueur qui transforme alors le jeu Ă somme nulle en jeu Ă somme non nulle (voir ci-aprĂšs).
- Jeu Ă somme non nulle
- Le « dilemme du prisonnier », le plus cĂ©lĂšbre « Le dilemme du prisonnier incarne lâidĂ©e fondamentale (notamment en Ă©conomie) selon laquelle la confrontation des intĂ©rĂȘts individuels ne dĂ©bouche pas nĂ©cessairement sur lâoptimum collectif » (Eber 2004).
Ă lâorigine, il sâagit dâun jeu expĂ©rimental, proposĂ© par deux mathĂ©maticiens Melvin Dresher et Merrill Flood en . M. Dresher et M. Flood cherchaient, Ă lâĂ©poque, Ă Ă©valuer la robustesse du concept dâĂ©quilibre de leur collĂšgue J. Nash. Mais Alfred Tucker, un autre mathĂ©maticien, popularisera ce jeu en le nommant « dilemme du prisonnier », lors dâun sĂ©minaire au dĂ©partement de psychologie de lâ[universitĂ© Stanford] en :
« Deux hommes, accusĂ©s dâavoir conjointement enfreint la loi, sont dĂ©tenus sĂ©parĂ©ment par la police. Chacun est informĂ© que : 1. si lâun des deux avoue et que lâautre non, le premier aura une rĂ©compense (payoff +1) alors que le second sera lourdement condamnĂ© (payoff -2), 2. si les deux avouent, ils subiront tous les deux une peine lĂ©gĂšre (payoff -1) ; en mĂȘme temps chacun a de bonnes raisons de croire que 3. si aucun des deux nâavouent, chacun repartira libre. » (Tucker, 1950)
La formulation originale du dilemme du prisonnier a donc la structure suivante :
prisonnier 1 | prisonnier 1 | ||
avoue (A) | n'avoue pas (NA) | ||
prisonnier 2 | avoue (A) | -1, -1 | -2, +1 |
prisonnier 2 | n'avoue pas (NA) | +1, -2 | 0, 0 |
Ce jeu est un jeu à deux personnes, symétrique, à somme non nulle non coopératif (les deux prisonniers ne peuvent communiquer). Chaque joueur dispose de deux stratégies pures : avouer (A) ou ne pas avouer (NA).
à noter que la stratégie A est une stratégie dominante pour les deux prisonniers. Par conséquent, le seul équilibre de Nash du jeu est le couple de (A ; A) qui entraßne une peine légÚre (payoff -1) pour les deux prisonniers. En outre, si les deux prisonniers avaient coopéré, ils seraient repartis libres.
Le dilemme rĂ©side dans le fait que la situation de chacun des prisonniers est meilleure si aucun des deux nâavoue, mais aucun des deux ne prendra le risque dâavouer, car chacun sait que sâil nâavoue pas, lâintĂ©rĂȘt de lâautre sera dâavouer.
- Transformation simple dâun jeu Ă somme non nulle en jeu Ă somme nulle
Dans le dilemme du prisonnier prĂ©cĂ©demment dĂ©crit, si un joueur tiers intervenait (lâĂtat par ex.), le jeu deviendrait un jeu Ă somme nulle (et Ă trois joueurs). Il nâaurait pas Ă choisir câest-Ă -dire nâaurait quâune seule stratĂ©gie mais recevrait les « payoffs » suivants :
prisonnier 1 | prisonnier 1 | ||
avoue (A) | n'avoue pas (NA) | ||
prisonnier 2 | avoue (A) | 2 | 1 |
prisonnier 2 | n'avoue pas (NA) | 1 | 0 |
RĂ©fĂ©rence: Tucker A. W., (1983), âThe Mathematics of Tucker: A Samplerâ, The Two-Year College Mathematics Journal, Vol. 14, No. 3. (June., 1983), p. 228-232.
John von Neumann avait juste soulignĂ©, sans lâapprofondir, ce phĂ©nomĂšne dans son traitement du jeu de coalition Ă trois personnes. Cette composante ou « norme sociale » - câest-Ă -dire ce qui est considĂ©rĂ© comme juste et non gagnant par les joueurs - force lâissue du jeu Ă deux joueurs et somme nulle.
Ce jeu de coalition, au sens oĂč il a Ă©tĂ© classiquement prĂ©sentĂ© par VNM (1944), est un jeu Ă information complĂšte et somme nulle oĂč une coalition de joueurs, S, et N\S un ensemble des joueurs nâappartenant pas Ă cette coalition cherchent respectivement Ă maximiser leur payoff et Ă maintenir le payoff de S Ă son plus bas niveau. En lâabsence de coalition, chaque participant agit indĂ©pendamment des autres, sans collaboration ou communication avec eux.
Tous les problĂšmes de formation de coalition sont essentiellement des problĂšmes de nĂ©gociations qui nâentrent pas dans le cadre Ă©laborĂ© par John von Neumann.
Ils ont largement Ă©tĂ© Ă©tudiĂ©s par dâautres. Ils font intervenir des dimensions psychologiques (confiance, doute, conscience dâun intĂ©rĂȘt collectif, susceptibilitĂ© ou immunitĂ© vis-Ă -vis des menaces etc.) qui ont Ă©largi le champ de la thĂ©orie des jeux. LâarmĂ©e, peu habituĂ©e, Ă utiliser ces notions sây est, en particulier, beaucoup intĂ©ressĂ©e par la suite.
- Jeu non coopératif ou jeu de négociation
La nĂ©gociation est une situation frĂ©quente dans la rĂ©alitĂ© et a Ă©tĂ© particuliĂšrement Ă©tudiĂ©e par les Ă©conomistes de la thĂ©orie des jeux, J.F Nash, J.C. Harsanyi, R.Selten, etc. pour rĂ©soudre des problĂšmes dâĂ©change. Historiquement, les travaux se sont basĂ©s bien Ă©videmment sur les contributions de VNM. Puis le concept dâĂ©quilibre de Nash en information complĂšte et le concept dâĂ©quilibre bayĂ©sien en information incomplĂšte ont reflĂ©tĂ© respectivement le souci de dĂ©terminer lâĂ©tat dâĂ©quilibre de ce type de jeux et de reprĂ©senter mathĂ©matiquement lâasymĂ©trie dâinformation inhĂ©rente aux Ă©changes quels quâils soient. Enfin, Selten et dâautres ont introduit une dynamique temporelle en information complĂšte ou incomplĂšte dans lâanalyse de situations dâinteractions dâacteurs.
1. Jeux statiques * Cas oĂč lâinformation est complĂšte Dans « Non-cooperative games », J.F. Nash, dĂšs 1950, a proposĂ© une nouvelle approche pour traiter aussi les problĂšmes Ă©conomiques classiques de nĂ©gociation et non pas seulement les jeux (Ă©checs, poker etc.). Il propose un modĂšle de jeu fini Ă deux (n) personnes, Ă information complĂšte et dĂ©montre quâil existe au moins un Ă©quilibre ('Nash equilibrium') de ce type dans ce jeu fini Ă n personnes, Ă information complĂšte.
Point dâĂ©quilibre Un point dâĂ©quilibre est un profil de stratĂ©gies tel que chaque agent propose sa meilleure stratĂ©gie Ă lâautre Nash dĂ©montre lâexistence dâun au_ moins un Ă©quilibre correspondant aux meilleures rĂ©ponses possibles de chaque joueur ou Ă©quilibre de Nash.
ModĂ©lisation de lâinformation complĂšte IdĂ©alement, chaque personne a un comportement trĂšs rationnel ; chacune peut comparer prĂ©cisĂ©ment ses dĂ©sirs pour diffĂ©rentes choses, chacune a les mĂȘmes qualitĂ©s de nĂ©gociateur que lâautre et enfin chacune connaĂźt complĂštement les goĂ»ts et prĂ©fĂ©rences de lâautre. Pour traiter mathĂ©matiquement ce problĂšme, J.F. Nash emploie la notion dâutilitĂ© quâil lie au concept dâanticipation afin dâexprimer les prĂ©fĂ©rences (Ă©lĂ©ment manquant et critiquĂ© dans le modĂšle de VNM) de joueurs engagĂ©s dans le processus de nĂ©gociation.
UtilitĂ© : « Le joueur 1 prĂ©fĂšre A Ă B » se traduira par u1 (A) > u1 (B). Ainsi dans lâexemple ci-dessous, les utilitĂ©s attendues de Bill et Jack pour lâĂ©change dâobjets personnels sont les suivantes :
(insertion tableau) Ref: Nash J. F., , « The Bargaining Problem », Econometrica, Vol. 18, No. 2., p. 155-162.
Sâil existe un objet ou un montant Ă Ă©changer, la coopĂ©ration peut se faire. Dans lâexemple ci-dessus, la solution (« Nash bargaining solution ») consiste Ă une nĂ©gociation sous forme de troc pour lequel la somme des utilitĂ©s des joueurs est maximale et idĂ©alement avec un profit Ă©gal pour chacune des parties. Ainsi, Bill Ă©changera son chapeau contre un fouet ou une batte de base ball Ă Jack.
* Cas oĂč lâinformation est incomplĂšte AprĂšs Nash, les apports ont Ă©tĂ© nombreux pour raffiner le modĂšle. En particulier lâhypothĂšse dâinformation complĂšte a Ă©tĂ© modifiĂ©e pour reflĂ©ter la rĂ©alitĂ©. Harsanyi (1966) a Ă©tendu le modĂšle de Nash Ă des jeux Ă information incomplĂšte notamment en modĂ©lisant les prĂ©fĂ©rences des joueurs Ă lâaide de distributions de probabilitĂ© et en lui associant la notion dâĂ©quilibre bayĂ©sien.
Il est dĂ©fini comme un ensemble de stratĂ©gies (une par joueur) et un systĂšme de croyances (câest-Ă -dire des probabilitĂ©s affectĂ©es Ă la rĂ©alisation de chaque valeur possible des paramĂštres inconnus du jeu) associĂ©es Ă ces stratĂ©gies tels que, Ă chaque Ă©tape du jeu :
- aucun joueur nâa intĂ©rĂȘt Ă changer de stratĂ©gie Ă©tant donnĂ© les stratĂ©gies des autres joueurs et le systĂšme de croyances etc.
- les croyances sont dĂ©duites des stratĂ©gies dâĂ©quilibre et des actions observĂ©es en appliquant la rĂšgle de Bayes (Eber, 2004).
Le thĂ©orĂšme dâexistence de lâĂ©quilibre bayĂ©sien postule que tout jeu dynamique fini Ă information incomplĂšte admet au moins un Ă©quilibre bayĂ©sien parfait.
2. Jeux dynamiques
* Cas oĂč lâinformation est complĂšte Selten (1975) a introduit la notion de sous-jeu et a permis dâintroduire une dynamique dans les jeux non coopĂ©ratifs de Nash grĂące Ă lâidĂ©e que dans une forme extensive du jeu, les Ă©quilibres qui imposent des menaces ou des promesses non crĂ©dibles (« trembling hand perfection ») doivent ĂȘtre Ă©liminĂ©s. Il applique sa thĂ©orie Ă lâexemple des barriĂšres Ă lâentrĂ©e.
La coopĂ©ration en thĂ©orie des jeux Van Damme et Furth (2002) soulignent que la terminologie de « jeux coopĂ©ratifs ou non » peut conduire Ă des confusions. Le terme de jeu coopĂ©ratif ne signifie pas que les joueurs ne souhaitent pas coopĂ©rer et quâils coopĂšrent automatiquement dans un jeu coopĂ©ratif. « La diffĂ©rence [âŠ] rĂ©side dans le niveau de dĂ©tail du modĂšle ; les modĂšles non coopĂ©ratifs supposent que toutes les possibilitĂ©s pour une coopĂ©ration sont incluses comme des mouvements formels dans le jeu tandis que les modĂšles coopĂ©ratifs sont ââincompletsââ et permettent aux joueurs dâagir hors des rĂšgles dĂ©taillĂ©es qui ont Ă©tĂ© spĂ©cifiĂ©es ».
Les relations internationales sâapparentent Ă des relations de coopĂ©ration/ dissuasion câest pourquoi les principaux rĂ©sultats de thĂ©orie des jeux ayant trait Ă la coopĂ©ration sont rappelĂ©s ci-dessous :
- Le dilemme du prisonnier, une seule fois « jouĂ© », conclut quâaucun agent ne coopĂ©rera.
- Infiniment répété ou répété de façon fini, le dilemme du prisonnier peut trouver un équilibre dans lequel les deux agents coopÚrent.
* Le « dilemme du prisonnier » avec itération Le dilemme du prisonnier a été largement repris par différentes disciplines scientifiques. Les théoriciens des jeux (P. Milgrom, 1984) retiennent les points suivants :
- il existe un unique équilibre de Nash qui implique une démission mutuelle (les deux prisonniers avouent),
- la coopĂ©ration peut ĂȘtre un Ă©quilibre
- si le jeu est rĂ©pĂ©tĂ© infiniment - « dilemme du prisonnier » rĂ©pĂ©tĂ© Ă lâinfini - plusieurs fois sans trop de remise sur le partage (Rubinstein, 1980)
- ou si le jeu est répété un nombre fini - « dilemme du prisonnier » de façon finie - de fois et si les joueurs ne connaissent pas les motivations ou les stratégies des autres joueurs (Kreps, Milgrom, Roberts and Wilson (1982).
* Le « dilemme du prisonnier » selon une perspective « Ă©volutionnaire Dans une perspective Ă©volutionnaire, la propriĂ©tĂ© de stabilitĂ© de lâĂ©quilibre de Nash est analysĂ©e. LâĂ©quilibre est stable quand, une fois lâĂ©quilibre ou la rĂšgle de comportement sont dĂ©finis, personne nâa intĂ©rĂȘt Ă changer la rĂšgle ou lâĂ©quilibre.
Ainsi, Robert Axelrod, dans son ouvrage âThe Evolution of Cooperationâ (1984), sâinterroge de la maniĂšre suivante: "Under what conditions will cooperation emerge in a world of egoists without central authority?â. Il teste non seulement la stabilitĂ© de lâĂ©quilibre mais aussi lâĂ©volution de la coopĂ©ration.
« Stratégie gagnant-gagnant », un modÚle philosophique attirant
Robert Axelrod, dans son ouvrage âThe Evolution of Cooperationâ (1984), cherche Ă rĂ©pondre Ă la question suivante: "Under what conditions will cooperation emerge in a world of egoists without central authority?â Pour tester la stabilitĂ© de cet Ă©quilibre, R. Axelrod demande Ă des collĂšgues, qui ont Ă©tudiĂ© le dilemme du prisonnier dans leurs diffĂ©rentes disciplines (psychologie, biologie, Ă©conomie, physique, mathĂ©matique, science politique, sociologie etc.), de proposer un programme, quâils estiment susceptible de remporter le plus de points, pour jouer Ă un jeu du dilemme du prisonnier rĂ©pĂ©tĂ© 200 fois. Chaque programme contient la stratĂ©gie dâun joueur. Le jeu sâapparente Ă un tournoi dans lequel chaque stratĂ©gie est confrontĂ©e Ă tous les autres, Ă lui-mĂȘme et Ă un programme alĂ©atoire jouant au hasard. Le programme vainqueur est celui totalisant le plus de points. Le premier tournoi impliquant 14 programmes donna le programme « gagnant-gagnant » ou « Tit for Tat » dâAnatol Rapoport vainqueur. R. Axelrod dĂ©cide de renouveler lâexpĂ©rience avec 62 programmes et de nouveau le programme gagnant-gagnant dâA.Rapoport lâemporte. Or la stratĂ©gie « gagnant-gagnant » ou « Tit for Tat » dâA. Rapoport nâemporte aucun match du tournoi ! R. Axelrod (1984) (1) en dĂ©duit, que « [le dilemme du prisonnier] est simplement une formulation abstraite de quelques situations trĂšs courantes et intĂ©ressantes dans lesquelles ce qui est le meilleur pour une personne individuellement conduit Ă une situation dâĂ©chec mutuel tandis que chacune pourrait mieux sâen tirer avec une coopĂ©ration mutuelle ». LâinterprĂ©tation de ces rĂ©sultats qui impliquent la supĂ©rioritĂ© du comportement coopĂ©ratif dans un environnement de dilemmes du prisonnier rĂ©pĂ©tĂ©s a Ă©tĂ© sujette Ă de nombreuses discussions. Selon Eber (2004), les rĂ©sultats dâAxelrod montrent que, dans un monde de conflits permanents, il serait « optimal » de se comporter de la façon suivante:
Cette philosophie politique, certes plaisante, est trĂšs dĂ©battue. Les conclusions auxquelles Axelrod aboutit sont en particulier liĂ©es Ă la simplification du modĂšle comparĂ© Ă la situation rĂ©elle analysĂ©e. RĂ©fĂ©rence : Milgrom P. R. (1984), âBook review: Axelrod's "The Evolution of Cooperation" The Evolution of Cooperation. R. Axelrodâ Review author[s]: Paul R. Milgrom, The RAND Journal of Economics, Vol. 15, No. 2. (Summer, 1984), p. 305-309. |
Jeux non coopératifs, principalement utilisés pour étudier les relations internationales Les relations internationales ont été largement étudiées par les théoriciens des jeux (Rapoport, Guyer, Hamburger 1966-1969) et la pertinence des jeux non coopératifs 2x2 et de leur équilibre de Nash a été précisément vérifiée pour ces études (C. Schmidt) par Brams, Hessel, Wittman 1977-1984).
Corollaire Les relations internationales seront principalement dĂ©crites Ă lâaide de jeux Ă somme non nulle coopĂ©ratifs selon les situations.
Appropriations dans le cadre de travaux sur les négociations internationales
Les exemples trouvĂ©s Ă partir de faits politiques et traduisant un Ă©tat des relations internationales permettront dâillustrer celles-ci avec le vocabulaire de la thĂ©orie des jeux.
La dissuasion nucléaire
Une dissuasion est un jeu dans lequel aucun des deux Ătats, nâa intĂ©rĂȘt Ă se lancer dans lâaction car les dĂ©gĂąts seraient trop importants (destruction mutuelle assurĂ©e ou MAD) ni nâa intĂ©rĂȘt Ă renoncer car sinon deviendrait vulnĂ©rable. L'Ă©quilibre de la terreur pendant la guerre froide causĂ© par la prolifĂ©ration des armes de destruction massive en est l'illustration la plus parlante. Les doctrines les plus reprĂ©sentatives en matiĂšre de stratĂ©gie nuclĂ©aire sont la doctrine Dulles, ou doctrine des reprĂ©sailles massives, et la doctrine Mac Namara. La premiĂšre fut la doctrine nuclĂ©aire amĂ©ricaine de 1953-54 Ă 1962 (oĂč elle fut remplacĂ©e par la doctrine MacNamara de riposte graduĂ©e). La doctrine nuclĂ©aire Dulles, extrĂȘmement rigide, avait un principe simple : toute attaque soviĂ©tique contre un pays membre de l'OTAN exposait l'URSS Ă des reprĂ©sailles nuclĂ©aires massives sur ses villes, sans prĂ©avis et sans retenue. En 1962, la doctrine MacNamara (ou doctrine de la riposte graduĂ©e) devient la ligne gĂ©opolitique choisie par les AmĂ©ricains en matiĂšre de stratĂ©gie nuclĂ©aire : elle implique un recours progressif et adaptĂ© aux armes de destruction massive. Robert McNamara, secrĂ©taire d'Ă©tat dans lâAdministration Kennedy, veut sâĂ©carter de la prĂ©cĂ©dente doctrine Dulles, dite des reprĂ©sailles massives. Dans le cas oĂč la dissuasion Ă©chouerait, refusant une stratĂ©gie nuclĂ©aire apocalyptique, il cherche un moyen de poursuivre des nĂ©gociations pour mettre fin au conflit, mĂȘme aprĂšs une premiĂšre utilisation dâarmes nuclĂ©aires.
Deux types de dissuasion existent :
- Dissuasion unilatérale
- Dissuasion bilatérale
Le rapport de forces entre les Ătats sera dĂ©terminant.
Ci-dessous quelques exemples :
- L'Inde et le Pakistan possĂšdent chacun lâarme nuclĂ©aire (relation symĂ©trique) mais par cette dissuasion aucun des deux nâest tentĂ© dâen faire usage.
- L'Ă©pisode du dĂ©barquement de la baie des Cochons illustre un rapport de forces asymĂ©trique. Seuls les Ătats-Unis disposaient alors de lâarme nuclĂ©aire.
- Ou encore au Moyen-Orient, oĂč seul IsraĂ«l possĂšde lâarme nuclĂ©aire dans la zone.
Le coĂ»t Ă©conomique nĂ©cessaire pour possĂ©der lâarme nuclĂ©aire Ă©tant infĂ©rieur au coĂ»t de destruction, le jeu est gagnant en termes de coĂ»t de destruction mais en coĂ»t absolu (indĂ©pendamment des retombĂ©es civiles) lâavantage est moins net. La paix est Ă ce prix.
Exemple du jeu de la poule mouillée (Eber 2004)
La matrice des gains de ce jeu est la suivante (matrice no 1) :
joueur 1 | joueur 1 | ||
A | B | ||
joueur 2 | A | 0, 0 | +1, -2 |
joueur 2 | B | -2, +1 | -8, -8 |
Les joueurs 1 et 2 Ă©tant Khrouchtchev et Kennedy, chacun menace lâautre dâutiliser lâarme nuclĂ©aire. Cette menace est peu crĂ©dible mais aucun des protagonistes ne veut perdre la face. Le gouvernement Kennedy en rĂ©ponse Ă la menace russe dâinstaller des missiles Ă Cuba menace Ă son tour lâURSS de guerre nuclĂ©aire (stratĂ©gie agressive B) plutĂŽt que dâaccepter lâinstallation des missiles (stratĂ©gie conciliante A). Khrouchtchev peut soit surenchĂ©rir (B) ou cĂ©der Ă la pression amĂ©ricaine (A). Il a choisi la seconde solution.
Origine de lâappellation "jeu de la poule mouillĂ©e" Ce jeu fait rĂ©fĂ©rence Ă un « jeu » trĂšs Ă la mode dans les annĂ©es 1950 et mis en scĂšne dans le film « La fureur de vivre ». Deux automobilistes roulent en sens inverse dans une rue Ă©troite, le perdant qualifiĂ© de « poule mouillĂ©e » est celui qui donne un coup de volant pour monter sur le trottoir et Ă©viter son concurrent. Ce jeu reprĂ©sente bien des situations de crise dans le domaine des relations internationales.
A correspond à monter sur le trottoir et B à continuer tout droit. Les joueurs ne peuvent communiquer. Ils jouent simultanément.
(A, A) : les deux joueurs sâĂ©vitent et montent sur le trottoir simultanĂ©ment. Il nây a ni gagnant ni perdant, payoffs nuls. (B, B) : les deux joueurs continuent tout droit et ont un accident dâoĂč les « payoffs » nĂ©gatifs Ă©levĂ©s. (B, A) ou (A, B) : lâun de deux sâĂ©carte et perd la face (payoff de -2) tandis que lâautre lâemporte (payoff de 1).
Notion de crise internationale appliquée aux relations internationales (C. Schmidt, 1994)
C. Schmidt utilise les outils de la théorie des jeux et en particulier les jeux 2x2 non coopératifs pour comprendre les processus de décision dans les crises internationales. Trois sources principales de crise sont identifiées par C. Schmidt:
- « un manque de discrimination parmi les stratĂ©gies disponibles sur les bases dâun choix rationnel
- une ambiguïté sur le cadre de la situation
- une mauvaise interprétation du jeu réel par les joueurs ».
La matrice utilisĂ©e pour dĂ©crire une crise internationale est un prototype (matrice 1 ci-dessous). Ă partir de celle-ci, C. Schmidt dĂ©montre Ă partir de rĂ©sultats expĂ©rimentaux que, selon le traitement des prĂ©fĂ©rences des pays en prĂ©sence, lâissue est diffĂ©rente.
Selon C. Schmidt, cette matrice est un prototype pour trois raisons :
- elle couvre tous les types de combinaison dâintĂ©rĂȘts entre le pays I et le pays II
- de nombreuses interprĂ©tations de celle-ci peuvent ĂȘtre trouvĂ©es dans le champ des relations internationales telles que :
- Ex : La crise nuclĂ©aire amĂ©ricano-soviĂ©tique pendant la guerre froide. Les Ătats-Unis (I) et lâUnion SoviĂ©tique (II) ont deux actions alternatives : (a1, a2) signifie « attaque » et (b1, b2) signifie « nâattaque pas » (en ne considĂ©rant quâun coup).
- Ex : Un dilemme de coopération dans plusieurs cas (Axelrod, 1984) avec (a1, a2) signifie « défaite » et (b1, b2) signifie « coopÚre ».
- Toutes les sources de crise, citées ci-dessus, ont toutes une solution.
Sous lâhypothĂšse dâindĂ©pendance des prĂ©fĂ©rences des pays, lâaddition de joueurs aux deux premiers ne modifie pas la structure du jeu.
Analyse de la matrice 1 Les deux pays connaissent toutes les rĂšgles du jeu, leurs propres prĂ©fĂ©rences et les consĂ©quences de chacune sur les actions possibles sur les prĂ©fĂ©rences de lâautre. Dans ce jeu, lâinformation est donc complĂšte.
Ce jeu a deux propriétés intéressantes :
- chacune des quatre issues possibles est un Ă©quilibre de Nash
- aucune des actions possibles ne conduit à une stratégie dominante.
Celles-ci renseignent sur la signification de la crise replacĂ©e dans un contexte international et de jeu non-coopĂ©ratif : les rĂšgles du jeu bloquent lâensemble du processus de prise de dĂ©cision rationnel. Le choix de lâissue dĂ©pend uniquement de la stratĂ©gie choisie par lâautre joueur. Si le pays II choisit dâattaquer (a2) le gain du pays I sera le mĂȘme quel que soit son choix (et rĂ©ciproquement).
Changement de configuration initiale de la crise Si lâon change la configuration initiale de la crise, la situation de crise peut ĂȘtre amĂ©liorĂ©e câest-Ă -dire rĂ©solue de deux façons
- en introduisant des menaces dans le jeu: perspective de dissuasion (Nash) ; voir matrice no 2
pays 1 | pays 1 | ||
A | B | ||
joueur 2 | A | 0, 0 | 0, 0 |
joueur 2 | B | 0, 0 | 1, 1 |
matrice 2 oĂč B correspond Ă une stratĂ©gie dâattaque et A Ă une stratĂ©gie pacifique (opposĂ©e)
- ou en supposant la connaissance dâune information additionnelle hors du jeu : perspective de coordination (Schelling, 1960).
La littérature sur les modÚles de dissuasion appliqués aux relations internationales grùce à la théorie des jeux est abondante (Brams 1985 ; Rudnianski 1986, 1991 ; Powell 1990).
Rapport de protectionnisme
Le protectionnisme permet de gagner une protection (constitution dâune rente, etc.) au dĂ©triment dâune dynamique Ă©conomique de lâĂ©conomie de marchĂ©. Ce rapport sâapparente Ă une sorte de thĂ©orie du cartel. Le protectionnisme est « une sorte de cartel public ».
Dans ce type de rapport, deux figures classiques sont possibles :
- le tricheur qui rompt lâaccord pour en tirer un avantage sachant que les autres ne le font pas (ex : dumping avec triche sur les quantitĂ©s ou sur les prix)
- le franc-tireur qui refuse lâaccord mais en tire un avantage (exemple du Mexique vis-Ă -vis de l'OPEP : LâOPEP garantit un cours de brut et le Mexique, non membre de lâOPEP et pĂ©trolier, se positionne par rapport Ă ce cours)
Le problĂšme de la guerre commerciale (Paul Krugman & Maurice Obstfeld, 2001)
Dans les annĂ©es 1980, les Ătats-Unis demandĂšrent au Japon de limiter ses exportations de voitures vers les Ătats-Unis au nom de la protection de lâindustrie nationale. Le Japon accepta cette demande et la relance de lâindustrie automobile amĂ©ricaine suivit. En revanche, il refusa de cĂ©der Ă lâautre demande amĂ©ricaine concernant lâĂ©limination des quotas sur la viande bovine et les citrons. Ces quotas obligeaient les consommateurs japonais Ă acheter des produits domestiques plus chers que les produits amĂ©ricains.
Sans approfondir les politiques des deux protagonistes, ces faits illustrent les conflits commerciaux qui sâarticulent autour de la problĂ©matique du libre-Ă©change : Faut-il favoriser le libre-Ă©change ? Nous ne dĂ©battrons pas ici des avantages (ou gains) et des inconvĂ©nients (ou pertes) et renverront le lecteur Ă lâouvrage de Krugman et Obstfeld, entre autres. En revanche, nous soulignerons lâimportance croissante, depuis la fin de la seconde guerre mondiale, des nĂ©gociations internationales (commerciales ici) que cet exemple illustre.
La nĂ©gociation internationale peut Ă©viter une guerre commerciale. ConsidĂ©rons, en effet, les deux pays prĂ©cĂ©dents, les Ătats-Unis et le Japon. Simplifions les faits relatĂ©s ci-dessus en les « rĂ©duisant » aux deux choix politiques suivants : libre-Ă©change ou protection. Supposons que, « de maniĂšre assez inhabituelle, les gouvernements sont suffisamment Ă©clairĂ©s sur les avantages quâils retirent des deux politiques pour leur attribuer une valeur numĂ©rique prĂ©cise» (Krugman & Obstfeld, 2001). Voir tableau ci-dessous.
Ătats-Unis | |||
Libre-Ă©change | Protectionnisme | ||
Japon | Libre-Ă©change | 10 ; 10 | - 10 ; 20 |
Protectionnisme | 20 ; - 10 | - 5 ; - 5 |
Les valeurs des gains de cette matrice correspondent aux deux hypothĂšses suivantes :
- hypothĂšse « protectionniste » selon laquelle « le gouvernement de chaque pays choisirait la protection sâil pouvait considĂ©rer la politique du partenaire comme donnĂ©e »,
Selon la premiĂšre hypothĂšse, le gouvernement amĂ©ricain est dans une meilleure situation en optant pour le protectionnisme, ce quelle que soit la politique du Japon. Krugman & Obstfeld soulignent que cela nâest pas nĂ©cessairement vrai bien que beaucoup dâĂ©conomistes soient favorables Ă cette hypothĂšse en raison non seulement de lâintĂ©rĂȘt public. Mais les gouvernements ont leur propre intĂ©rĂȘt politique et « ⊠[ils] trouvent souvent quâil est politiquement difficile de refuser la protection Ă certaines industries ».
- hypothĂšse « libre-Ă©changiste » selon laquelle « mĂȘme si chaque gouvernement gagnait le plus en optant pour la protection, ils seraient et lâautre dans une meilleure situation sâils choisissaient dâun commun accord le libre Ă©change ».
On notera quâil sâagit de la matrice du dilemme du prisonnier. La situation la plus favorable Ă chacun des pays est le protectionnisme : gain de +20 pour celui qui choisit la protection associĂ©e Ă une perte de -10 si lâautre a optĂ© pour le libre Ă©change. Si les deux pays choisissent unilatĂ©ralement le protectionnisme, ils perdent chacun -5. Cependant la matrice montre quâils ont intĂ©rĂȘt Ă se mettre dâaccord pour le libre-Ă©change, ils sont tous les deux dans une meilleure situation (gain de +10 pour les deux). Cet exemple simplifiĂ© montre que la coordination est lâissue favorable.
Application aux négociations climatiques internationales
Le changement climatique représente probablement la menace environnementale la plus importante à laquelle l'humanité ait eu à faire face. Parmi ses facteurs aggravants, la longue réticence de ses acteurs à accepter les observations, ou encore l'importance des coûts qui y sont associés. L'urgence de l'action et de la coordination des pays est devenue une nécessité. Les négociations pour lutter contre le changement climatique sont liées à ses caractéristiques :
- Le climat est un bien public mondial;
- Le changement climatique est un phénomÚne cumulatif et dont les effets sont à trÚs long terme voire irréversibles;
- Le changement climatique va affecter de façon asymétrique les régions du monde : les pays en développement vont davantage souffrir du changement climatique bien que les pays développés soient historiquement en grande partie responsable de la concentration de GES dans l'atmosphÚre dans le cadre de leur processus d'industrialisation.
La difficultĂ© Ă obtenir un nombre de pays signataires suffisant au protocole de Kyoto et le retrait des Ătats-Unis du protocole de Kyoto en 2001 a vu foisonner des articles de thĂ©orie des jeux appliquant la grille d'analyse traditionnelle aux nĂ©gociations climatiques internationales.
NĂ©gociations climatiques internationales et dilemme du prisonnier
Le problĂšme des Ă©missions de gaz Ă effet de serre (GES) est une illustration typique de la tragĂ©die des biens communs (tragedy of the commons) de Hardin et peut ĂȘtre considĂ©rĂ© comme un dilemme du prisonnier (Barret, Carraro, Cesar, Ecchia et Mariotti) : l'impact de l'Ă©mission d'une tonne de GES est mondial, ce n'est ni une pollution locale, ni une pollution rĂ©gionale. Ainsi, tous les pays profitent des rĂ©ductions de GES effectuĂ©es par les autres pays, mais il n'existe pas, en dehors des mĂ©canismes mis en place dans le cadre du protocole de Kyoto, d'incitation Ă rĂ©duire volontairement ses Ă©missions (Lise, Tol et van der Zwann, 2001).
Négociations climatiques internationales et jeux coopératifs
Il existe dans le cadre des négociations climatiques internationales des regroupements de pays :
- Les pays signataires de la Convention cadre des Nations Unies sur le Changement Climatique et les pays non-signataires
- Les pays signataires du protocole de Kyoto et les pays non-signataires
- Les pays développés et les pays en développement qui tentent de se mettre d'accord sur le meilleur moyen de lutter contre les émissions de GES tout en permettant le développement économique.
Ainsi, les négociations climatiques internationales ont été analysées comme des jeux coopératifs par Carraro (1997), Botteon et Carraro (1998) et Carraro et Siniscalco (1997). Ils se sont notamment intéressés à la théorie de la stabilité du cartel en se concentrant sur les probabilités d'émergence d'accords climatiques internationaux (Lise, Tol et van der Zwann (2001)).
La théorie de la stabilité des cartels appliquée aux coalitions (d'Aspremont et Gabszewicz, 1986) permet d'obtenir un nombre de jeux finis de solutions. Les trois caractéristiques du cartel sont les suivantes :
- StabilitĂ© interne du cartel : les rĂ©gions du cartel ont-elles intĂ©rĂȘt Ă sortir du cartel? Le cartel est jugĂ© stable du point de vue interne si aucun membre de la coalition n'a intĂ©rĂȘt quitter le cartel pour redevenir un singleton.
- StabilitĂ© externe du cartel : les rĂ©gions en dehors du cartel ont-elles intĂ©rĂȘt Ă rejoindre le cartel? Le cartel est jugĂ© stable du point de vue externe si aucun singleton n'a intĂ©rĂȘt Ă joindre le cartel.
- ProfitabilitĂ© : Y a-t-il des gains additionnels pour les membres d'une coalition par rapport au cas oĂč il n'y aurait pas de coalition? Une coalition est jugĂ©e stable quand elle l'est de façon interne et externe.
La lecture des nĂ©gociations climatiques internationales Ă la lumiĂšre des jeux coopĂ©ratifs a montrĂ© que seules les coalitions de taille modeste Ă©taient stable et que si une coopĂ©ration complĂšte (optimum social) permet un bien-ĂȘtre considĂ©rable par rapport Ă pas de pas coopĂ©ration du tout (Ă©quilibre de Nash), les coalitions stables ne permettant qu'un bien-ĂȘtre relativement faible (Dellink, von Ierland, Finus, 2003).
Des efforts de modélisation ont été également effectués : ainsi, Dellink, von Ierland, Finus (2003) modélisent la stabilité des coalitions pour douze régions du monde et montrent que des coalitions stables se forment si les gains consécutifs à la réduction des émissions de GES sont suffisamment élevés. Cependant, ces coalitions ne permettent d'obtenir qu'un équilibre marginalement supérieur à un équilibre de Nash.
Négociations climatiques internationales et jeux non-coopératifs
à l'inverse, Barret (1998) aborde les négociations climatiques internationales en tant que jeux non-coopératifs. Il montre les difficultés à obtenir une coalition de pays suffisamment grande dans un jeu non-répétitif.
Buchner et Carraro (2006) trouvent dans cette grille de lecture une intĂ©ressante application dans l'impact de la participation de la Chine dans les nĂ©gociations climatiques de rĂ©duction des GES sur un possible retour des Ătats-Unis Ă la table des nĂ©gociations et une Ă©ventuelle ratification du protocole de Kyoto. Pour rappel, les Ătats-Unis avaient en partie justifiĂ© la non-ratification du protocole par la non-ratification du traitĂ© par la Chine. En dĂ©pit de cette hypothĂšse de travail, Buchner et Carraro concluent qu'il est peu probable que les Ătats-Unis acceptent un tel traitĂ© au moins Ă court terme. Il est davantage probable que les Ătats-Unis adoptent des accords unilatĂ©raux et dans le cas oĂč Ă la fois la Chine et les Ătats-Unis seraient favorables Ă la rĂ©duction des GES, un accord bilatĂ©ral entre Ătats-Unis et Chine est l'option qui serait vraisemblablement retenue dans ce cadre d'analyse.
Négociations climatiques internationales et jeux répétitifs
La ratification d'un traitĂ© concernant la rĂ©gulation des GES se heurte naturellement au problĂšme du passager clandestin : chaque pays a intĂ©rĂȘt Ă ce que les autres pays ratifient le traitĂ© de rĂ©duction, mais il a tout intĂ©rĂȘt Ă ne pas le signer car il peut ainsi maintenir ses Ă©missions (bĂ©nĂ©fice local et dommage mondial) et bĂ©nĂ©ficier de l'effort consenti par les signataires (bĂ©nĂ©fice mondial vraisemblablement plus grand le dommage causĂ© par le free rider).
Pour Barret, dans le cas d'un jeu répétitif, la répétition des négociations et la menace exercée par les sanctions permettent d'augmenter la taille de la coalition. Il s'intéresse notamment aux moyens de pénaliser les passagers clandestins et de la crédibilité des menaces associées. Une voie d'amélioration du protocole de Kyoto pour la phase post-2012 serait de lui ajouter un volet technologique afin de limiter le problÚme du passager clandestin. En effet, Lise, Tol et Van der Zwann (2000) montrent que si les négociations climatiques internationales sont couplées avec des transferts de technologies, les incitations à coopérer sont d'autant plus élevées.
Ă l'opposĂ©, Carraro et Siniscalco (1993) soutiennent que l'utilisation de jeux rĂ©pĂ©titifs n'est pas utile Ă©tant donnĂ© que les comportements observĂ©s dans les nĂ©gociations climatiques internationales ne laissent pas entrevoir de stratĂ©gies de dĂ©clic (trigger strategy) : en effet, les stratĂ©gies de dĂ©clic dans le cas des GES impliquent de s'infliger une punition Ă soi-mĂȘme (de par la nature mondiale de l'impact des GES).
Le théorÚme folk dans le cas de jeux répétitifs soutient l'idée qu'il est toujours possible de maintenir un gain plus élevé que dans le cas du minimax si le facteur d'actualisation est suffisamment élevé pour les jeux répétés à l'infini et si l'information est incomplÚte pour les jeux répétés un nombre de fois données (Fudenberg et Maskin, 1986).
NĂ©gociations climatiques internationales et incertitude
Na et Shin (1998) ont apporté à l'analyse une importante caractéristique de la théorie des jeux : ils incorporent l'incertitude des résultats et montrent que la probabilité qu'une grande coalition soit stable est d'autant plus élevée que les négociations sur le changement climatique commencent tÎt, ajoutant à l'urgence environnementale, une urgence de négociation.
NĂ©gociations climatiques internationales et jeux TOSS
L'approche unificatrice proposée Greenberg (1990) intitulée Theory of Social Situation (TOSS) permet de fournir un cadre d'analyse à la question de la formation des coalitions dans la négociation climatique avec les paramÚtres suivants : un ensemble de joueurs, un ensemble de résultats possibles, une fonction de gain associée aux résultats et un comportement typique des joueurs (standard of behaviour). Ce comportement typique indique aux joueurs quels résultats dans chacune des configurations sont des solutions du jeu. Lise, Tol et van der Zwann (2001) abordent les questions de coalitions des pays dans le cadre de la négociation climatique internationale autour du protocole de Kyoto en se basant sur des jeux TOSS.
Ils montrent que l'acceptation des accords climatiques internationaux augmente si le pays a une vision à long terme (une vue du jeu à long terme) et/ou si le pays s'engage de maniÚre volontaire à respecter à horizon définie des engagements de réduction d'émissions de GES. Ils procÚdent à l'analyse de trois situations (des équilibres en théorie de jeux plus classique) :
- Analyse de la situation de cartel : jeu de cartel.
- Analyse de la situation d'engagement incrémental.
- Analyse de la situation de négoce.
Notes et références
- Bentham 1789
- Hegel 1821
- avec un « r » minuscule ici, à distinguer de l'expression avec un « R » majuscule se référant à la discipline qui les étudie
- Voir à ce sujet : Yildizoglu M., 2003; Introduction à la théorie des jeux, Collection Eco Sup
- Hull H. citation p. 24 Ouvrage de D. Battistella
- A. Rapoport, 1962, "Three mode of conflicts", Management Science, Vol.7, no 3 (avril 1961), p. 210-218
- C'est-Ă -dire les combats entre espĂšces rivales (pour la nourriture ou le territoire)
- RÚgle de Bayes ou loi de probabilité permettant de passer de la probabilité a priori attribuée à un phénomÚne à sa probabilité a posteriori probabilité (qualifiée parfois de "conditionnelle")qui tient compte des observations disponibles
Bibliographie
- Robert Axelrod, 1984,âThe evolution of cooperationâ, Basic Books
- Battistella, D. (2004), Théories des relations internationales, Presse de Science Po.
- Jeremy Bentham, Introduction to Principles of Morals and Legislation (écrit en 1780, publié en 1789). Le chapitre VIII est intitulé Of Internationality.
- Buchner, B., Carraro, C. (2006) US, China and the economics of climate negotiations, Ca' Foscari University of Venice Department of Economics Working paper.
- Chander, P., Tulkens, H., van Ypersele, J.-P., Willems, S. (1999), The Kyoto Protocol: an Economic and Game Theoretic Interpretation, CESifo working paper.
- Dellink, R., Finus, M., van Ierland, E. (2003), Stability of Climate Coalitions in a Cartel Formation Game, FEEM working paper.
- Devin, G. (2002), Sociologie des relations internationales, Ădition La DĂ©couverte & Syros, Paris
- Dutta, P.K., Radner, R. (2005), A Strategic Analysis of Global Warming: Theory and Some Numbers, Columbia University Department of Economics and New York Stern School of Business working paper.
- Kreps D., Milgrom P., Roberts J. et Wilson R., 1982, â Rational cooperation in the finitely repeated prisonerâs dilemmaâ, Journal of Economic Theory, 27, p. 245-252
- Harsanyi J. C., June 1995, âGames with Incomplete Informationâ, The American Economic Review, Vol. 85, No. 3., p. 291-303.
- Georg Wilhelm Friedrich Hegel (trad. de l'allemand par Jean-Louis Vieillard-Baron), Principes de la philosophie du droit, Paris, Flammarion, coll. « GF-Flammarion » (no 664), , 444 p. (ISBN 2-08-070664-0)
- Lise, W., Tol, R.S.J., van der Zwaan, B. (2001), Negotiating Climate Change as a Social Situation, FEEM working paper.
- Lise, W., Tol, R.S.J., van der Zwaan, B. (2000), Technology Diffusion and the Stability of Climate Coalitions, FEEM working paper.
- John Nash, Apr. 1950, âThe Bargaining Problemâ, Econometrica, Vol. 18, No. 2. p. 155-162.
- John Nash, Sep. 1951, âNon-Cooperative Gamesâ), The Annals of Mathematics, 2nd Ser., Vol. 54, No. 2., p. 286-295.
- Patel, V.M. (2005), Coalition Strategies and Reduction of GHG Emissions, Indian Institute of Technology working paper.
- Rapoport A., 1962, âThree modes of conflictâ, Management Science, Vol. 7, No. 3. (Apr., 1961), p. 210-218.
- Rubinstein R., Jan.1982, âPerfect Equilibrium in a Bargaining Modelâ, Econometrica, Vol. 50, No. 1., p. 97-109.
- Selten R., 1975, âRe-examination of the perfectness concept for equilibrium points in extensive gamesâ, International Journal of Game Theoryâ, 4, p. 25-55
- Stern, N. (2006), The Economics of Climate Change, HM Treasury paper.
- Tucker A. W., (1983), âThe Mathematics of Tucker: A Samplerâ, The Two-Year College Mathematics Journal, Vol. 14, No. 3. (Jun., 1983), p. 228-232.
- Van Damme E and Furth D, (2002), âGame theory and the marketâ. In: Borm P, Peters H (eds.)Chapters in Game Theory. Kluwer Academic Publishers, p. 51â81
- Allan P., Schmidt C. (1994), âGame Theory and International Relations. Preferences, Information and Empirical evidenceâ, British Library, p. 117, (ISBN 1 85278 925 5)
- Nicolas Eber, Théorie des jeux, Dunod,
- Krugman P.R. & Obstfeld M., 2001, âĂconomie internationaleâ, 3e Ă©dition, Ădition De Boeck UniversitĂ©, p. 271-285
- von Neumann, Morgenstern, 1944, âTheory of Games and Economic behaviourâ, Princeton University Press
- Yildizoglu, M. (2003), Introduction à la théorie des jeux, Collection Eco Sup.