AccueilđŸ‡«đŸ‡·Chercher

Théorie des jeux en relations internationales

Les relations « entre nations » ont depuis longtemps Ă©tĂ© un objet d'Ă©tude, mais les relations internationales, en tant que discipline scientifique, sont nĂ©es aprĂšs la PremiĂšre Guerre mondiale. Le terme international se rĂ©fĂšre, d’aprĂšs Bentham[1] et Hegel[2], aux États. Les courants de philosophie politique considĂšrent que les relations d’un État Ă  l’extĂ©rieur de son territoire, relations « entre nations » ou internationales, se dĂ©roulent dans l’anarchie. Pour Hegel, « les conflits entre États, lorsque les volontĂ©s particuliĂšres ne trouvent pas de terrain d'entente, ne peuvent ĂȘtre rĂ©glĂ©s que par la guerre ». Selon Carl Schmitt (1922, 1933, 1938), l'autonomie Ă©tatique repose sur la possibilitĂ© de l'État de s'autoconserver, en dehors mĂȘme de la norme juridique, par une action qui prouvera cette souverainetĂ©. Le propos des thĂ©ories internationales a Ă©tĂ©, de tout temps, d’étudier celles-ci sous diffĂ©rents angles, le rĂ©alisme, le libĂ©ralisme et le constructivisme Ă©tant les principaux, dans le but d’expliquer, d’éclairer ou mĂȘme d'influer sur les politiques internationales pour trouver d’autres solutions que la guerre.

De façon quasi concomitante au dĂ©veloppement de cette discipline est apparue la thĂ©orie des jeux, conçue par des mathĂ©maticiens (John von Neumann, John Forbes Nash, John Harsanyi et Reinhard Selten parmi les pionniers) et se proposant d’expliquer Ă  l’aide d’outils analytiques les interactions stratĂ©giques entre acteurs.

Son essor depuis les annĂ©es 50, dans un contexte de guerre froide marquĂ© par le jeu des puissances Ă©tatiques amĂ©ricaine et russe principalement, ne pouvait que naturellement conduire les thĂ©oriciens des Relations internationales[3] Ă  s’intĂ©resser de plus prĂšs Ă  cet ensemble d’outils. DĂ©jĂ  le gĂ©nĂ©ral prussien Carl von Clausewitz dans son traitĂ© De la Guerre (Vom Krieg, 1832) considĂ©rait la guerre comme la continuation de la politique par d’autres moyens, autrement dit : une arme de nĂ©gociation parmi d’autres. Ne parle-t-on pas de jeu des relations internationales ? « Le jeu Ă©tant alors une interaction stratĂ©gique entre deux États, le choix de l’un influençant la situation de l’autre » (Eber 2004).

DĂ©finitions

Théorie des jeux

« La thĂ©orie des jeux est un ensemble d’outils analytiques qui ont Ă©tĂ© dĂ©veloppĂ©s pour faciliter la comprĂ©hension des situations d’interaction entre des dĂ©cideurs (agents, joueurs) rationnels »[4].

Les hypothÚses de base de cette théorie sont :

  • la rationalitĂ© des dĂ©cideurs qui poursuivent des objectifs exogĂšnes et indĂ©pendants,
  • « leur prise en compte de la connaissance qu’ils ont ou des anticipations qu’ils font du comportement des autres acteurs »[4].

Relations internationales : définitions

La dĂ©finition des relations internationales[3] en tant qu'objet d’étude comporte le difficile problĂšme de la dĂ©finition de l’adjectif « international ». Cet adjectif dĂ©rivĂ© de nation porte en lui un sens qui semble implicite Ă  savoir qu’il se rapporte aux relations « entre nations », entre États. En rĂ©alitĂ© il convient de prĂ©ciser les acteurs et le pĂ©rimĂštre des relations pour en comprendre le sens actuel. D’une dĂ©finition stato-centrĂ©e (i.e. basĂ©e exclusivement sur les relations entre États), le concept a Ă©voluĂ© vers une dĂ©finition plus large avec notamment l’implication d’organisations non Ă©tatiques (type ONG) ([Battistella] D., 2004).

Relations entre États

L’adjectif « international », introduit par le philosophe Jeremy Bentham en 1801, serait liĂ© originellement aux transactions transfrontaliĂšres et aux rĂšgles qui les rĂ©gulent, soit le « droit des gens ». Poussant plus avant sa dĂ©finition, il l’élargit Ă  la notion de transactions mutuelles entre États souverains. Le terme de Bentham est Ă©quivalent Ă  interĂ©tatique ou intergouvernemental et suppose une personnification de l’État-nation.

  • Personnification des États (Hegel) :

Personnification qu’on retrouve dans l’Ɠuvre de Hegel oĂč les États sont considĂ©rĂ©s comme les acteurs principaux des relations entre nations, Ă©tant les seuls Ă  pouvoir prendre la dĂ©cision ultime de la guerre.

  • L’hostilitĂ© au centre des relations internationales (Schmitt) :

Selon Carl Schmitt, l’hostilitĂ© est le concept central des relations internationales, car ces derniĂšres sont caractĂ©risĂ©es par l’hostilitĂ© entre les États. Schmitt fut le premier thĂ©oricien de la guerre froide, non parce qu’il fut le premier Ă  analyser le conflit Est/Ouest, mais parce qu’il fut le premier Ă  souligner que la situation de paix-guerre - oĂč l’hostilitĂ© prime - n’apparaĂźt pas qu’au lendemain ou dans la foulĂ©e du second conflit mondial avec l’antagonisme amĂ©ricano-soviĂ©tique. Son approche se place sous les auspices de la pensĂ©e clausewitzienne. L’hostilitĂ© est le prĂ©supposĂ© de la guerre et l’ennemi est le concept premier par rapport Ă  la guerre. Ces relations internationales structurĂ©es par la relation ami-ennemi sont d’abord des relations entre États, mais en mĂȘme temps l’État, s’il est l’unique sujet du droit international, n’est pas l’unique acteur de la politique internationale.

  • DĂ©finition des relations internationales retenue dans le cadre de ce sujet (Hull) :

« Le point de dĂ©part des relations internationales est l’existence d’États, ou de communautĂ©s politiques indĂ©pendantes, avec Ă  leur tĂȘte un gouvernement revendiquant la souverainetĂ© sur une portion particuliĂšre de la surface terrestre »[5].

Autres contributions aux fondements de la théorie des relations internationales

Parmi les autres personnalitĂ©s qui ont contribuĂ© Ă  Ă©tablir les fondements d’une thĂ©orie des relations internationales, il faut Ă©galement mentionner Carl von Clausewitz et Henry Kissinger.

Carl von Clausewitz : « la guerre, continuation de la politique par d’autres moyens »
Dans son ouvrage De la Guerre (1832), ce dernier a apportĂ© une contribution nodale Ă  l’explication de la stratĂ©gie militaire en expliquant que toutes les dĂ©cisions prises sur un champ de bataille sont caractĂ©risĂ©es par l’incertitude. L’issue de toute guerre est imprĂ©visible, car aucune planification rationnelle des opĂ©rations militaires ne peut prĂ©voir tous les obstacles qui sont susceptibles d’entraver ou de faire Ă©chouer le dĂ©roulement de ces opĂ©rations. L’influence de l’Ɠuvre de Carl von Clausewitz ne tient pas uniquement au fait qu’il a conceptualisĂ© la notion d’incertitude qui deviendra, au XXe siĂšcle, un des Ă©lĂ©ments centraux de la thĂ©orie rĂ©aliste de l’acteur rationnel. Il a Ă©galement montrĂ© que la guerre est la continuation de la politique par d’autres moyens et que son issue repose, non seulement sur les capacitĂ©s militaires d’un État, mais sur ses ressources sociales et Ă©conomiques.

Henry Kissinger et les conditions d’établissement d’une alliance stratĂ©gique
Une question cruciale, qui a donnĂ© lieu Ă  de nombreux dĂ©bats, est l’interrogation sur les conditions d’établissement d’une alliance stratĂ©gique. Selon Henry Kissinger, les alliances stratĂ©giques rĂ©sultent essentiellement de la volontĂ© des États, mais elles ne peuvent exister qu’entre États dont les systĂšmes Ă©conomiques, politiques et idĂ©ologiques sont similaires, convergents ou compatibles. Durant la pĂ©riode la plus dure de la guerre froide (1947-1956/60), Henry Kissinger soutient qu’aucune alliance n’est envisageable entre les États-Unis et l’Union soviĂ©tique en raison du caractĂšre antagonique de leurs systĂšmes Ă©conomiques et politico-idĂ©ologiques. La dissuasion nuclĂ©aire ou l’équilibre de la terreur lui apparaĂźt, ainsi qu’à un trĂšs grand nombre d’autres rĂ©alistes, dont Raymond Aron, la seule alternative susceptible de maintenir la paix entre les deux superpuissances Ă  l’échelle mondiale.

Raymond Aron et sa lecture multipolaire ou bipolaire des relations interétatiques
Raymond Aron (1962) propose une lecture de ces relations interétatiques sous deux angles (Devin, 2002) :

  • Angle multipolaire constituĂ© de plusieurs « unitĂ©s politiques » comparables par leur taille et leur puissance Ă©conomique et militaire. À titre d'exemple, le CongrĂšs de Vienne (1815) dans lequel Autriche, France, Grande-Bretagne, Prusse et Russie se partagent Ă©quitablement les forces.
  • Angle bipolaire constituĂ© de deux coalitions antagonistes dans lesquelles se rangent la plupart des « unitĂ©s politiques », elles-mĂȘmes organisĂ©es autour de deux acteurs politiques principaux. L'exemple Ă©vident est la Guerre froide avec le bloc russe et le bloc amĂ©ricain.
  • Il envisage Ă©galement un angle unipolaire : aprĂšs l’éclatement de l’URSS dans les annĂ©es 1990, le systĂšme international n’était ni bipolaire ni multipolaire mais dominĂ© par les États-Unis et donc unipolaire, bien que « transitoire » (Interlude de Layne, 1993) d’un point de vue rĂ©aliste (Devin, 2002).

Des relations internationales au-delà des États (ONG etc.)

Relations au-delĂ  de l’espace contrĂŽlĂ© par les États pris individuellement quel que soit l’acteur (Ă©tatique ou non) considĂ©rĂ© au sens actuel.

Typologie des relations internationales

Les États souverains adhĂšrent librement et volontairement Ă  des ententes et Ă  des rĂšgles qui maintiennent la dynamique des conflits interĂ©tatiques dans un cadre pacifique. Toutefois, l’instauration d’une paix perpĂ©tuelle est inimaginable en raison de la souverainetĂ©, des ambitions, des inĂ©galitĂ©s et de la mĂ©fiance mutuelle des États qui les placent dans un dilemme de sĂ©curitĂ©.

On peut distinguer deux principaux types de Relations internationales :

  • l'interaction : c'est une relation telle que la modification du comportement de l’un agit sur l’autre. Il s'agit d'une relation typiquement de sĂ©curitĂ© : adoption d’une mesure de dĂ©fense par un État, perçue par un autre comme une aggravation de la menace qui provoque en retour une contre-mesure et alimente un processus d’escalade (course Ă  l’armement).
  • l'interdĂ©pendance : relation dans laquelle les acteurs opĂšrent des choix qui individuellement sont marginaux mais cumulĂ©s sont de nature Ă  modifier l’ensemble des relations (flux du commerce international). Aux effets de compĂ©tition d’une relation d'interaction se substituent des effets d’agrĂ©gation d’une relation d’interdĂ©pendance.

Structure des relations internationales

Les relations internationales ont une structure de jeu au sens oĂč elles impliquent une valeur des gains (quantifiable ou non) associĂ©s Ă  une action, une communication entre les deux parties et des stratĂ©gies mises en Ɠuvre pour rĂ©aliser cette action.

Que faut-il pour pouvoir parler de relations internationales ?

  • horizontales rĂ©guliĂšres et dĂ©limitĂ©es politiquement les unes par rapport aux autres
  • anarchie (absence d’autoritĂ© supĂ©rieure aux États)

À noter des relations le plus souvent instables

Anatol Rapoport (1962) propose de distinguer trois modes de conflits : le combat, les jeux de stratégie et le débat[6].

Trois modes de conflits (Rapoport)

1. Le combat

  • motivĂ© par une animositĂ© mutuelle
  • dans lequel, l’adversaire reprĂ©sente « juste » un stimulus nocif
  • caractĂ©ristique d’un « monde sous humain » (« sub-human world »), au sens d'Anatol Rapoport[7] mais aussi ceux au sein de l’espĂšce humaine.

La principale nuance pour les conflits humains est qu’ils sont souvent dĂ©terminĂ©s par des hypothĂšses auto-prĂ©dictives (suspicion, prĂ©jugĂ©s, etc.) « orientant » les comportements des parties en prĂ©sence.

En idĂ©alisant les combats Ă  l’aide d’une description mathĂ©matique (Ă©quations diffĂ©rentielles), il est possible de les dĂ©crire comme des systĂšmes avec des boucles de feedback positives ou nĂ©gatives traduisant la stabilitĂ© ou l’instabilitĂ© du systĂšme. L. F. Richardson a le premier rĂ©ussi Ă  dĂ©crire la dynamique de la course aux armements de cette façon. Des biologistes l’ont Ă©galement fait pour dĂ©crire les compĂ©titions entre espĂšces. Ces combats sont plus ou moins prĂ©cĂ©dĂ©s par un enchaĂźnement d’évĂ©nements (physiques ou symboliques) et, non comme dans les jeux de stratĂ©gie, par un choix rationnel.

2. Les jeux de stratégie

  • motivĂ©s par un choix rationnel
  • sans appartenance au monde sous-humain d'Anatol Rapoport
  • dans lequel chaque joueur prĂ©voit les issues possibles rĂ©sultant des choix d’action pris par son adversaire et lui-mĂȘme. Il suppose la rationalitĂ© de son adversaire Ă©gale Ă  la sienne.

Exemples ;

  • Les Ă©checs, forme « idĂ©ale » de conflit humain oĂč rĂ©flexion et imagination se substituent Ă  la force physique. La seule blessure possible pourrait ĂȘtre de nature narcissique mais les joueurs chevronnĂ©s lui prĂ©fĂšrent la beautĂ© de l’exercice.
  • Tous les conflits de la vie rĂ©elle de type jeux stratĂ©giques : compĂ©tition Ă©conomique, bataille Ă©lectorale, diplomatie internationale avec ses alliances, ses trahisons et ses opĂ©rations coups de poing.

Ainsi, comme un jeu, la guerre au sens de Clausewitz (continuitĂ© de la diplomatie) a ses rĂšgles, les camps adverses dĂ©veloppent chacun leur stratĂ©gie dans le but de la gagner. Cette idĂ©e de protocole (rĂšgles, stratĂ©gies) associĂ© Ă  la guerre est Ă  l’origine de vifs dĂ©bats. De lĂ  Ă  en dĂ©duire qu’il puisse exister une « guerre civilisĂ©e » (voir les interrogations du prince Andrei, dans Guerre et paix de TolstoĂŻ), il n’y a parfois qu’un pas. Tuer par haine ou passion est–il plus excusable que tuer selon un protocole ? Anatol Rapoport souligne que « l’objet de tout jeu est de gagner au moindre coĂ»t possible, donc sans guerre ». Il s’appuie sur le thĂ©orĂšme du minimax (soit trouver la meilleure stratĂ©gie en se basant sur des considĂ©rations rationnelles).

3. Le débat

  • conflit de persuasion et non plus un conflit analogue Ă  un jeu de stratĂ©gie.
  • dans lequel pour convaincre, il faut conduire l’adversaire Ă  vous Ă©couter soit en profitant de sa capacitĂ© Ă  imiter les autres (donc vous) soit en Ă©clairant l’avantage qu’il tirerait Ă  faire ce qui vous voulez qu’il fasse.

En résumé, Rapoport distingue trois modes de conflit avec trois buts différents :

  • dans un combat le but est d’éliminer son adversaire
  • dans un jeu de stratĂ©gie, le but est d’ĂȘtre plus malin que son adversaire,
  • dans un dĂ©bat il s’agit de convaincre son adversaire.

Exemples :

  • NĂ©gociations commerciales (de l’OMC etc.)
  • NĂ©gociations climatiques

Outils « vulgarisés » par la théorie des jeux

Définition du jeu et présentation des types de jeux

Un jeu est une interaction stratégique entre deux entités.

Les principales typologies de jeu sont les suivantes :

  • des jeux Ă  somme nulle (ce qu’un joueur gagne, son adversaire le perd), qui furent les premiers Ă©tudiĂ©s par John von Neumann et Oskar Morgenstern (VNM) dĂšs 1944 et des jeux Ă  somme non nulle (ex : dilemme du prisonnier)
  • des jeux coopĂ©ratifs (dans lesquels les joueurs peuvent communiquer entre eux) et des jeux non coopĂ©ratifs (dans lesquels les joueurs sont interrogĂ©s sĂ©parĂ©ment et ne peuvent pas communiquer entre eux)

On distingue à ce niveau deux sous-catégories selon que les jeux sont dynamiques ou non:

  • des jeux simultanĂ©s
  • des jeux sĂ©quentiels

La notion de jeux simultanés ou jeux séquentiels introduit une dynamique temporelle.

Nature de l’information disponible pour les joueurs

Le type d’information dont disposent les joueurs lors du jeu est crucial. Cette information peut ĂȘtre de deux types :

  • une information parfaite lorsque le joueur est parfaitement informĂ© des actions passĂ©es des autres joueurs, elle est imparfaite dans le cas contraire

Ex : Aux Ă©checs, les joueurs ont une information parfaite. Chaque joueur voit l’échiquier et peut retenir les actions de son adversaire.

  • une information incomplĂšte si au moins un des joueurs ne connaĂźt pas parfaitement la structure du jeu, elle est complĂšte dans le cas contraire.

Les premiers jeux étudiés (par von Neumann et Morgenstern) furent des jeux à information complÚte.

Ex : Au poker, l’information des joueurs est incomplĂšte. Les joueurs cachent leurs cartes et sont susceptibles de bluffer. Par la suite, la pertinence de cette hypothĂšse d’information complĂšte a Ă©tĂ© remise en question. Les modĂšles sont devenus plus complexes (John Harsanyi (1966), Reinhard Selten (1975)).

Stratégie pure et stratégie mixte

D’une maniĂšre gĂ©nĂ©rale, « une stratĂ©gie d’un joueur doit spĂ©cifier une action pour ce joueur chaque fois qu’il est susceptible de jouer (s’il joue, par exemple, Ă  plusieurs tours du jeu, nous devons spĂ©cifier une action pour chacun des tours» (Yildizoglu, 2003)

  • Profil de rĂ©sultat

Un profil de stratégies (ou résultat) « spécifie un déroulement complet du jeu en précisant une stratégie par joueur » (ibid.).

Il existe deux types de stratégies :

  • StratĂ©gie pure

Une stratĂ©gie pure est constituĂ©e d’une action pure. Exemple : entrer ou non sur un marchĂ©.

Une stratĂ©gie mixte, si, d’un joueur i est dĂ©finie comme suit :

 si=∑α Ciα∏iα avec Ciα>0 et ∑αCiα=1 et oĂč ∏iα est une αiĂšme stratĂ©gie pure du joueur i

Exemple : {Entrer ou non sur un marché} + {Produire ou non sur ce marché}

Issue du jeu et prĂ©diction de l’issue du jeu

von Neumann et Morgenstern ont introduit la fonction d’utilitĂ© pour attribuer un nombre Ă  chaque consĂ©quence relative au choix de l’un des joueurs. Elle suppose la rationalitĂ© des acteurs.

PrĂ©diction de l’issue du jeu

John Nash (1950) a caractĂ©risĂ© l’issue du jeu. L’équilibre de Nash se dĂ©finit comme un ensemble de stratĂ©gies (une par joueur) tel qu’aucun joueur ne puisse obtenir un gain supplĂ©mentaire en changeant unilatĂ©ralement de stratĂ©gie. Il est utilisĂ© pour dĂ©terminer l’issue des jeux Ă  information complĂšte statique ou dynamique. Cet Ă©quilibre renvoie Ă  un critĂšre « d’absence de regret ».

Le thĂ©orĂšme d’existence de l’équilibre de Nash postule que tout jeu fini admet au moins un Ă©quilibre de Nash (et Ă©ventuellement en stratĂ©gies mixtes).

Une extension de l’équilibre de Nash est l’équilibre bayĂ©sien (Thomas Bayes). Celui-ci est utilisĂ© pour dĂ©terminer l’issue de jeux, statiques ou dynamiques, Ă  information incomplĂšte. Il est dĂ©fini comme un ensemble de stratĂ©gies (une par joueur) et un systĂšme de croyances (c’est-Ă -dire des probabilitĂ©s affectĂ©es Ă  la rĂ©alisation de chaque valeur possible des paramĂštres inconnus du jeu) associĂ©es Ă  ces stratĂ©gies tels que, Ă  chaque Ă©tape du jeu :

  • aucun joueur n’a intĂ©rĂȘt Ă  changer de stratĂ©gie Ă©tant donnĂ© les stratĂ©gies des autres joueurs et le systĂšme de croyances, etc.
  • les croyances sont dĂ©duites des stratĂ©gies d’équilibre et des actions observĂ©es en appliquant la rĂšgle de Bayes[8] (Eber, 2004).

Le thĂ©orĂšme d’existence de l’équilibre bayĂ©sien postule que tout jeu dynamique fini Ă  information incomplĂšte admet au moins un Ă©quilibre bayĂ©sien parfait.

En résumé :

Jeu statique Jeu dynamique
Information complùte Équilibre de Nash Équilibre de Nash parfait en sous-jeux
Information incomplĂšte Équilibre bayĂ©sien Équilibre bayĂ©sien parfait (ou Ă©quilibre sĂ©quentiel)

Représentation du jeu

Il existe deux principales formes de représentation du jeu employées par von Neumann et Morgenstern :

  • une forme normale c’est-Ă -dire sous la forme d’un tableau ou d’une matrice reprĂ©sentant les gains de joueurs,
  • une forme dite extensive c’est-Ă -dire sous la forme d’un arbre (arbre de Kuhn, 1953).

L'arborescence pose un problÚme. Sa forme peut induire en erreur. Elle suggÚre, par sa forme, que les actions des joueurs sont séquentielles. Mieux vaut utiliser une matrice pour représenter des actions simultanées et éviter toute confusion.

Les travaux de J. von Neumann & O. Morgenstern (VNM) - Jeux Ă  somme nulle
  • Jeu Ă  somme nulle

Le jeu Ă  somme nulle a Ă©tĂ© le premier Ă  ĂȘtre Ă©tudiĂ© (thĂ©orĂšme du minimax) de J. von Neumann. Dans un tel jeu, ce qu’un joueur gagne, son adversaire le perd. La somme des « payoffs » (ou rĂ©sultats du jeu) est toujours nulle.

Rappel au sujet du thĂ©orĂšme du minimax de J. von Neumann : ce thĂ©orĂšme dit que dans tout jeu Ă  somme nulle, il existe une stratĂ©gie meilleure pour chaque adversaire, et garantissant – au moins sur le long terme- que celui qui la choisira gagnera autant qu’il est possible de gagner avec les rĂšgles du jeu existantes.

NĂ©anmoins, ces jeux Ă  somme nulle ignorent le concept d’intĂ©rĂȘt personnel ou collectif (exemple : choix d’une solidaritĂ© basĂ©e sur l’intĂ©rĂȘt collectif) ce qui revient alors Ă  faire intervenir un troisiĂšme joueur qui transforme alors le jeu Ă  somme nulle en jeu Ă  somme non nulle (voir ci-aprĂšs).

  • Jeu Ă  somme non nulle
  1. Le « dilemme du prisonnier », le plus cĂ©lĂšbre « Le dilemme du prisonnier incarne l’idĂ©e fondamentale (notamment en Ă©conomie) selon laquelle la confrontation des intĂ©rĂȘts individuels ne dĂ©bouche pas nĂ©cessairement sur l’optimum collectif » (Eber 2004).

À l’origine, il s’agit d’un jeu expĂ©rimental, proposĂ© par deux mathĂ©maticiens Melvin Dresher et Merrill Flood en . M. Dresher et M. Flood cherchaient, Ă  l’époque, Ă  Ă©valuer la robustesse du concept d’équilibre de leur collĂšgue J. Nash. Mais Alfred Tucker, un autre mathĂ©maticien, popularisera ce jeu en le nommant « dilemme du prisonnier », lors d’un sĂ©minaire au dĂ©partement de psychologie de l’[universitĂ© Stanford] en :

« Deux hommes, accusĂ©s d’avoir conjointement enfreint la loi, sont dĂ©tenus sĂ©parĂ©ment par la police. Chacun est informĂ© que : 1. si l’un des deux avoue et que l’autre non, le premier aura une rĂ©compense (payoff +1) alors que le second sera lourdement condamnĂ© (payoff -2), 2. si les deux avouent, ils subiront tous les deux une peine lĂ©gĂšre (payoff -1) ; en mĂȘme temps chacun a de bonnes raisons de croire que 3. si aucun des deux n’avouent, chacun repartira libre. » (Tucker, 1950)

La formulation originale du dilemme du prisonnier a donc la structure suivante :

prisonnier 1 prisonnier 1
avoue (A) n'avoue pas (NA)
prisonnier 2 avoue (A) -1, -1 -2, +1
prisonnier 2 n'avoue pas (NA) +1, -2 0, 0

Ce jeu est un jeu à deux personnes, symétrique, à somme non nulle non coopératif (les deux prisonniers ne peuvent communiquer). Chaque joueur dispose de deux stratégies pures : avouer (A) ou ne pas avouer (NA).

À noter que la stratĂ©gie A est une stratĂ©gie dominante pour les deux prisonniers. Par consĂ©quent, le seul Ă©quilibre de Nash du jeu est le couple de (A ; A) qui entraĂźne une peine lĂ©gĂšre (payoff -1) pour les deux prisonniers. En outre, si les deux prisonniers avaient coopĂ©rĂ©, ils seraient repartis libres.

Le dilemme rĂ©side dans le fait que la situation de chacun des prisonniers est meilleure si aucun des deux n’avoue, mais aucun des deux ne prendra le risque d’avouer, car chacun sait que s’il n’avoue pas, l’intĂ©rĂȘt de l’autre sera d’avouer.

  1. Transformation simple d’un jeu à somme non nulle en jeu à somme nulle

Dans le dilemme du prisonnier prĂ©cĂ©demment dĂ©crit, si un joueur tiers intervenait (l’État par ex.), le jeu deviendrait un jeu Ă  somme nulle (et Ă  trois joueurs). Il n’aurait pas Ă  choisir c’est-Ă -dire n’aurait qu’une seule stratĂ©gie mais recevrait les « payoffs » suivants :

prisonnier 1 prisonnier 1
avoue (A) n'avoue pas (NA)
prisonnier 2 avoue (A) 2 1
prisonnier 2 n'avoue pas (NA) 1 0

RĂ©fĂ©rence: Tucker A. W., (1983), “The Mathematics of Tucker: A Sampler”, The Two-Year College Mathematics Journal, Vol. 14, No. 3. (June., 1983), p. 228-232.

John von Neumann avait juste soulignĂ©, sans l’approfondir, ce phĂ©nomĂšne dans son traitement du jeu de coalition Ă  trois personnes. Cette composante ou « norme sociale » - c’est-Ă -dire ce qui est considĂ©rĂ© comme juste et non gagnant par les joueurs - force l’issue du jeu Ă  deux joueurs et somme nulle.

Ce jeu de coalition, au sens oĂč il a Ă©tĂ© classiquement prĂ©sentĂ© par VNM (1944), est un jeu Ă  information complĂšte et somme nulle oĂč une coalition de joueurs, S, et N\S un ensemble des joueurs n’appartenant pas Ă  cette coalition cherchent respectivement Ă  maximiser leur payoff et Ă  maintenir le payoff de S Ă  son plus bas niveau. En l’absence de coalition, chaque participant agit indĂ©pendamment des autres, sans collaboration ou communication avec eux.

Tous les problĂšmes de formation de coalition sont essentiellement des problĂšmes de nĂ©gociations qui n’entrent pas dans le cadre Ă©laborĂ© par John von Neumann.

Ils ont largement Ă©tĂ© Ă©tudiĂ©s par d’autres. Ils font intervenir des dimensions psychologiques (confiance, doute, conscience d’un intĂ©rĂȘt collectif, susceptibilitĂ© ou immunitĂ© vis-Ă -vis des menaces etc.) qui ont Ă©largi le champ de la thĂ©orie des jeux. L’armĂ©e, peu habituĂ©e, Ă  utiliser ces notions s’y est, en particulier, beaucoup intĂ©ressĂ©e par la suite.

  1. Jeu non coopératif ou jeu de négociation

La nĂ©gociation est une situation frĂ©quente dans la rĂ©alitĂ© et a Ă©tĂ© particuliĂšrement Ă©tudiĂ©e par les Ă©conomistes de la thĂ©orie des jeux, J.F Nash, J.C. Harsanyi, R.Selten, etc. pour rĂ©soudre des problĂšmes d’échange. Historiquement, les travaux se sont basĂ©s bien Ă©videmment sur les contributions de VNM. Puis le concept d’équilibre de Nash en information complĂšte et le concept d’équilibre bayĂ©sien en information incomplĂšte ont reflĂ©tĂ© respectivement le souci de dĂ©terminer l’état d’équilibre de ce type de jeux et de reprĂ©senter mathĂ©matiquement l’asymĂ©trie d’information inhĂ©rente aux Ă©changes quels qu’ils soient. Enfin, Selten et d’autres ont introduit une dynamique temporelle en information complĂšte ou incomplĂšte dans l’analyse de situations d’interactions d’acteurs.

1. Jeux statiques * Cas oĂč l’information est complĂšte Dans « Non-cooperative games », J.F. Nash, dĂšs 1950, a proposĂ© une nouvelle approche pour traiter aussi les problĂšmes Ă©conomiques classiques de nĂ©gociation et non pas seulement les jeux (Ă©checs, poker etc.). Il propose un modĂšle de jeu fini Ă  deux (n) personnes, Ă  information complĂšte et dĂ©montre qu’il existe au moins un Ă©quilibre ('Nash equilibrium') de ce type dans ce jeu fini Ă  n personnes, Ă  information complĂšte.

Point d’équilibre Un point d’équilibre est un profil de stratĂ©gies tel que chaque agent propose sa meilleure stratĂ©gie Ă  l’autre Nash dĂ©montre l’existence d’un au_ moins un Ă©quilibre correspondant aux meilleures rĂ©ponses possibles de chaque joueur ou Ă©quilibre de Nash.

ModĂ©lisation de l’information complĂšte IdĂ©alement, chaque personne a un comportement trĂšs rationnel ; chacune peut comparer prĂ©cisĂ©ment ses dĂ©sirs pour diffĂ©rentes choses, chacune a les mĂȘmes qualitĂ©s de nĂ©gociateur que l’autre et enfin chacune connaĂźt complĂštement les goĂ»ts et prĂ©fĂ©rences de l’autre. Pour traiter mathĂ©matiquement ce problĂšme, J.F. Nash emploie la notion d’utilitĂ© qu’il lie au concept d’anticipation afin d’exprimer les prĂ©fĂ©rences (Ă©lĂ©ment manquant et critiquĂ© dans le modĂšle de VNM) de joueurs engagĂ©s dans le processus de nĂ©gociation.

UtilitĂ© : « Le joueur 1 prĂ©fĂšre A Ă  B » se traduira par u1 (A) > u1 (B). Ainsi dans l’exemple ci-dessous, les utilitĂ©s attendues de Bill et Jack pour l’échange d’objets personnels sont les suivantes :

(insertion tableau) Ref: Nash J. F., , « The Bargaining Problem », Econometrica, Vol. 18, No. 2., p. 155-162.

S’il existe un objet ou un montant Ă  Ă©changer, la coopĂ©ration peut se faire. Dans l’exemple ci-dessus, la solution (« Nash bargaining solution ») consiste Ă  une nĂ©gociation sous forme de troc pour lequel la somme des utilitĂ©s des joueurs est maximale et idĂ©alement avec un profit Ă©gal pour chacune des parties. Ainsi, Bill Ă©changera son chapeau contre un fouet ou une batte de base ball Ă  Jack.

* Cas oĂč l’information est incomplĂšte AprĂšs Nash, les apports ont Ă©tĂ© nombreux pour raffiner le modĂšle. En particulier l’hypothĂšse d’information complĂšte a Ă©tĂ© modifiĂ©e pour reflĂ©ter la rĂ©alitĂ©. Harsanyi (1966) a Ă©tendu le modĂšle de Nash Ă  des jeux Ă  information incomplĂšte notamment en modĂ©lisant les prĂ©fĂ©rences des joueurs Ă  l’aide de distributions de probabilitĂ© et en lui associant la notion d’équilibre bayĂ©sien.

Il est dĂ©fini comme un ensemble de stratĂ©gies (une par joueur) et un systĂšme de croyances (c’est-Ă -dire des probabilitĂ©s affectĂ©es Ă  la rĂ©alisation de chaque valeur possible des paramĂštres inconnus du jeu) associĂ©es Ă  ces stratĂ©gies tels que, Ă  chaque Ă©tape du jeu :

  • aucun joueur n’a intĂ©rĂȘt Ă  changer de stratĂ©gie Ă©tant donnĂ© les stratĂ©gies des autres joueurs et le systĂšme de croyances etc.
  • les croyances sont dĂ©duites des stratĂ©gies d’équilibre et des actions observĂ©es en appliquant la rĂšgle de Bayes (Eber, 2004).

Le thĂ©orĂšme d’existence de l’équilibre bayĂ©sien postule que tout jeu dynamique fini Ă  information incomplĂšte admet au moins un Ă©quilibre bayĂ©sien parfait.

2. Jeux dynamiques

* Cas oĂč l’information est complĂšte Selten (1975) a introduit la notion de sous-jeu et a permis d’introduire une dynamique dans les jeux non coopĂ©ratifs de Nash grĂące Ă  l’idĂ©e que dans une forme extensive du jeu, les Ă©quilibres qui imposent des menaces ou des promesses non crĂ©dibles (« trembling hand perfection ») doivent ĂȘtre Ă©liminĂ©s. Il applique sa thĂ©orie Ă  l’exemple des barriĂšres Ă  l’entrĂ©e.

La coopĂ©ration en thĂ©orie des jeux Van Damme et Furth (2002) soulignent que la terminologie de « jeux coopĂ©ratifs ou non » peut conduire Ă  des confusions. Le terme de jeu coopĂ©ratif ne signifie pas que les joueurs ne souhaitent pas coopĂ©rer et qu’ils coopĂšrent automatiquement dans un jeu coopĂ©ratif. « La diffĂ©rence [
] rĂ©side dans le niveau de dĂ©tail du modĂšle ; les modĂšles non coopĂ©ratifs supposent que toutes les possibilitĂ©s pour une coopĂ©ration sont incluses comme des mouvements formels dans le jeu tandis que les modĂšles coopĂ©ratifs sont ‘’incomplets’’ et permettent aux joueurs d’agir hors des rĂšgles dĂ©taillĂ©es qui ont Ă©tĂ© spĂ©cifiĂ©es ».

Les relations internationales s’apparentent Ă  des relations de coopĂ©ration/ dissuasion c’est pourquoi les principaux rĂ©sultats de thĂ©orie des jeux ayant trait Ă  la coopĂ©ration sont rappelĂ©s ci-dessous :

  • Le dilemme du prisonnier, une seule fois « jouĂ© », conclut qu’aucun agent ne coopĂ©rera.
  • Infiniment rĂ©pĂ©tĂ© ou rĂ©pĂ©tĂ© de façon fini, le dilemme du prisonnier peut trouver un Ă©quilibre dans lequel les deux agents coopĂšrent.

* Le « dilemme du prisonnier » avec itération Le dilemme du prisonnier a été largement repris par différentes disciplines scientifiques. Les théoriciens des jeux (P. Milgrom, 1984) retiennent les points suivants :

  • il existe un unique Ă©quilibre de Nash qui implique une dĂ©mission mutuelle (les deux prisonniers avouent),
  • la coopĂ©ration peut ĂȘtre un Ă©quilibre
    • si le jeu est rĂ©pĂ©tĂ© infiniment - « dilemme du prisonnier » rĂ©pĂ©tĂ© Ă  l’infini - plusieurs fois sans trop de remise sur le partage (Rubinstein, 1980)
    • ou si le jeu est rĂ©pĂ©tĂ© un nombre fini - « dilemme du prisonnier » de façon finie - de fois et si les joueurs ne connaissent pas les motivations ou les stratĂ©gies des autres joueurs (Kreps, Milgrom, Roberts and Wilson (1982).

* Le « dilemme du prisonnier » selon une perspective « Ă©volutionnaire Dans une perspective Ă©volutionnaire, la propriĂ©tĂ© de stabilitĂ© de l’équilibre de Nash est analysĂ©e. L’équilibre est stable quand, une fois l’équilibre ou la rĂšgle de comportement sont dĂ©finis, personne n’a intĂ©rĂȘt Ă  changer la rĂšgle ou l’équilibre.

Ainsi, Robert Axelrod, dans son ouvrage “The Evolution of Cooperation” (1984), s’interroge de la maniĂšre suivante: "Under what conditions will cooperation emerge in a world of egoists without central authority?”. Il teste non seulement la stabilitĂ© de l’équilibre mais aussi l’évolution de la coopĂ©ration.

« Stratégie gagnant-gagnant », un modÚle philosophique attirant

Robert Axelrod, dans son ouvrage “The Evolution of Cooperation” (1984), cherche Ă  rĂ©pondre Ă  la question suivante: "Under what conditions will cooperation emerge in a world of egoists without central authority?” Pour tester la stabilitĂ© de cet Ă©quilibre, R. Axelrod demande Ă  des collĂšgues, qui ont Ă©tudiĂ© le dilemme du prisonnier dans leurs diffĂ©rentes disciplines (psychologie, biologie, Ă©conomie, physique, mathĂ©matique, science politique, sociologie etc.), de proposer un programme, qu’ils estiment susceptible de remporter le plus de points, pour jouer Ă  un jeu du dilemme du prisonnier rĂ©pĂ©tĂ© 200 fois. Chaque programme contient la stratĂ©gie d’un joueur. Le jeu s’apparente Ă  un tournoi dans lequel chaque stratĂ©gie est confrontĂ©e Ă  tous les autres, Ă  lui-mĂȘme et Ă  un programme alĂ©atoire jouant au hasard. Le programme vainqueur est celui totalisant le plus de points. Le premier tournoi impliquant 14 programmes donna le programme « gagnant-gagnant » ou « Tit for Tat » d’Anatol Rapoport vainqueur. R. Axelrod dĂ©cide de renouveler l’expĂ©rience avec 62 programmes et de nouveau le programme gagnant-gagnant d’A.Rapoport l’emporte. Or la stratĂ©gie « gagnant-gagnant » ou « Tit for Tat » d’A. Rapoport n’emporte aucun match du tournoi ! R. Axelrod (1984) (1) en dĂ©duit, que « [le dilemme du prisonnier] est simplement une formulation abstraite de quelques situations trĂšs courantes et intĂ©ressantes dans lesquelles ce qui est le meilleur pour une personne individuellement conduit Ă  une situation d’échec mutuel tandis que chacune pourrait mieux s’en tirer avec une coopĂ©ration mutuelle ». L’interprĂ©tation de ces rĂ©sultats qui impliquent la supĂ©rioritĂ© du comportement coopĂ©ratif dans un environnement de dilemmes du prisonnier rĂ©pĂ©tĂ©s a Ă©tĂ© sujette Ă  de nombreuses discussions. Selon Eber (2004), les rĂ©sultats d’Axelrod montrent que, dans un monde de conflits permanents, il serait « optimal » de se comporter de la façon suivante:

  • « ĂȘtre a priori coopĂ©ratif avec les autres (jouer [la stratĂ©gie de coopĂ©ration (C)] lors du premier dilemme du prisonnier auquel on se trouve confrontĂ©),
  • punir son partenaire lorsqu’il n’a pas coopĂ©rĂ© (jouer [la stratĂ©gie de non-coopĂ©ration (D)] chaque fois que le joueur Ă  jouer D au tour prĂ©cĂ©dent)
  • pardonner et revenir Ă  la coopĂ©ration lorsque le partenaire se remet Ă  coopĂ©rer (jouer C Ă  chaque fois qu’il a jouĂ© C le coup prĂ©cĂ©dent) ».

Cette philosophie politique, certes plaisante, est trÚs débattue. Les conclusions auxquelles Axelrod aboutit sont en particulier liées à la simplification du modÚle comparé à la situation réelle analysée.

RĂ©fĂ©rence : Milgrom P. R. (1984), “Book review: Axelrod's "The Evolution of Cooperation" The Evolution of Cooperation. R. Axelrod” Review author[s]: Paul R. Milgrom, The RAND Journal of Economics, Vol. 15, No. 2. (Summer, 1984), p. 305-309.

Jeux non coopératifs, principalement utilisés pour étudier les relations internationales Les relations internationales ont été largement étudiées par les théoriciens des jeux (Rapoport, Guyer, Hamburger 1966-1969) et la pertinence des jeux non coopératifs 2x2 et de leur équilibre de Nash a été précisément vérifiée pour ces études (C. Schmidt) par Brams, Hessel, Wittman 1977-1984).

Corollaire Les relations internationales seront principalement dĂ©crites Ă  l’aide de jeux Ă  somme non nulle coopĂ©ratifs selon les situations.

Appropriations dans le cadre de travaux sur les négociations internationales

Les exemples trouvĂ©s Ă  partir de faits politiques et traduisant un Ă©tat des relations internationales permettront d’illustrer celles-ci avec le vocabulaire de la thĂ©orie des jeux.

La dissuasion nucléaire

Une dissuasion est un jeu dans lequel aucun des deux États, n’a intĂ©rĂȘt Ă  se lancer dans l’action car les dĂ©gĂąts seraient trop importants (destruction mutuelle assurĂ©e ou MAD) ni n’a intĂ©rĂȘt Ă  renoncer car sinon deviendrait vulnĂ©rable. L'Ă©quilibre de la terreur pendant la guerre froide causĂ© par la prolifĂ©ration des armes de destruction massive en est l'illustration la plus parlante. Les doctrines les plus reprĂ©sentatives en matiĂšre de stratĂ©gie nuclĂ©aire sont la doctrine Dulles, ou doctrine des reprĂ©sailles massives, et la doctrine Mac Namara. La premiĂšre fut la doctrine nuclĂ©aire amĂ©ricaine de 1953-54 Ă  1962 (oĂč elle fut remplacĂ©e par la doctrine MacNamara de riposte graduĂ©e). La doctrine nuclĂ©aire Dulles, extrĂȘmement rigide, avait un principe simple : toute attaque soviĂ©tique contre un pays membre de l'OTAN exposait l'URSS Ă  des reprĂ©sailles nuclĂ©aires massives sur ses villes, sans prĂ©avis et sans retenue. En 1962, la doctrine MacNamara (ou doctrine de la riposte graduĂ©e) devient la ligne gĂ©opolitique choisie par les AmĂ©ricains en matiĂšre de stratĂ©gie nuclĂ©aire : elle implique un recours progressif et adaptĂ© aux armes de destruction massive. Robert McNamara, secrĂ©taire d'Ă©tat dans l’Administration Kennedy, veut s’écarter de la prĂ©cĂ©dente doctrine Dulles, dite des reprĂ©sailles massives. Dans le cas oĂč la dissuasion Ă©chouerait, refusant une stratĂ©gie nuclĂ©aire apocalyptique, il cherche un moyen de poursuivre des nĂ©gociations pour mettre fin au conflit, mĂȘme aprĂšs une premiĂšre utilisation d’armes nuclĂ©aires.

Deux types de dissuasion existent :

Le rapport de forces entre les États sera dĂ©terminant.

Ci-dessous quelques exemples :

Le coĂ»t Ă©conomique nĂ©cessaire pour possĂ©der l’arme nuclĂ©aire Ă©tant infĂ©rieur au coĂ»t de destruction, le jeu est gagnant en termes de coĂ»t de destruction mais en coĂ»t absolu (indĂ©pendamment des retombĂ©es civiles) l’avantage est moins net. La paix est Ă  ce prix.

Exemple du jeu de la poule mouillée (Eber 2004)

La matrice des gains de ce jeu est la suivante (matrice no 1) :

Exemple de la crise des missiles de Cuba en .
joueur 1 joueur 1
A B
joueur 2 A 0, 0 +1, -2
joueur 2 B -2, +1 -8, -8

Les joueurs 1 et 2 Ă©tant Khrouchtchev et Kennedy, chacun menace l’autre d’utiliser l’arme nuclĂ©aire. Cette menace est peu crĂ©dible mais aucun des protagonistes ne veut perdre la face. Le gouvernement Kennedy en rĂ©ponse Ă  la menace russe d’installer des missiles Ă  Cuba menace Ă  son tour l’URSS de guerre nuclĂ©aire (stratĂ©gie agressive B) plutĂŽt que d’accepter l’installation des missiles (stratĂ©gie conciliante A). Khrouchtchev peut soit surenchĂ©rir (B) ou cĂ©der Ă  la pression amĂ©ricaine (A). Il a choisi la seconde solution.

Origine de l’appellation "jeu de la poule mouillĂ©e" Ce jeu fait rĂ©fĂ©rence Ă  un « jeu » trĂšs Ă  la mode dans les annĂ©es 1950 et mis en scĂšne dans le film « La fureur de vivre ». Deux automobilistes roulent en sens inverse dans une rue Ă©troite, le perdant qualifiĂ© de « poule mouillĂ©e » est celui qui donne un coup de volant pour monter sur le trottoir et Ă©viter son concurrent. Ce jeu reprĂ©sente bien des situations de crise dans le domaine des relations internationales.

A correspond à monter sur le trottoir et B à continuer tout droit. Les joueurs ne peuvent communiquer. Ils jouent simultanément.

(A, A) : les deux joueurs s’évitent et montent sur le trottoir simultanĂ©ment. Il n’y a ni gagnant ni perdant, payoffs nuls. (B, B) : les deux joueurs continuent tout droit et ont un accident d’oĂč les « payoffs » nĂ©gatifs Ă©levĂ©s. (B, A) ou (A, B) : l’un de deux s’écarte et perd la face (payoff de -2) tandis que l’autre l’emporte (payoff de 1).

Notion de crise internationale appliquée aux relations internationales (C. Schmidt, 1994)

C. Schmidt utilise les outils de la théorie des jeux et en particulier les jeux 2x2 non coopératifs pour comprendre les processus de décision dans les crises internationales. Trois sources principales de crise sont identifiées par C. Schmidt:

  • « un manque de discrimination parmi les stratĂ©gies disponibles sur les bases d’un choix rationnel
  • une ambiguĂŻtĂ© sur le cadre de la situation
  • une mauvaise interprĂ©tation du jeu rĂ©el par les joueurs ».

La matrice utilisĂ©e pour dĂ©crire une crise internationale est un prototype (matrice 1 ci-dessous). À partir de celle-ci, C. Schmidt dĂ©montre Ă  partir de rĂ©sultats expĂ©rimentaux que, selon le traitement des prĂ©fĂ©rences des pays en prĂ©sence, l’issue est diffĂ©rente.

Selon C. Schmidt, cette matrice est un prototype pour trois raisons :

  1. elle couvre tous les types de combinaison d’intĂ©rĂȘts entre le pays I et le pays II
  2. de nombreuses interprĂ©tations de celle-ci peuvent ĂȘtre trouvĂ©es dans le champ des relations internationales telles que :
    1. Ex : La crise nuclĂ©aire amĂ©ricano-soviĂ©tique pendant la guerre froide. Les États-Unis (I) et l’Union SoviĂ©tique (II) ont deux actions alternatives : (a1, a2) signifie « attaque » et (b1, b2) signifie « n’attaque pas » (en ne considĂ©rant qu’un coup).
    2. Ex : Un dilemme de coopération dans plusieurs cas (Axelrod, 1984) avec (a1, a2) signifie « défaite » et (b1, b2) signifie « coopÚre ».
  3. Toutes les sources de crise, citées ci-dessus, ont toutes une solution.

Sous l’hypothĂšse d’indĂ©pendance des prĂ©fĂ©rences des pays, l’addition de joueurs aux deux premiers ne modifie pas la structure du jeu.

Analyse de la matrice 1 Les deux pays connaissent toutes les rĂšgles du jeu, leurs propres prĂ©fĂ©rences et les consĂ©quences de chacune sur les actions possibles sur les prĂ©fĂ©rences de l’autre. Dans ce jeu, l’information est donc complĂšte.

Ce jeu a deux propriétés intéressantes :

  • chacune des quatre issues possibles est un Ă©quilibre de Nash
  • aucune des actions possibles ne conduit Ă  une stratĂ©gie dominante.

Celles-ci renseignent sur la signification de la crise replacĂ©e dans un contexte international et de jeu non-coopĂ©ratif : les rĂšgles du jeu bloquent l’ensemble du processus de prise de dĂ©cision rationnel. Le choix de l’issue dĂ©pend uniquement de la stratĂ©gie choisie par l’autre joueur. Si le pays II choisit d’attaquer (a2) le gain du pays I sera le mĂȘme quel que soit son choix (et rĂ©ciproquement).

Changement de configuration initiale de la crise Si l’on change la configuration initiale de la crise, la situation de crise peut ĂȘtre amĂ©liorĂ©e c’est-Ă -dire rĂ©solue de deux façons

  • en introduisant des menaces dans le jeu: perspective de dissuasion (Nash) ; voir matrice no 2
pays 1 pays 1
A B
joueur 2 A 0, 0 0, 0
joueur 2 B 0, 0 1, 1

matrice 2 oĂč B correspond Ă  une stratĂ©gie d’attaque et A Ă  une stratĂ©gie pacifique (opposĂ©e)

  • ou en supposant la connaissance d’une information additionnelle hors du jeu : perspective de coordination (Schelling, 1960).

La littérature sur les modÚles de dissuasion appliqués aux relations internationales grùce à la théorie des jeux est abondante (Brams 1985 ; Rudnianski 1986, 1991 ; Powell 1990).

Rapport de protectionnisme

Le protectionnisme permet de gagner une protection (constitution d’une rente, etc.) au dĂ©triment d’une dynamique Ă©conomique de l’économie de marchĂ©. Ce rapport s’apparente Ă  une sorte de thĂ©orie du cartel. Le protectionnisme est « une sorte de cartel public ».

Dans ce type de rapport, deux figures classiques sont possibles :

  • le tricheur qui rompt l’accord pour en tirer un avantage sachant que les autres ne le font pas (ex : dumping avec triche sur les quantitĂ©s ou sur les prix)
  • le franc-tireur qui refuse l’accord mais en tire un avantage (exemple du Mexique vis-Ă -vis de l'OPEP : L’OPEP garantit un cours de brut et le Mexique, non membre de l’OPEP et pĂ©trolier, se positionne par rapport Ă  ce cours)

Le problĂšme de la guerre commerciale (Paul Krugman & Maurice Obstfeld, 2001)

Dans les annĂ©es 1980, les États-Unis demandĂšrent au Japon de limiter ses exportations de voitures vers les États-Unis au nom de la protection de l’industrie nationale. Le Japon accepta cette demande et la relance de l’industrie automobile amĂ©ricaine suivit. En revanche, il refusa de cĂ©der Ă  l’autre demande amĂ©ricaine concernant l’élimination des quotas sur la viande bovine et les citrons. Ces quotas obligeaient les consommateurs japonais Ă  acheter des produits domestiques plus chers que les produits amĂ©ricains.

Sans approfondir les politiques des deux protagonistes, ces faits illustrent les conflits commerciaux qui s’articulent autour de la problĂ©matique du libre-Ă©change : Faut-il favoriser le libre-Ă©change ? Nous ne dĂ©battrons pas ici des avantages (ou gains) et des inconvĂ©nients (ou pertes) et renverront le lecteur Ă  l’ouvrage de Krugman et Obstfeld, entre autres. En revanche, nous soulignerons l’importance croissante, depuis la fin de la seconde guerre mondiale, des nĂ©gociations internationales (commerciales ici) que cet exemple illustre.

La nĂ©gociation internationale peut Ă©viter une guerre commerciale. ConsidĂ©rons, en effet, les deux pays prĂ©cĂ©dents, les États-Unis et le Japon. Simplifions les faits relatĂ©s ci-dessus en les « rĂ©duisant » aux deux choix politiques suivants : libre-Ă©change ou protection. Supposons que, « de maniĂšre assez inhabituelle, les gouvernements sont suffisamment Ă©clairĂ©s sur les avantages qu’ils retirent des deux politiques pour leur attribuer une valeur numĂ©rique prĂ©cise» (Krugman & Obstfeld, 2001). Voir tableau ci-dessous.

Drapeau des États-Unis États-Unis
Libre-Ă©change Protectionnisme
Drapeau du Japon Japon Libre-Ă©change 10 ; 10 - 10 ; 20
Protectionnisme 20 ; - 10 - 5 ; - 5


Les valeurs des gains de cette matrice correspondent aux deux hypothĂšses suivantes :

  • hypothĂšse « protectionniste » selon laquelle « le gouvernement de chaque pays choisirait la protection s’il pouvait considĂ©rer la politique du partenaire comme donnĂ©e »,

Selon la premiĂšre hypothĂšse, le gouvernement amĂ©ricain est dans une meilleure situation en optant pour le protectionnisme, ce quelle que soit la politique du Japon. Krugman & Obstfeld soulignent que cela n’est pas nĂ©cessairement vrai bien que beaucoup d’économistes soient favorables Ă  cette hypothĂšse en raison non seulement de l’intĂ©rĂȘt public. Mais les gouvernements ont leur propre intĂ©rĂȘt politique et « 
 [ils] trouvent souvent qu’il est politiquement difficile de refuser la protection Ă  certaines industries ».

  • hypothĂšse « libre-Ă©changiste » selon laquelle « mĂȘme si chaque gouvernement gagnait le plus en optant pour la protection, ils seraient et l’autre dans une meilleure situation s’ils choisissaient d’un commun accord le libre Ă©change ».

On notera qu’il s’agit de la matrice du dilemme du prisonnier. La situation la plus favorable Ă  chacun des pays est le protectionnisme : gain de +20 pour celui qui choisit la protection associĂ©e Ă  une perte de -10 si l’autre a optĂ© pour le libre Ă©change. Si les deux pays choisissent unilatĂ©ralement le protectionnisme, ils perdent chacun -5. Cependant la matrice montre qu’ils ont intĂ©rĂȘt Ă  se mettre d’accord pour le libre-Ă©change, ils sont tous les deux dans une meilleure situation (gain de +10 pour les deux). Cet exemple simplifiĂ© montre que la coordination est l’issue favorable.

Application aux négociations climatiques internationales

Le changement climatique représente probablement la menace environnementale la plus importante à laquelle l'humanité ait eu à faire face. Parmi ses facteurs aggravants, la longue réticence de ses acteurs à accepter les observations, ou encore l'importance des coûts qui y sont associés. L'urgence de l'action et de la coordination des pays est devenue une nécessité. Les négociations pour lutter contre le changement climatique sont liées à ses caractéristiques :

  • Le climat est un bien public mondial;
  • Le changement climatique est un phĂ©nomĂšne cumulatif et dont les effets sont Ă  trĂšs long terme voire irrĂ©versibles;
  • Le changement climatique va affecter de façon asymĂ©trique les rĂ©gions du monde : les pays en dĂ©veloppement vont davantage souffrir du changement climatique bien que les pays dĂ©veloppĂ©s soient historiquement en grande partie responsable de la concentration de GES dans l'atmosphĂšre dans le cadre de leur processus d'industrialisation.

La difficultĂ© Ă  obtenir un nombre de pays signataires suffisant au protocole de Kyoto et le retrait des États-Unis du protocole de Kyoto en 2001 a vu foisonner des articles de thĂ©orie des jeux appliquant la grille d'analyse traditionnelle aux nĂ©gociations climatiques internationales.

NĂ©gociations climatiques internationales et dilemme du prisonnier

Le problĂšme des Ă©missions de gaz Ă  effet de serre (GES) est une illustration typique de la tragĂ©die des biens communs (tragedy of the commons) de Hardin et peut ĂȘtre considĂ©rĂ© comme un dilemme du prisonnier (Barret, Carraro, Cesar, Ecchia et Mariotti) : l'impact de l'Ă©mission d'une tonne de GES est mondial, ce n'est ni une pollution locale, ni une pollution rĂ©gionale. Ainsi, tous les pays profitent des rĂ©ductions de GES effectuĂ©es par les autres pays, mais il n'existe pas, en dehors des mĂ©canismes mis en place dans le cadre du protocole de Kyoto, d'incitation Ă  rĂ©duire volontairement ses Ă©missions (Lise, Tol et van der Zwann, 2001).

Négociations climatiques internationales et jeux coopératifs

Il existe dans le cadre des négociations climatiques internationales des regroupements de pays :

Ainsi, les négociations climatiques internationales ont été analysées comme des jeux coopératifs par Carraro (1997), Botteon et Carraro (1998) et Carraro et Siniscalco (1997). Ils se sont notamment intéressés à la théorie de la stabilité du cartel en se concentrant sur les probabilités d'émergence d'accords climatiques internationaux (Lise, Tol et van der Zwann (2001)).

La théorie de la stabilité des cartels appliquée aux coalitions (d'Aspremont et Gabszewicz, 1986) permet d'obtenir un nombre de jeux finis de solutions. Les trois caractéristiques du cartel sont les suivantes :

  • StabilitĂ© interne du cartel : les rĂ©gions du cartel ont-elles intĂ©rĂȘt Ă  sortir du cartel? Le cartel est jugĂ© stable du point de vue interne si aucun membre de la coalition n'a intĂ©rĂȘt quitter le cartel pour redevenir un singleton.
  • StabilitĂ© externe du cartel : les rĂ©gions en dehors du cartel ont-elles intĂ©rĂȘt Ă  rejoindre le cartel? Le cartel est jugĂ© stable du point de vue externe si aucun singleton n'a intĂ©rĂȘt Ă  joindre le cartel.
  • ProfitabilitĂ© : Y a-t-il des gains additionnels pour les membres d'une coalition par rapport au cas oĂč il n'y aurait pas de coalition? Une coalition est jugĂ©e stable quand elle l'est de façon interne et externe.

La lecture des nĂ©gociations climatiques internationales Ă  la lumiĂšre des jeux coopĂ©ratifs a montrĂ© que seules les coalitions de taille modeste Ă©taient stable et que si une coopĂ©ration complĂšte (optimum social) permet un bien-ĂȘtre considĂ©rable par rapport Ă  pas de pas coopĂ©ration du tout (Ă©quilibre de Nash), les coalitions stables ne permettant qu'un bien-ĂȘtre relativement faible (Dellink, von Ierland, Finus, 2003).

Des efforts de modélisation ont été également effectués : ainsi, Dellink, von Ierland, Finus (2003) modélisent la stabilité des coalitions pour douze régions du monde et montrent que des coalitions stables se forment si les gains consécutifs à la réduction des émissions de GES sont suffisamment élevés. Cependant, ces coalitions ne permettent d'obtenir qu'un équilibre marginalement supérieur à un équilibre de Nash.

Négociations climatiques internationales et jeux non-coopératifs

À l'inverse, Barret (1998) aborde les nĂ©gociations climatiques internationales en tant que jeux non-coopĂ©ratifs. Il montre les difficultĂ©s Ă  obtenir une coalition de pays suffisamment grande dans un jeu non-rĂ©pĂ©titif.

Buchner et Carraro (2006) trouvent dans cette grille de lecture une intĂ©ressante application dans l'impact de la participation de la Chine dans les nĂ©gociations climatiques de rĂ©duction des GES sur un possible retour des États-Unis Ă  la table des nĂ©gociations et une Ă©ventuelle ratification du protocole de Kyoto. Pour rappel, les États-Unis avaient en partie justifiĂ© la non-ratification du protocole par la non-ratification du traitĂ© par la Chine. En dĂ©pit de cette hypothĂšse de travail, Buchner et Carraro concluent qu'il est peu probable que les États-Unis acceptent un tel traitĂ© au moins Ă  court terme. Il est davantage probable que les États-Unis adoptent des accords unilatĂ©raux et dans le cas oĂč Ă  la fois la Chine et les États-Unis seraient favorables Ă  la rĂ©duction des GES, un accord bilatĂ©ral entre États-Unis et Chine est l'option qui serait vraisemblablement retenue dans ce cadre d'analyse.

Négociations climatiques internationales et jeux répétitifs

La ratification d'un traitĂ© concernant la rĂ©gulation des GES se heurte naturellement au problĂšme du passager clandestin : chaque pays a intĂ©rĂȘt Ă  ce que les autres pays ratifient le traitĂ© de rĂ©duction, mais il a tout intĂ©rĂȘt Ă  ne pas le signer car il peut ainsi maintenir ses Ă©missions (bĂ©nĂ©fice local et dommage mondial) et bĂ©nĂ©ficier de l'effort consenti par les signataires (bĂ©nĂ©fice mondial vraisemblablement plus grand le dommage causĂ© par le free rider).

Pour Barret, dans le cas d'un jeu répétitif, la répétition des négociations et la menace exercée par les sanctions permettent d'augmenter la taille de la coalition. Il s'intéresse notamment aux moyens de pénaliser les passagers clandestins et de la crédibilité des menaces associées. Une voie d'amélioration du protocole de Kyoto pour la phase post-2012 serait de lui ajouter un volet technologique afin de limiter le problÚme du passager clandestin. En effet, Lise, Tol et Van der Zwann (2000) montrent que si les négociations climatiques internationales sont couplées avec des transferts de technologies, les incitations à coopérer sont d'autant plus élevées.

À l'opposĂ©, Carraro et Siniscalco (1993) soutiennent que l'utilisation de jeux rĂ©pĂ©titifs n'est pas utile Ă©tant donnĂ© que les comportements observĂ©s dans les nĂ©gociations climatiques internationales ne laissent pas entrevoir de stratĂ©gies de dĂ©clic (trigger strategy) : en effet, les stratĂ©gies de dĂ©clic dans le cas des GES impliquent de s'infliger une punition Ă  soi-mĂȘme (de par la nature mondiale de l'impact des GES).

Le théorÚme folk dans le cas de jeux répétitifs soutient l'idée qu'il est toujours possible de maintenir un gain plus élevé que dans le cas du minimax si le facteur d'actualisation est suffisamment élevé pour les jeux répétés à l'infini et si l'information est incomplÚte pour les jeux répétés un nombre de fois données (Fudenberg et Maskin, 1986).

NĂ©gociations climatiques internationales et incertitude

Na et Shin (1998) ont apporté à l'analyse une importante caractéristique de la théorie des jeux : ils incorporent l'incertitude des résultats et montrent que la probabilité qu'une grande coalition soit stable est d'autant plus élevée que les négociations sur le changement climatique commencent tÎt, ajoutant à l'urgence environnementale, une urgence de négociation.

NĂ©gociations climatiques internationales et jeux TOSS

L'approche unificatrice proposée Greenberg (1990) intitulée Theory of Social Situation (TOSS) permet de fournir un cadre d'analyse à la question de la formation des coalitions dans la négociation climatique avec les paramÚtres suivants : un ensemble de joueurs, un ensemble de résultats possibles, une fonction de gain associée aux résultats et un comportement typique des joueurs (standard of behaviour). Ce comportement typique indique aux joueurs quels résultats dans chacune des configurations sont des solutions du jeu. Lise, Tol et van der Zwann (2001) abordent les questions de coalitions des pays dans le cadre de la négociation climatique internationale autour du protocole de Kyoto en se basant sur des jeux TOSS.

Ils montrent que l'acceptation des accords climatiques internationaux augmente si le pays a une vision à long terme (une vue du jeu à long terme) et/ou si le pays s'engage de maniÚre volontaire à respecter à horizon définie des engagements de réduction d'émissions de GES. Ils procÚdent à l'analyse de trois situations (des équilibres en théorie de jeux plus classique) :

  • Analyse de la situation de cartel : jeu de cartel.
  • Analyse de la situation d'engagement incrĂ©mental.
  • Analyse de la situation de nĂ©goce.

Notes et références

  1. Bentham 1789
  2. Hegel 1821
  3. avec un « r » minuscule ici, à distinguer de l'expression avec un « R » majuscule se référant à la discipline qui les étudie
  4. Voir à ce sujet : Yildizoglu M., 2003; Introduction à la théorie des jeux, Collection Eco Sup
  5. Hull H. citation p. 24 Ouvrage de D. Battistella
  6. A. Rapoport, 1962, "Three mode of conflicts", Management Science, Vol.7, no 3 (avril 1961), p. 210-218
  7. C'est-Ă -dire les combats entre espĂšces rivales (pour la nourriture ou le territoire)
  8. RÚgle de Bayes ou loi de probabilité permettant de passer de la probabilité a priori attribuée à un phénomÚne à sa probabilité a posteriori probabilité (qualifiée parfois de "conditionnelle")qui tient compte des observations disponibles

Bibliographie

  • Robert Axelrod, 1984,“The evolution of cooperation”, Basic Books
  • Battistella, D. (2004), ThĂ©ories des relations internationales, Presse de Science Po.
  • Jeremy Bentham, Introduction to Principles of Morals and Legislation (Ă©crit en 1780, publiĂ© en 1789). Le chapitre VIII est intitulĂ© Of Internationality.
  • Buchner, B., Carraro, C. (2006) US, China and the economics of climate negotiations, Ca' Foscari University of Venice Department of Economics Working paper.
  • Chander, P., Tulkens, H., van Ypersele, J.-P., Willems, S. (1999), The Kyoto Protocol: an Economic and Game Theoretic Interpretation, CESifo working paper.
  • Dellink, R., Finus, M., van Ierland, E. (2003), Stability of Climate Coalitions in a Cartel Formation Game, FEEM working paper.
  • Devin, G. (2002), Sociologie des relations internationales, Édition La DĂ©couverte & Syros, Paris
  • Dutta, P.K., Radner, R. (2005), A Strategic Analysis of Global Warming: Theory and Some Numbers, Columbia University Department of Economics and New York Stern School of Business working paper.
  • Kreps D., Milgrom P., Roberts J. et Wilson R., 1982, “ Rational cooperation in the finitely repeated prisoner’s dilemma”, Journal of Economic Theory, 27, p. 245-252
  • Harsanyi J. C., June 1995, “Games with Incomplete Information”, The American Economic Review, Vol. 85, No. 3., p. 291-303.
  • Georg Wilhelm Friedrich Hegel (trad. de l'allemand par Jean-Louis Vieillard-Baron), Principes de la philosophie du droit, Paris, Flammarion, coll. « GF-Flammarion » (no 664), , 444 p. (ISBN 2-08-070664-0)
  • Lise, W., Tol, R.S.J., van der Zwaan, B. (2001), Negotiating Climate Change as a Social Situation, FEEM working paper.
  • Lise, W., Tol, R.S.J., van der Zwaan, B. (2000), Technology Diffusion and the Stability of Climate Coalitions, FEEM working paper.
  • John Nash, Apr. 1950, “The Bargaining Problem”, Econometrica, Vol. 18, No. 2. p. 155-162.
  • John Nash, Sep. 1951, “Non-Cooperative Games“), The Annals of Mathematics, 2nd Ser., Vol. 54, No. 2., p. 286-295.
  • Patel, V.M. (2005), Coalition Strategies and Reduction of GHG Emissions, Indian Institute of Technology working paper.
  • Rapoport A., 1962, “Three modes of conflict”, Management Science, Vol. 7, No. 3. (Apr., 1961), p. 210-218.
  • Rubinstein R., Jan.1982, “Perfect Equilibrium in a Bargaining Model”, Econometrica, Vol. 50, No. 1., p. 97-109.
  • Selten R., 1975, “Re-examination of the perfectness concept for equilibrium points in extensive games”, International Journal of Game Theory”, 4, p. 25-55
  • Stern, N. (2006), The Economics of Climate Change, HM Treasury paper.
  • Tucker A. W., (1983), “The Mathematics of Tucker: A Sampler”, The Two-Year College Mathematics Journal, Vol. 14, No. 3. (Jun., 1983), p. 228-232.
  • Van Damme E and Furth D, (2002), “Game theory and the market”. In: Borm P, Peters H (eds.)Chapters in Game Theory. Kluwer Academic Publishers, p. 51–81
  • Allan P., Schmidt C. (1994), “Game Theory and International Relations. Preferences, Information and Empirical evidence”, British Library, p. 117, (ISBN 1 85278 925 5)
  • Nicolas Eber, ThĂ©orie des jeux, Dunod,
  • Krugman P.R. & Obstfeld M., 2001, “Économie internationale”, 3e Ă©dition, Édition De Boeck UniversitĂ©, p. 271-285
  • von Neumann, Morgenstern, 1944, “Theory of Games and Economic behaviour”, Princeton University Press
  • Yildizoglu, M. (2003), Introduction Ă  la thĂ©orie des jeux, Collection Eco Sup.

Voir aussi

Articles connexes

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplĂ©mentaires peuvent s’appliquer aux fichiers multimĂ©dias.