Théorie des jeux

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 7 octobre 2019 à 13:36 et modifiée en dernier par Enki Barthel (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

La théorie des jeux est un domaine des mathématiques qui s'intéresse aux interactions des choix d'individus (appelés « joueurs »). Les joueurs sont supposés conscients de l'existence de ces interactions (applications aux sciences sociales), ou non (applications, en biologie, à la dynamique des populations).

Les fondements mathématiques de la théorie moderne des jeux sont décrits autour des années 1920 par Ernst Zermelo dans l'article Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels, et par Émile Borel dans l'article « La théorie du jeu et les équations intégrales à noyau symétrique ». Ces idées sont ensuite développées par Oskar Morgenstern et John von Neumann en 1944 dans leur ouvrage Theory of Games and Economic Behavior. La théorie des jeux devient à partir de ce moment un outil théorique de la micro-économie. Outre le champ de l'économie, la théorie des jeux trouvera des applications dans les sciences sociales, les sciences politiques et dans l'analyse stratégique comme les relations internationales ou les comportements stratégiques des acteurs dans les ensembles organisés (théorie des organisations) et en biologie évolutionniste.

Histoire

Antoine Augustin Cournot.
Émile Borel.

L'analyse du duopole d'Antoine Augustin Cournot publiée en 1838 dans ses Recherches sur les principes mathématiques de la théorie des richesses peut être considérée comme la première formulation, dans un cadre particulier, de la notion d'équilibre de Nash.

Dans son ouvrage de 1938, Applications aux Jeux de Hasard, Émile Borel développe un théorème du minimax pour les jeux à somme nulle à deux joueurs, c'est-à-dire les jeux dans lesquels ce que gagne l'un est perdu par l'autre.

John von Neumann.

La théorie des jeux devient un champ de recherche à part entière avec la publication de Theory of Games and Economic Behavior (Théorie des jeux et du comportement économique) par John von Neumann et Oskar Morgenstern en 1944. Cet ouvrage fondateur détaille la méthode de résolution des jeux à somme nulle.

Vers 1950, John Forbes Nash formalise une notion générale d'équilibre qui portera le nom d'équilibre de Nash. Cette notion généralise les travaux de Cournot[1] en incluant en particulier la possibilité de randomisation des stratégies.

Dans leur ouvrage[2] marquant de 1957, qui a redonné à la théorie des jeux une nouvelle vigueur[3], R. Ducan Luce et Howard Raiffa déclarent remarquer le déclin du « sentiment à la mode et naïf que la théorie des jeux a résolu les problèmes innombrables de la sociologie et de l'économie, ou tout du moins, qu'elle a fait de leur résolution un problème pratique » ne demandant que « quelques années de recherche ». Ils invitaient les chercheurs en sciences sociales à reconnaître que la théorie des jeux n'est pas prescriptive, mais au contraire, plutôt normative, car elle n'établit ni comment les gens se comportent, ni comment ils devraient se comporter dans l'absolu, mais comment ils doivent se comporter s'ils veulent atteindre certains objectifs[2]. Leur invitation a été ignorée et la théorie des jeux a continué à être adoptée davantage comme un outil descriptif qu'un outil normatif[3].

John Forbes Nash.

L'association entre jeu et nombres surréels de Conway a été établie dans les années 1970[4].

En 1994, John Nash, Reinhard Selten et John Harsanyi reçoivent le « prix Nobel d'économie » (prix de la Banque de Suède en sciences économiques en mémoire d'Alfred Nobel) pour leurs travaux sur la théorie des jeux[5]. Ce choix témoigne de l'importance prise par la théorie des jeux dans l'analyse économique[5].

En 2005, les théoriciens des jeux Thomas Schelling et Robert Aumann reçoivent le « prix Nobel d'économie »[5].

Robert Aumann.

En 2007, Leonid Hurwicz, Eric Maskin et Roger Myerson reçoivent le « prix Nobel d'économie » pour avoir posé les fondations de la théorie des mécanismes d'incitation.

En 2012, Alvin Roth et Lloyd Shapley, un pionnier de la théorie des jeux, reçoivent le « prix Nobel d'économie » pour leurs travaux sur les marchés et la façon d'ajuster offre et demande[6].

En 2014, Jean Tirole reçoit le « prix Nobel d'économie » pour son « analyse du pouvoir de marché et de sa régulation »[notes 1].

Interprétations

Il existe une ambiguïté sur les interprétations possibles de la théorie des jeux et notamment sur le fait que la théorie des jeux soit une théorie normative ou une théorie descriptive[7],[8].

Von Neumann et Morgenstern décrivent la manière dont des joueurs rationnels se comporteraient[7].

La théorie des jeux comportementale adopte une interprétation descriptive et cherche à décrire à l'aide de travaux expérimentaux comment les humains se comportent effectivement dans les différents modèles de théorie des jeux pour élaborer une théorie des jeux descriptive[7].

Il existe un débat sur la manière dont on peut appliquer la théorie des jeux à l'analyse de la vie réelle. Par exemple, l'économiste Ariel Rubinstein défend l'idée que la théorie des jeux ne permet pas de prédire le réel mais propose un cadre de pensée qui, au même titre que les fables et les proverbes, permet de penser et d'analyser des situations réelles[9]. Bernard Guerrien adopte un point de vue très proche de celui de Rubinstein, en insistant sur le fait qu'il est absurde de parler d'« applications » de la théorie des jeux, du moins dans sa version non coopérative[10].

Typologie

La théorie des jeux classifie les jeux en catégories en fonction de leurs approches de résolution. Les catégories les plus courantes sont :

Jeux coopératifs et jeux non coopératifs

Dans les jeux coopératifs, on étudie la formation de coalitions entre les joueurs afin d'obtenir de meilleurs résultats pour leurs membres.

Jeux simultanés et jeux séquentiels

Reinhard Selten
Reinhard Selten

Dans un jeu simultané, les joueurs décident en même temps de leur stratégie. Au contraire, dans un jeu séquentiel, on peut spécifier l'ordre des décisions de sorte qu'un joueur peut décider de sa stratégie conditionnellement à ce qu'ont joué les autres joueurs précédemment.

Par exemple, le dilemme du prisonnier, le jeu pierre-feuille-ciseaux et le jeu du duopole de Cournot sont des jeux simultanés. Le jeu d'échecs et le jeu de go sont des jeux séquentiels.

Jeux finis

On dit qu'un jeu est fini lorsque l'ensemble des stratégies de chacun des joueurs est fini.

Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux stratégies possibles. En revanche, le jeu du duopole de Cournot n'est pas un jeu fini, car chaque entreprise choisit la quantité de bien qu'elle produit dans l'ensemble des réels positifs.

Jeux à somme nulle et jeux à somme non nulle

On appelle jeu à somme nulle ou jeu strictement compétitif, les jeux à deux joueurs dans lesquels l'intérêt de l'un des deux joueurs est strictement opposé à l'intérêt de l'autre joueur. Si les préférences des joueurs sont représentées par une fonction de gain ou une fonction d'utilité, alors la somme des deux fonctions est toujours égale à 0[11]. La théorie des jeux à somme nulle a été essentiellement développée par Morgenstern et von Neumann 1944[12].

Les échecs, le tarot ou le poker sont des jeux à somme nulle car les gains de l'un sont très exactement les pertes de l'autre.

Le jeu pierre-feuille-ciseaux est un autre exemple de jeu à somme nulle. Le dilemme du prisonnier n'est pas un jeu à somme nulle (dans certains cas, les deux joueurs peuvent perdre).

Jeux répétés

La répétition d'un jeu, avec connaissance des résultats intermédiaires, change souvent fondamentalement son déroulement (les meilleurs coups et la conclusion).

Par exemple, il peut être utile de prendre ponctuellement le risque de perdre « pour voir », tester les autres joueurs, et mettre en place des stratégies de communication par les coups joués (à défaut d'autre moyen de communication).

Il se développe également des phénomènes de réputation qui vont influencer les choix stratégiques des autres joueurs. Dans le dilemme du prisonnier, le fait de savoir qu'on va jouer plusieurs fois avec un dur qui n'avoue jamais mais se venge cruellement, ou avec un lâche qui avoue toujours, change radicalement la stratégie optimale.

Enfin, le fait que le nombre total de parties soit connu à l'avance ou non peut avoir des effets importants sur le résultat, l'ignorance du nombre de coups rapprochant du jeu avec un nombre infini de coups, alors que sa connaissance rapproche au contraire du jeu à un seul coup (et ce, aussi grand que soit le nombre de coups).[pas clair]

Information

On dit qu'un jeu est à information complète si chaque joueur connaît lors de la prise de décision :

  • ses possibilités d'action ;
  • les possibilités d'action des autres joueurs ;
  • les gains résultants de ces actions ;
  • les motivations des autres joueurs.

Les jeux en information incomplète sont des situations où l'une des conditions n'est pas vérifiée. Ce peut être parce qu'une des motivations d'un acteur est cachée (domaine important pour l'application de la théorie des jeux à l'économie). Ces jeux sont aussi appelés jeux bayésiens.

On parle de jeu à information parfaite dans le cas de jeu sous forme extensive, où chaque joueur a une connaissance parfaite de toute l'histoire du jeu.

Un jeu à information incomplète est aussi à information imparfaite. Les jeux à information complète peuvent être à information imparfaite soit du fait de la simultanéité des choix des joueurs, soit lorsque des événements aléatoires sont cachés à certains joueurs.

John Harsanyi a présenté une méthode permettant de transformer des jeux à information incomplète en jeux à information complète mais imparfaite : au début du jeu, la Nature effectue un choix de règles parmi les possibles, et les joueurs n'ont qu'une connaissance partielle de ce choix. Cette transformation introduit une subtilité dans la classification des jeux où le hasard intervient, séparant ceux où le hasard intervient uniquement avant le premier choix (assimilables à un jeu à information incomplète sans hasard), de ceux où le hasard intervient (aussi) après un choix d'un joueur[13].

Mémoire

On distingue aussi les jeux à mémoire parfaite et à mémoire imparfaite. Les jeux à mémoire parfaite sont des situations où chaque joueur peut se rappeler à tout moment de la suite de coups qui ont été joués précédemment, au besoin en notant au fur et à mesure les coups joués. Les jeux à mémoire imparfaite supposent une amnésie de la part des joueurs.

Les jeux de guerre sont des exemples de jeux à mémoire imparfaite si les commandements de zones opérationnelles ne parviennent pas à communiquer entre eux ou avec l'État-Major et donc n'ont pas trace des mouvements déjà effectués par les troupes alliées lorsqu'elles doivent décider de leurs propres mouvements[réf. nécessaire].

Jeux déterminés

Les jeux de Nim forment un cas particulier de jeu à somme nulle, sans intervention du hasard et dans la plupart des cas à nombre de situations finies. Dans leur cas particulier, la théorie des graphes fournit un outil plus utile que la théorie des jeux à proprement parler.

Elle permet de dégager le noyau du jeu, ensemble des nœuds assurant la victoire si l'on parvient à l'un d'entre eux en cours de jeu et qu'on joue de façon optimale ensuite. Ce noyau est caractérisé à partir du nombre de Grundy associé à chaque nœud[14].

Représentations des jeux

Un jeu est défini par l'ensemble des joueurs, l'ensemble des stratégies possibles pour chacun des joueurs et la spécification des paiements ou des utilités des joueurs pour chaque combinaison de stratégies. Les jeux coopératifs sont généralement présentés sous la forme de fonction caractéristiques alors que les jeux non coopératifs sont représentés sous forme normale ou sous forme extensive.

Forme normale

Un jeu sous forme normale (ou jeu sous forme stratégique) est défini par :

  • l'ensemble des joueurs ;
  • l'ensemble des stratégies possibles pour chacun des joueurs ;
  • les préférences de chacun des joueurs sur l'ensemble des combinaisons stratégiques possibles[15].

L'ensemble des joueurs doit être fini[15]. L'ensemble des stratégies de chacun des joueurs peut être fini, par exemple dans le dilemme du prisonnier chaque joueur décide de coopérer ou non, ou infini, par exemple dans le duopole de Cournot, chaque joueur décide de la quantité de bien qu'il veut produire et peut choisir n'importe quelle valeur dans l'ensemble des réels positifs[15]. Les préférences peuvent aussi être représentées par une fonction d'utilité ou une fonction de gain[16],[17].

Quand on représente un jeu sous forme normale, on fait l'hypothèse implicite que chaque joueur choisit sa stratégie sans avoir connaissance des choix des autres joueurs[18].

Matrice des gains

Exemple de matrice des gains.

Dans un jeu à deux joueurs avec un ensemble fini de stratégies pour chacun des deux joueurs, comme le dilemme du prisonnier, il est courant de représenter le jeu sous sa forme normale à l'aide d'une matrice des gains ou matrice des paiements[16].

Il s'agit d'un tableau à double-entrée qui énumère sur chaque côté les stratégies possibles des joueurs respectifs. Dans la case à la croisée de deux stratégies, on note le couple de gains des deux joueurs.

Si le jeu est à somme nulle et à deux joueurs, alors on peut ne noter que les gains du premier joueur : ceux du second sont directement opposés.

Forme extensive

Exemple de jeu sous forme extensive.

Dans tous les jeux, les décisions peuvent être représentées par un arbre, dont chaque nœud est associé au joueur qui décide. Chaque option constitue une branche. Les gains de tous les joueurs sont associés aux terminaisons ou feuilles de l'arbre. Un joueur n'a toutefois pas besoin de savoir comment il est parvenu à un nœud : seul compte l'état présent du jeu, et les positions recherchées dans le futur. Lorsque certains mouvements ne sont autorisés qu'après un événement donné, cet événement n'est qu'un des éléments à matérialiser dans l'état présent du jeu et n'a pas besoin de faire partie d'un historique.

Une forme extensive de jeu est un arbre de décision décrivant les actions possibles des joueurs à chaque étape du jeu, la séquence de tours de jeu des joueurs, ainsi que l'information dont ils disposent à chaque étape pour prendre leur décision. Cette information est représentée sous forme d'ensembles d'information qui forment une partition des nœuds de l'arbre, chaque classe de la partition contenant les nœuds non distinguables par le joueur à une étape du jeu. Si ces classes sont des singletons, c'est-à-dire que chacune est constituée d'un seul nœud de l'arbre du jeu, le jeu est dit à information parfaite, ce qui signifie que chaque joueur sait à tout moment où il se situe dans l'arbre du jeu. Dans le cas contraire, le jeu est dit à information imparfaite[19]. L'information imparfaite est représentée sous la forme d'un joueur non rationnel : la « Nature », joueur qui prend aléatoirement certaines décisions à telle ou telle étape du jeu, orientant la suite du jeu vers un certain sous-arbre de l'arbre du jeu.

Jeux sous forme caractéristique

Il s'agit d'une forme de jeu coopératif, sous cette forme un jeu est noté G=(N, v), où :

  • N est l'ensemble des joueurs ;
  • v est la fonction caractéristique, elle associe à chaque sous-ensemble S de N (qui est une coalition) la valeur v(S), c'est-à-dire le gain (ou le coût) obtenu par la coalition S sans l'aide des autres joueurs.

Concepts de solutions

Plusieurs concepts de solutions ont été définis. Il s'agit principalement de la répartition du gain v(N), qui doit être « équitable », la notion d'équité restant à définir, parfois axiomatiquement.

On retrouve pour les jeux à utilité transférable, les concepts de: Cœur, valeur de Shapley, Noyau, Nucleolus.

Équilibre en stratégies dominantes

Un jeu possède un équilibre en stratégies (strictement) dominantes si pour chacun des joueurs, il existe une stratégie qui domine toutes ses autres stratégies, quelles que soient les stratégies des autres joueurs.

Autrement dit, quelles que soient les stratégies des autres joueurs, le paiement que j'obtiens en jouant cette stratégie dominante sera strictement supérieur à celui obtenu en jouant une autre stratégie.

Chaque joueur jouera donc évidemment sa stratégie dominante et personne n'aura intérêt à dévier de cet équilibre. L'équilibre en stratégie dominante est donc un équilibre de Nash.

Lorsqu'il existe (ce qui est assez rare), l'équilibre en stratégie dominante est unique.

Équilibre par élimination itérée des stratégies dominées

On dit qu'une stratégie est dominée pour un joueur donné s'il existe au moins une autre stratégie telle que, quelles que soient les stratégies adoptées par les autres joueurs, cette autre stratégie est toujours au moins aussi bonne que la première et strictement meilleure dans au moins l'une des situations.

Si chaque joueur est rationnel, suppose que les autres joueurs sont rationnels et suppose que les autres joueurs supposent qu'il est rationnel, alors on peut définir l'équilibre du jeu comme celui qui serait obtenu par l'élimination successive des stratégies dites dominées[20].

Équilibre de Nash

Un équilibre de Nash est une situation telle qu'aucun joueur n'a intérêt à dévier unilatéralement de sa stratégie[21],[22].

Pour les jeux finis, c'est-à-dire les jeux pour lesquels l'ensemble des stratégies de chacun des joueurs est fini, on distingue l'équilibre de Nash en stratégies pures et l'équilibre de Nash en stratégies mixtes.

Un équilibre de Nash en stratégies pures est l'équilibre d'un jeu dans lequel les joueurs choisissent une stratégie de manière déterministe alors que l'équilibre de Nash en stratégie mixte est l'équilibre de l'extension mixte de ce jeu, c'est-à-dire du même jeu, dans lequel les joueurs choisissent de jouer les différentes stratégies possibles de manière probabiliste. Leur stratégie est alors définie par le vecteur de probabilités qu'ils associent à chacune des stratégies pures possibles[23].

Nash 1950 et Nash 1951 ont établi que tout jeu fini a au moins un équilibre de Nash en stratégies mixtes[24],[25],[26].

En revanche, rien ne garantit que l'équilibre de Nash soit unique[18].

Équilibre de Nash parfait en sous-jeux

Pour tous les jeux sous forme extensive en information parfaite, Selten 1965 propose de considérer un raffinement de la notion d'équilibre de Nash, appelé équilibre de Nash parfait en sous-jeux. Un équilibre de Nash est dit parfait dans les sous-jeux s'il est aussi équilibre de Nash de tous les sous-jeux possibles du jeu. Cette notion permet d'éliminer certains équilibres de Nash non pertinents[18].

L'algorithme de Zermelo, ou algorithme d'induction à rebours, permet de trouver l'équilibre de Nash parfait en sous-jeux d'un jeu sous forme extensive[27],[28],[29],[21]. Le principe étant de « remonter » le jeu en partant des derniers choix que fait chaque joueur.

Rosenthal 1981 critique la notion d'équilibre de Nash parfait en sous-jeu en exhibant un jeu dans lequel il est peu probable que des agents réels se comportent comme le prédit la théorie (Voir la section sur le jeu du mille-pattes).

Solution du minimax

Dans le cadre d'un jeu à deux joueurs et à somme nulle, Émile Borel, puis John von Neumann ont défini la solution dite du minimax.

Équilibre corrélé

Robert Aumann développe en 1987 la notion d'équilibre corrélé[5],[30].

Théorie des jeux à champ moyen

La théorie des jeux à champ moyen a été introduite en 2006 par Jean-Michel Lasry et Pierre-Louis Lions comme limite de jeux à un grand nombre de joueurs[31]. L'attrait principal de la théorie des Jeux à champ moyen réside dans la simplification considérable des interactions entre joueurs. Les joueurs déterminent alors leur stratégie optimale en considérant l'évolution de la communauté (de la foule de joueurs) dans son ensemble plutôt que l'ensemble des comportements individuels (de tous les autres joueurs pris un par un). Les jeux à champ moyen se situent ainsi à la frontière entre la théorie des jeux (jeux différentiels stochastiques pour être plus précis) d'une part, et l'optimisation d'autre part.

Applications

Les champs d'application de la théorie des jeux sont très variés.

Relations internationales

Le professeur Thomas Schelling et le professeur Robert Aumann, qui ont reçu conjointement le « prix Nobel d'économie » 2005, se sont spécialisés dans l'explication des diverses stratégies utilisées (à utiliser) dans les conflits internationaux, tels la guerre froide et la guerre nucléaire (dissuasion)[réf. nécessaire].

Économie

Les concepts de la théorie des jeux ont rapidement envahi l'analyse économique, notamment sous l'impulsion d'auteurs comme Thomas Schelling[32]. Depuis les années 1980, la théorie des jeux est devenue un outil standard de la science économique. Onze théoriciens des jeux ont obtenu le « prix Nobel d'économie »[33].

La théorie des jeux est très utilisée dans le domaine de l'économie industrielle pour analyser la concurrence entre des entreprises en situation d'oligopole. Dès 1838, l'analyse de duopole de Cournot fait implicitement appel à des concepts de théorie des jeux bien avant que ceux-ci aient été formalisés par John Nash dans les années 1950[1]. Plus tard, le modèle de Harold Hotelling permet d'analyser la concurrence spatiale et les stratégies de différenciation des produits entre entreprises[34].

La théorie des jeux est également fondamentale dans la théorie des enchères depuis les travaux de William Vickrey[35].

Les économistes David Gale et Lloyd Shapley utilisent la théorie des jeux coopératifs pour étudier l'appariement des étudiants et des universités ainsi que l'appariement des hommes et des femmes sur le marché du mariage[36].

La théorie des jeux a également été appliquée en économie du sport, que ce soit à propos du football[37], du tennis[38] ou du cyclisme[39].


Sciences politiques

La théorie des jeux a été appliquée en sciences politiques dès les années 1950 avec les travaux de Downs sur la compétition électorale[40]. Aujourd'hui la théorie des jeux est un outil standard en sciences politiques et on trouve dans les revues internationales de sciences politiques comme l'American Political Science Review et l'American Journal of Political Science de nombreux modèles issus de la théorie des jeux[41].

Anthony Downs (1957), Donald Wittman (1973) et John Roemer (2006) utilisent la théorie des jeux pour modéliser la compétition électorale entre des partis[40],[42],[43],[44]. Downs 1957 étudie la manière dont les partis ou les candidats cherchant uniquement à gagner les élections choisissent leur programme électoral en fonction des préférences des électeurs, Wittman 1973 étudie des partis ayant des préférences politiques et ne cherchant à gagner l'élection que pour mener cette politique choisissent leur programme et Roemer 2006 propose un modèle dans lequel le parti est composé à la fois de militants cherchant à mener une politique particulière et de militants cherchant à gagner l'élection.

Bob Erikson et Thomas Palfrey utilisent la théorie des jeux pour modéliser le choix des dépenses de campagne des candidats à une élection[45]. Tilman Klumpp et Mattias Polborn appliquent la notion d'équilibre de Nash parfait dans les sous-jeux pour étudier la compétition électorale dans les élections primaires américaines. Ils montrent notamment l'importance de gagner les premières primaires et soulignent le fait que les primaires organisées de manières séquentielles sont moins coûteuses pour le parti que des primaires qui seraient organisées simultanément dans les différents états américains[46].

David Austen-Smith et Jeffrey Banks appliquent la notion d'équilibre de Nash parfait en sous-jeux à l'étude de la formation des coalitions électorales[47].

Sciences sociales

La théorie des jeux apparaît dès le début des années 1950 en anthropologie chez Claude Lévi-Strauss, qui s'intéresse de près aux différentes disciplines émergeant à cette époque dans le domaine des systèmes complexes. Il y fait largement référence en 1952 dans une communication en anglais, Social Structure, qui deviendra un des textes fondateurs de l'anthropologie structurale avec sa publication en français comme chapitre XV de son premier grand ouvrage méthodologique, Anthropologie structurale[48]. La théorie des jeux est également mentionnée, à côté de la cybernétique, dans un article de 1955, Les Mathématiques de l'Homme[49].

Les sociologues s'intéressent également à la théorie des jeux depuis les années 1950. C'est le sociologue Paul Lazarsfeld qui avait engagé Duncan Luce et Howard Raiffa au Bureau for Applied Social Research de l'université de Columbia et c'est là qu'ils ont écrit le livre Games and Decisions[50]. Par ailleurs, la sociologue Jessie Bernard a publié dès 1954 une introduction à la théorie des jeux pour les sociologues dans l'American Journal of Sociology[50],[51]. C'est à partir du milieu des années 1980 que la théorie des jeux a commencé à toucher un plus large public en sociologie[50].

En sociologie des organisations, Michel Crozier et Erhard Friedberg démontrent qu'un système humain organisé est constitué par les stratégies interdépendantes d'acteurs qui jouent en fonction de règles du jeu, explicites et implicites[52]. Elles structurent leurs comportements stratégiques. Le comportement de l'acteur est stratégique car il a sa « rationalité ». Le comportement est fonction de la perception qu'a l'acteur des enjeux de la situation dans laquelle il pense se trouver et fonction des gains escomptés par l'acteur. Autrement dit, ce que l'acteur-joueur pense pouvoir tirer positivement du jeu[53]. Cette vision des organisations comme système et jeu a influencé tout un courant du management notamment autour de l'entreprise comme organisation où la négociation est omniprésente.

Histoire

Bien que cela soit beaucoup plus rare, on trouve également des applications de la théorie des jeux en histoire. Par exemple, Philippe Mongin applique la théorie des jeux à la compréhension de la bataille de Waterloo[54].

Biologie

Des chercheurs ont utilisé la stratégie des jeux pour mieux comprendre l'évolution du comportement des espèces face à la modification de leur environnement, il s'agit de la théorie des jeux évolutionnistes. Plus précisément, la théorie des jeux est parfois utilisée pour identifier les stratégies pour lesquelles le gain (mesuré en survie et/ou reproduction) est le plus élevé[55].

Des biologistes ont utilisé la théorie des jeux pour comprendre et prévoir les résultats de l'évolution, en particulier la notion d'équilibre évolutivement stable introduit par John Maynard Smith dans son essai Game Theory and the Evolution of Fighting (La théorie des jeux et l'évolution de la lutte). Voir aussi son livre Evolution and the Theory of Games.

Il est à remarquer qu'en théorie de l'évolution, l'adversaire principal d'un individu n'est pas vraiment l'ensemble de ses prédateurs, mais l'ensemble des autres individus de son espèce et des autres espèces apparentées. Comme le fait remarquer Richard Dawkins, un brontosaure n'a pas besoin, pour survivre, de courir plus vite que le tyrannosaure qui le poursuit (ce qui lui serait impossible), mais simplement plus vite que le plus lent de ses congénères. Des phénomènes semblables se produisent en économie. Tout cela rejoint des considérations psychologiques : la conflictualité est plus liée à la ressemblance qu'à la différence.

John Maynard Smith a reçu le prix Crafoord pour son application de la théorie des jeux à la biologie[réf. souhaitée].

Philosophie

Les travaux de Kenneth Binmore (Game Theory and the Social Contract: Playing Fair. (1994), Game Theory and the Social Contract: Just Playing. (1998) et Natural Justice (2005)) utilisent la théorie des jeux pour fonder une théorie évolutionniste de la justice et de la morale.

Théorie des jeux combinatoires

John Conway a mis en place une notation pour certains jeux et défini des opérations sur ces jeux, dans l'espoir d'étudier le jeu de go. À partir d'associations surprenantes d'idées, il a isolé une sous-classe avec des propriétés numériques, et a abouti à définir la classe très générale des nombres surréels, puis a développé la théorie des jeux combinatoires. Actuellement (2016), un ordinateur peut jouer au go à un niveau d'expert et battre le meilleur joueur mondial ; malheureusement, les progrès de la théorie de Conway[56] n'ont pour le moment pas trouvé d'applications pratiques, que ce soit pour améliorer le jeu des ordinateurs ou celui des humains.

Exemples de jeux

Dilemme du prisonnier

Le dilemme du prisonnier est un jeu simultané à deux joueurs. Chacun des deux joueurs a deux stratégies possibles, coopérer (C) ou ne pas coopérer (NC).

- C NC
C (3,3) (0,4)
NC (4,0) (1,1)

Le jeu a un unique équilibre de Nash en stratégies pures (NC, NC)[57]. Ce jeu a notamment été développé par Luce et Raiffa 1957[32].

Bataille des sexes

Le jeu de la bataille des sexes modélise le problème de deux joueurs souhaitant sortir ensemble mais l'une des deux personnes préfère Bach tandis que l'autre préfère Stravinsky[58]. Ce jeu a été introduit dans la littérature sur la théorie des jeux par Luce et Raiffa 1957[12],[32].

Le jeu peut être représenté sous forme normale par la matrice des gains suivante :

- Bach Stravinsky
Bach (2,1) (0,0)
Stravinsky (0,0) (1,2)

Le jeu comporte deux équilibres de Nash en stratégies pures : (Bach, Bach) et (Stravinsky, Stravinsky)[58],[59].

Jeu de coordination

Le jeu de coordination comprend deux joueurs souhaitant se coordonner et ayant les mêmes préférences.

- Bach Stravinsky
Bach (2,2) (0,0)
Stravinsky (0,0) (1,1)

Le jeu de coordination admet deux équilibres de Nash en stratégies pures (Bach, Bach) et (Stravinsky, Stravinsky)[60]. L'extension mixte de ce jeu admet trois équilibres de Nash[18].

Pierre feuille ciseaux

Le jeu Pierre-feuille-ciseaux est un exemple simple de jeu à somme nulle. Le jeu comporte deux joueurs. Chaque joueur a trois stratégies pures possibles (pierre, feuille ou ciseau). Pour modéliser le problème, on considère que chaque joueur obtient une utilité de 1 en cas de victoire, 0 en cas d'égalité et -1 en cas de défaite. Dès lors, on peut le représenter sous forme normale grâce à la matrice des gains suivantes :

- Pierre Feuille Ciseau
Pierre (0,0) (-1,1) (1,-1)
Feuille (1,-1) (0,0) (-1,1)
Ciseau (-1,1) (1,-1) (0,0)

Il n'existe pas d'équilibre de Nash en stratégies pures, mais il existe un équilibre de Nash en stratégie mixte consistant pour chacun des joueurs à jouer chaque stratégie pure avec une probabilité 1/3[61].

Concours de beauté

Hervé Moulin a proposé le jeu dit du concours de beauté en 1986[62]. N joueurs doivent annoncer un nombre entre 0 et K. Le vainqueur est celui qui annonce le nombre le plus près de p fois la moyenne des annonces avec p un nombre entre 0 et 1[63]. À l'équilibre de Nash, tous les joueurs doivent annoncer 0.

Rosemarie Nagel a mené une étude expérimentale sur ce jeu avec des étudiants. Dans son expérience, les sujets doivent annoncer un nombre entre 0 et 100 et le vainqueur est celui qui annonce le nombre le plus près de 70 % de la moyenne des réponses. Les sujets de son expérience ne se comportent pas comme le prédit la théorie des jeux[64].

Jeu du mille-pattes

Jeu du mille-pattes sous forme extensive.

Le jeu du mille-pattes est un jeu séquentiel en information parfaite et complète avec un unique équilibre de Nash parfait en sous-jeux. Il a été inventé par Robert Rosenthal en 1981 pour mettre en évidence une situation dans laquelle la notion d' équilibre de Nash parfait en sous jeux et la notion d'induction à rebours étaient contre-intuitives[65].

Dans ce jeu, deux joueurs décident tour à tour de continuer ou d'arrêter le jeu. Les paiements sont tels que chaque joueur préfère la situation où il arrête le jeu en t à la situation où l'autre joueur arrête le jeu en t+1. Comme la somme des paiements est croissante avec le nombre de tours joués, l'équilibre du jeu paraît contre-intuitif[66].

Conformément à l'intuition de Rosenthal, l'étude expérimentale de McKelvey et Palfrey montre que seuls 1,5 % des sujets se comportent comme le prédit l'équilibre de Nash parfait en sous jeux[67]. En revanche, Palacios-Huerta et Volij montrent que les meilleurs joueurs d'échecs se comportent au jeu du mille-pattes exactement comme le prédit l'équilibre de Nash parfait en sous-jeux[68].

Jeu de l'ultimatum

Jeu de l'ultimatum sous forme extensive.

Le jeu de l'ultimatum modélise un problème simple de négociation sous forme séquentielle. Deux individus doivent se partager une certaine somme d'argent, 10 euros par exemple. Tout d'abord, le premier joueur propose un partage (x, 10-x), c'est-à-dire qu'il annonce au deuxième joueur qu'il veut garder x euros et qu'il lui donne le reste. Puis, le deuxième joueur peut soit valider ce partage, soit y renoncer et dans ce cas, les deux joueurs n'ont rien et les 10 euros sont perdus[69].

L'induction à rebours donne comme solution de ce problème le partage (10,0) car le deuxième joueur accepte tous les partages lorsque x<10 et est indifférent lorsque x=10, et le premier joueur préfère strictement le partage où il conserve les 10 euros[69].

Ce résultat très inéquitable n'est pas vérifié empiriquement, en général le premier joueur propose la moitié des gains au second joueur[69].

Cette différence entre la théorie et la pratique peut s'expliquer par l'aversion des inégalités trop fortes[69].

Une variante du jeu de l'ultimatum est le jeu du pirate.

Bibliographie

Textes importants

Introductions

Manuels

  • (en) Duncan Luce et Howard Raiffa, Games and Decisions : Introduction and critical survey, New York, John Wiley and Sons, , 1re éd.
  • (en) Guillermo Owen, Game Theory, W.B. Saunders Company, Philadelphia, 1968
  • Ivar Ekeland, La théorie des jeux et ses applications à l'économie mathématique, PUF, Collection SUP. Le mathématicien 12, Paris, 1974
  • Hervé Moulin, Théorie des jeux pour l'économie et la politique, Hermann,
  • (en) Roger Myerson, Game Theory : Analysis of Conflict, HUP,
  • (en) Drew Fudenberg et Jean Tirole, Game Theory, Cambridge, MA, MIT Press, (ISBN 9780262061414)
  • (en) Ariel Rubinstein et Martin Osborne, A Course in Game Theory, MIT Press, , 368 p. (ISBN 978-0262650403, lire en ligne)
  • (en) James Morrow, Game Theory for Political Scientists, Princeton, New Jersey, États-Unis, Princeton University Press, , 1re éd.
  • Murat Yildizoglu, Introduction à la théorie des jeux, Dunod, coll. « Eco Sup », , 165 p. (ISBN 978-2100071845)
  • Christian Montet et Daniel Serra, Game Theory and Economics, Palgrave-Macmillan, London, 2003, 487 p. (traduction chinoise en 2004).
  • Gisèle Umbhauer, Théorie des jeux, Vuibert, coll. « Dyna'Sup Economie »,
  • Jean-François Laslier, Le vote et la règle majoritaire : Analyse mathématique de la politique, Paris, CNRS Editions, (ISBN 2-271-06265-9)
  • (en) Ken Binmore, Playing for Real : A Text on Game Theory, Oxford University Press US, (ISBN 9780195300574)
  • (en) Martin Osborne, Introduction to Game Theory, Oxford University Press, , 560 p.
  • (en) Avinash Dixit, David Reiley et Susan Skeath, Games of Strategy, WW Norton & Co., , 3e éd., 816 p. (ISBN 978-0393117516)
  • Vianney Dequiedt, Jacques Durieu et Philippe Solal, Théorie des jeux et applications, Paris, Economica, coll. « CorpusEconomie »,
  • Rida Laraki, Jérôme Renault et Sylvain Sorin, Bases mathématiques de la théorie des jeux, Éditions de l'École polytechnique, 2013 (ISBN 978-2-7302-1611-1)

Sources

Autres textes

  • (en) Ken Binmore et A. Brandenburger, « Common knowledge and game theory », dans : Ken Binmore, Essays on the Foundations of Game Theory, Oxford, A. Blackwell, 1990
  • Christian Schmidt, La théorie des jeux. Essai d'interprétation, PUF, Paris, 2001

Notes et références

Notes

  1. Son directeur de thèse en 1981 au MIT était Eric Maskin, lauréat en 2007.

Références

  1. a et b Cournot 1838.
  2. a et b Luce et Raiffa 1957.
  3. a et b (en) Lawrence Freedman, Strategy: A History, Oxford University Press, (ISBN 978-0-19-932515-3), p514.
  4. John Horton Conway, On Numbers and Games.
  5. a b c et d Christian Schmidt, « Deux prix Nobel pour la théorie des jeux », Revue d'économie politique, vol. 116, no 2,‎ , p. 133-145 (lire en ligne, consulté le ).
  6. « Le prix Nobel d'économie attribué aux Américains Alvin Roth et Lloyd Shapley », Le Monde,‎ (lire en ligne).
  7. a b et c (en) Colin Camerer, « Progress in Behavioral Game Theory », Journal of Economic Perspectives, vol. 11, no 4,‎ , p. 167-168 (lire en ligne, consulté le ).
  8. Bernard Guerrien, « A quoi sert la théorie des jeux ? », autisme-economie.org,‎ (lire en ligne, consulté le ).
  9. (en) Ariel Rubinstein, « How game theory will solve the problems of the Euro Bloc and stop Iranian nukes », Frankfurter Allgemeine Zeitung,‎ (lire en ligne).
  10. http://s691076032.onlinehome.fr/wp-content/uploads/2017/07/JeuSite.pdf.
  11. Rubinstein et Osborne 1994, p. 21.
  12. a et b Rubinstein et Osborne 1994, p. 30.
  13. Games and information: an introduction to game theory, Eric Rasmusen, p. 50.
  14. Berge C., 1958, Théorie des Graphes et ses Applications, Dunod.
  15. a b et c Rubinstein et Osborne 1994, p. 11, Définition 11.1.
  16. a et b Rubinstein et Osborne 1994, p. 13.
  17. Dans certains cas, la fonction de gain est aussi appelée fonction de paiement.
  18. a b c et d (en) Martin Osborne, « Strategic and extensive games », dans Steven Durlauf et Lawrence Blume, New Palgrave Dictionary of Economics, Palgrave Macmillan, (lire en ligne).
  19. En fait le graphe du jeu peut-être vu comme n'étant plus un arbre, mais comme étant un Graphe acyclique orienté.
  20. Rubinstein et Osborne 1994, p. 60.
  21. a et b (en) Don Ross, « Game Theory », dans The Stanford Encyclopedia of Philosophy, Edward N. Zalta, (lire en ligne).
  22. Rubinstein et Osborne 1994, p. 14.
  23. Rubinstein et Osborne 1994, p. 32.
  24. Rubinstein et Osborne 1994, p. 33, Proposition 33.1.
  25. Rubinstein et Osborne 1994, p. 51.
  26. (en) Ken Binmore, « Commentary: Nash's work in economics », Games and Economic Behavior, vol. 71, no 1,‎ , p. 2-5.
  27. Ernst Zermelo, Über eine Anwendung der Mengenlehre auf die Theorie des Schachspiels, Proceedings of the Fifth International Congress of Mathematicians, 1913, S. 501–504, en ligne.
  28. "On an Application of Set Theory to the Theory of the Game of Chess" in Rasmusen E., ed., 2001. Readings in Games and Information, Wiley-Blackwell: 79–82.
  29. Ulrich Schwalbe et Paul Walker, Zermelo and the Early History of Game Theory, vol. 34, , 123–137 p. (DOI 10.1006/game.2000.0794, lire en ligne).
  30. (en) Robert Aumann, « Correlated equilibrium as an expression of Bayesian rationality », Econometrica, vol. 55,‎ , p. 1-18.
  31. Voir la thèse de Olivier Guéant dirigée par Pierre-Louis Lions en ligne.
  32. a b et c (en) Avinash Dixit, « Thomas Schelling's Contributions to Game Theory », The Scandinavian Journal of Economics, vol. 108, no 2,‎ , p. 213-229 (lire en ligne, consulté le ).
  33. John Nash, Reinhard Selten et John Harsanyi en 1994, Thomas Schelling et Robert Aumann en 2005 et enfin Leonid Hurwicz, Eric Maskin et Roger Myerson en 2007.
  34. Hotelling 1929.
  35. (en) William Vickrey, « Counterspeculation, Auctions, and Competitive Sealed Tenders », The Journal of Finance, vol. 16,‎ , p. 8-37.
  36. (en) David Gale et Lloyd Shapley, « College Admissions and the Stability of Marriage », American Mathematical Monthly, vol. 69,‎ , p. 9-15.
  37. Ignacio Palacios-Huerta, L'économie expliquée par le foot, De Boeck, (lire en ligne).
  38. Mark Walker et John Wooders, « Minimax Play at Wimbledon », The American Economic Review, vol. 91,‎ , p. 1521-1538 (lire en ligne, consulté le ).
  39. (en) Jean-François Mignot, Strategic Behavior in Road Cycling Competitions, Springer International Publishing, coll. « Sports Economics, Management and Policy », (ISBN 978-3-319-22311-7 et 978-3-319-22312-4, lire en ligne), p. 207-231.
  40. a et b Downs 1957.
  41. McCarty et Meirowitz 2007, p. 1.
  42. (en) Donald Wittman, « Parties as utility maximizers », American Political Science Review, vol. 67, no 2,‎ .
  43. Laslier 2004.
  44. Roemer 2006.
  45. (en) Robert Erikson et Thomas Palfrey, « Equilibria in campaign spending games: Theory and data », American Political Science Review,‎ .
  46. (en) Tilman Klumpp et Mattias Polborn, « Primaries and the New Hampshire Effect », Journal of Public Economics, vol. 90, nos 6-7,‎ .
  47. (en) David Austen-Smith et Jeffrey Banks, « Elections, Coalitions, and Legislative Outcomes », American Political Science Review, vol. 82, no 2,‎ (lire en ligne, consulté le ).
  48. Claude Lévi-Strauss, Anthropologie structurale, Paris, Plon, (réimpr. 2012) (ISBN 9782266139311), p. 354 à 356.
  49. Claude Lévi-Strauss, « Les Mathématiques de l'Homme », In:Izard M.(dir):Claude Lévi-Strauss. Les Cahiers de l'Herne n°82, Paris, Flammarion,‎ , p. 56 et 66 (ISBN 9782081333550).
  50. a b et c (en) Richard Swedberg, « Sociology and Game Theory: Contemporary and Historical Perspectives », Theory and Society, vol. 30, no 3,‎ , p. 301-335 (lire en ligne, consulté le ).
  51. (en) Jessie Bernard, « The Theory of Games of Strategy as a Modern Sociology of Conflict », American Journal of Sociology, vol. 59, no 5,‎ , p. 411-424 (lire en ligne, consulté le ).
  52. Crozier, Michel et Friedberg, Erhard, “Organization and Collective Action. Our Contribution to Organizational Analysis”, in Bacharach, Samuel, Gagliardi Pasquale et Mundell Brian (dir), Research in the Sociology of Organizations. Vol. XIII, Special Issue on European Perspectives of Organizational Theory, Greenwich, CT Greenwich, C.T. JAI Press, 1995.
  53. Michel Crozier, Erhard Friedberg, L'acteur et le système, Paris, Seuil, 1977.
  54. Philippe Mongin, « Retour à Waterloo. Histoire militaire et théorie des jeux », Annales. Histoire, sciences sociales, vol. 63,‎ , p. 39-69 (lire en ligne, consulté le ).
  55. P.-H. Gouyon, J.-P. Henry et J. Arnould, Les avatars du gène, Belin, 335 p. (ISBN 2-7011-2187-6).
  56. Décrits par exemple dans le livre de Elwyn Berlekamp, Mathematical Go Engames.
  57. Rubinstein et Osborne 1994, p. 16.
  58. a et b Rubinstein et Osborne 1994, p. 15, exemple 15.3.
  59. Binmore 2007, p. 11.
  60. Rubinstein et Osborne 1994, p. 16, exemple 16.1.
  61. Binmore 2007, p. 32-33.
  62. Moulin 1986.
  63. Rubinstein et Osborne 1994, p. 35.
  64. (en) Rosemarie Nagel, « Unraveling in guessing games: An experimental study », American Economic Review, vol. 85, no 5,‎ , p. 1313-1326 (lire en ligne, consulté le ).
  65. (en) Robert Rosenthal, « Games of Perfect Information, Predatory Pricing and the Chain-Store Paradox », Journal of Economic Theory, vol. 25,‎ , p. 92-100 .
  66. Rubinstein et Osborne 1994, p. 106-107.
  67. (en) Robert McKelvey et Thomas Palfrey, « An Experimental Study of the Centipede Game », Econometrica, vol. 60, no 4,‎ (lire en ligne).
  68. (en) Ignacio Palacios-Huerta et Oscar Volij, « Field Centipedes », American Economic Review, vol. 99, no 4,‎ , p. 1619-1635.
  69. a b c et d Binmore 2007, p. 47-48.
  70. Extraits sur Google livres.

Voir aussi

Sur les autres projets Wikimedia :

Articles connexes

Liens externes