Le dilemme du prisonnier

01 de 04

Le dilemme du prisonnier

Le dilemme du prisonnier est un exemple très populaire de jeu à deux interaction stratégique , et c'est un exemple d'introduction courant dans de nombreux manuels de théorie des jeux. La logique du jeu est simple :





  • Les deux joueurs du jeu ont été accusés d'un crime et ont été placés dans des pièces séparées afin qu'ils ne puissent pas communiquer entre eux. (En d'autres termes, ils ne peuvent pas s'entendre ou s'engager à coopérer.)
  • Chaque joueur est invité indépendamment s'il va avouer le crime ou garder le silence.
  • Parce que chacun des deux joueurs a deux options possibles (stratégies), il y a quatre résultats possibles au jeu.
  • Si les deux joueurs avouent, ils sont chacun envoyés en prison, mais pour moins d'années que si l'un des joueurs était dénoncé par l'autre.
  • Si un joueur avoue et que l'autre reste silencieux, le joueur silencieux est sévèrement puni tandis que le joueur qui a avoué peut être libéré.
  • Si les deux joueurs restent silencieux, ils reçoivent chacun une punition moins sévère que s'ils avouent tous les deux.

Dans le jeu lui-même, les punitions (et les récompenses, le cas échéant) sont représentées par utilitaire Nombres. Les nombres positifs représentent de bons résultats, les nombres négatifs représentent de mauvais résultats, et un résultat est meilleur qu'un autre si le nombre qui lui est associé est supérieur. (Attention toutefois à la façon dont cela fonctionne pour les nombres négatifs, puisque -5, par exemple, est supérieur à -20 !)

Dans le tableau ci-dessus, le premier nombre de chaque case fait référence au résultat pour le joueur 1 et le deuxième nombre représente le résultat pour le joueur 2. Ces nombres ne représentent qu'un des nombreux ensembles de nombres qui sont cohérents avec la configuration du dilemme des prisonniers.



02 de 04

Analyser les options des joueurs

Une fois qu'un jeu est défini, la prochaine étape de l'analyse du jeu consiste à évaluer les stratégies des joueurs et à essayer de comprendre comment les joueurs sont susceptibles de se comporter. Les économistes font quelques hypothèses lorsqu'ils analysent les jeux - premièrement, ils supposent que les deux joueurs sont conscients des gains à la fois pour eux-mêmes et pour l'autre joueur, et, deuxièmement, ils supposent que les deux joueurs cherchent à rationnellement maximiser leur propre gain du jeu.

Une première approche simple consiste à rechercher ce qu'on appelle stratégies dominantes - des stratégies qui sont les meilleures quelle que soit la stratégie choisie par l'autre joueur. Dans l'exemple ci-dessus, choisir d'avouer est une stratégie dominante pour les deux joueurs :



  • Avouer est préférable pour le joueur 1 si le joueur 2 choisit d'avouer puisque -6 vaut mieux que -10.
  • Avouer est préférable pour le joueur 1 si le joueur 2 choisit de se taire car 0 vaut mieux que -1.
  • Avouer est préférable pour le joueur 2 si le joueur 1 choisit d'avouer puisque -6 vaut mieux que -10.
  • Avouer est préférable pour le joueur 2 si le joueur 1 choisit de se taire car 0 vaut mieux que -1.

Étant donné que l'aveu est préférable pour les deux joueurs, il n'est pas surprenant que le résultat où les deux joueurs avouent soit un résultat d'équilibre du jeu. Cela dit, il est important d'être un peu plus précis avec notre définition.

03 de 04

Équilibre de Nash

Le concept d'équilibre de Nash a été codifié par le mathématicien et théoricien des jeux John Nash. En termes simples, un équilibre de Nash est un ensemble de stratégies de meilleure réponse. Pour un jeu à deux joueurs, un équilibre de Nash est un résultat où la stratégie du joueur 2 est la meilleure réponse à la stratégie du joueur 1 et la stratégie du joueur 1 est la meilleure réponse à la stratégie du joueur 2.

Trouver l'équilibre de Nash via ce principe peut être illustré dans le tableau des résultats. Dans cet exemple, les meilleures réponses du joueur 2 au joueur 1 sont encerclées en vert. Si le joueur 1 avoue, la meilleure réponse du joueur 2 est d'avouer, puisque -6 vaut mieux que -10. Si le joueur 1 n'avoue pas, la meilleure réponse du joueur 2 est d'avouer, puisque 0 vaut mieux que -1. (Notez que ce raisonnement est très similaire au raisonnement utilisé pour identifier les stratégies dominantes.)

Les meilleures réponses du joueur 1 sont encerclées en bleu. Si le joueur 2 avoue, la meilleure réponse du joueur 1 est d'avouer, puisque -6 vaut mieux que -10. Si le joueur 2 n'avoue pas, la meilleure réponse du joueur 1 est d'avouer, puisque 0 vaut mieux que -1.



L'équilibre de Nash est le résultat où il y a à la fois un cercle vert et un cercle bleu, car cela représente un ensemble de meilleures stratégies de réponse pour les deux joueurs. En général, il est possible d'avoir plusieurs équilibres de Nash ou aucun (du moins dans les stratégies pures comme décrit ici).

04 de 04

Efficacité de l'équilibre de Nash

Vous avez peut-être remarqué que l'équilibre de Nash dans cet exemple semble sous-optimal d'une certaine manière (en particulier, en ce sens qu'il n'est pas optimal au sens de Pareto) puisqu'il est possible pour les deux joueurs d'obtenir -1 plutôt que -6. C'est un résultat naturel de l'interaction présente dans le jeu - en théorie, ne pas avouer serait une stratégie optimale pour le groupe collectivement, mais les incitations individuelles empêchent ce résultat d'être atteint. Par exemple, si le joueur 1 pensait que le joueur 2 resterait silencieux, il aurait intérêt à le dénoncer plutôt qu'à rester silencieux, et vice versa.



Pour cette raison, un équilibre de Nash peut également être considéré comme un résultat où aucun joueur n'a d'incitation à s'écarter unilatéralement (c'est-à-dire par lui-même) de la stratégie qui a conduit à ce résultat. Dans l'exemple ci-dessus, une fois que les joueurs ont choisi d'avouer, aucun joueur ne peut faire mieux en changeant d'avis par lui-même.