Centre rhone –alpes d’ingenerie sociale solidaire & territoriale





télécharger 282.74 Kb.
titreCentre rhone –alpes d’ingenerie sociale solidaire & territoriale
page7/9
date de publication08.02.2017
taille282.74 Kb.
typeDocumentos
d.20-bal.com > loi > Documentos
1   2   3   4   5   6   7   8   9

L’Homo œconomicus stratégique comme référence

Pour comprendre en détail comment s’opère la comparaison avec le modèle théorique, prenons ici un autre exemple de jeu, tout aussi simple et célèbre que le jeu de l’ultimatum discuté plus haut : le dilemme du prisonnier représenté dans la matrice ci-dessous [1].



Ce jeu ne comporte que deux joueurs et deux stratégies : coopérer (C) ou ne pas coopérer (NC). La coopération génère des bénéfices collectifs mais elle est individuellement coûteuse. Les paiements sont symétriques. La coopération des deux joueurs produit le paiement total le plus élevé et des paiements individuels égaux. Le choix de ne pas coopérer de la part des deux joueurs génère une situation inefficace dans laquelle chaque joueur reçoit une somme inférieure à celle qu’il obtiendrait si les deux joueurs coopéraient. Restent deux situations symétriques dans lesquelles un joueur coopère et l’autre pas. Celui qui ne coopère pas tire parti des efforts de l’autre sans lui-même en assumer les coûts et reçoit ainsi un paiement supérieur à ce qu’il obtiendrait en situation de pleine coopération. Le sort de celui qui coopère est en revanche pire que lorsqu’aucun des deux ne coopère.

La situation dans laquelle les deux joueurs ne coopèrent pas constitue ce que les théoriciens des jeux appellent un équilibre de Nash, c’est-à-dire une situation dans laquelle aucun des deux joueurs n’a intérêt à changer de stratégie, étant donné la stratégie d’équilibre de l’autre [2]. L’équilibre de Nash du jeu constitue ce que l’on appelle « la prédiction théorique ». L’autre issue qui présente un intérêt particulier est la situation dans laquelle les deux joueurs coopèrent, car il s’agit de l’optimum social. Elle maximise la somme des gains, et elle est de plus dite efficace (au sens de Pareto) [3] car aucune des trois autres issues n’est préférable pour les deux joueurs ensemble. Équilibre de Nash et optimum social constituent les deux situations de référence.

Il faut bien comprendre ce que ce résultat a d’étonnant. La théorie prédit que les joueurs décideront de ne pas coopérer alors qu’ils auraient un intérêt commun à le faire. Ces deux Homo œconomicus rationnels et stratégiques, qui ont pour unique objectif de maximiser leurs paiements, finissent avec un gain de 2€ à l’équilibre quand ils auraient pu se mettre d’accord pour avoir chacun quatre fois plus ! Ce résultat est particulièrement perturbant pour les économistes car la rationalité est censée être, par définition, la meilleure arme d’Homo oeconomicus pour maximiser son gain. Les économistes alors ont tenté de comprendre ce qui empêchait les joueurs de coopérer dans ces conditions.

Ils ont tout d’abord observé que les situations qui présentent les enjeux stratégiques du dilemme du prisonnier ne sont pas si courantes en économie car, la plupart du temps, les agents économiques ne sont pas dans des relations aussi éphémères où les décisions sont prises une bonne fois pour toutes. En particulier, la question de la coopération se pose lorsque les deux agents entretiennent une relation suivie dans le temps, qui les oblige à renouveler leur engagement mais qui leur permet aussi de revenir sur leurs décisions. Les théoriciens des jeux ont alors proposé un nouveau jeu, en répétant simplement plusieurs fois le dilemme du prisonnier de la matrice précédente. Ils ont ensuite montré que lorsque le jeu était répété indéfiniment, il était parfaitement rationnel de coopérer. En effet, la relation de long terme permet de soutenir la coopération par une « menace », qui peut être simplement le retour définitif à la situation de non-coopération (stratégie dite « de déclic »).

Malheureusement, si les joueurs savent que la relation aura une fin, plus rien n’est possible. En effet, selon la rationalité supposée dans un jeu répété de ce type, Homo œconomicus anticipe tout le déroulement du jeu, qu’il « résout » par induction à rebours en commençant par la fin. Or, à la dernière étape il n’est plus possible de brandir une quelconque menace puisque la relation ne sera pas poursuivie. Homo œconomicus raisonne alors comme dans le jeu simple, en un coup, et ne coopère pas. À l’avant-dernière étape, il anticipe ce qui se passera à la dernière et comprend que la menace n’est pas plus crédible à ce stade qu’au précédent. En continuant à raisonner à rebours de cette façon jusqu’à la première étape où s’engage la relation, Homo œconomicus en déduit que le mieux qu’il ait à faire est de ne jamais coopérer. Dès lors que la relation entre les deux agents est perçue comme étant finie, il n’y a plus de menace crédible et donc plus de coopération. Bien sûr, si le nombre de répétitions est important le raisonnement à rebours parait particulièrement artificiel. Il reste que la parfaite rationalité d’Homo œconomicus conduit à nouveau à une issue inefficace.

Homo œconomicus est-il trop intelligent ? La rationalité limitée

Il est possible de généraliser le dilemme du prisonnier à plus de deux joueurs. On obtient ainsi le jeu de contribution au bien public. Ce jeu est censé saisir les enjeux stratégiques qui se cachent derrière des problèmes réels complexes, tels que la contribution des différents pays à la diminution des gaz à effet de serre dans le cadre de la lutte contre le changement climatique, ou la mise en place de tout système de contribution volontaire en vue de fournir un bien public.

Le jeu de contribution au bien public a constitué la base de nombreux protocoles expérimentaux. Il s’agit cette fois-ci, dans le laboratoire, de mettre en relation un groupe de plus de deux sujets, toujours physiquement isolés dans leurs boxes, mais communicant par l’intermédiaire de leurs écrans selon des règles précisément décrites par l’expérimentateur. Chaque membre du groupe reçoit une somme au début de l’expérience et doit alors décider d’utiliser, ou pas, tout ou partie de cette somme pour contribuer à un pot commun. Ce qui n’est pas mis dans le pot commun est conservé comme paiement privé. Les instructions expliquent alors que le pot commun permet de générer un surplus, ou bien public, qui sera ensuite réparti également entre les membres. Formellement, le total des contributions du groupe est multiplié par un coefficient, variant selon les protocoles et traitements, mais qui est toujours inférieur au nombre de membres dans le groupe. En conséquence, les sujets sont incités à contribuer au pot commun pour produire un surplus, mais puisque ce surplus est partagé de façon égalitaire quelles que soient les contributions des uns et des autres, chaque sujet gagne davantage si ce sont seulement les autres qui contribuent. Le surplus le plus important est produit lorsque chaque sujet verse dans le pot commun l’intégralité de la somme qui lui a été allouée, ce qui correspond à l’optimum social. Prenons un exemple simple avec un coefficient de deux et quatre sujets qui ont chacun une dotation de 5€. Si chacun verse au pot commun la totalité de sa contribution, le bien public à partager sera de 40€ et chacun recevra 10€ en en ayant versé 5. Mais si trois sujets seulement versent 5€ et qu’un sujet ne verse rien, ce dernier qui aura conservé sa dotation recevra 12,50€ et les autres, seulement 7,50€.

La théorie prédit qu’Homo œconomicus ne contribuera pas et à l’équilibre de Nash la somme des contributions est nulle. En effet, chaque joueur n’a même pas à réfléchir à ce que vont faire les autres. Quoi qu’ils fassent, sa meilleure réponse est de ne rien verser au pot commun. Or cette situation est très inefficace car si chaque joueur conserve sa dotation, le groupe perd l’occasion de tirer parti du bien public. On est face au même problème que dans le dilemme du prisonnier, l’équilibre n’est pas efficace.

Avant d’en venir aux observations, nous devons préciser certains éléments du protocole. En général, dans les expériences, le jeu est répété plusieurs fois. Autrement dit, à chaque étape, chaque sujet a la même somme à sa disposition et doit décider de la part qu’il entend allouer au pot commun. Cette répétition a pour objet de permettre aux sujets de se familiariser avec les règles et de bien les comprendre. Or, théoriquement, comme dans le cas du dilemme du prisonnier, cette répétition n’a pas de conséquence sur le comportement observé d’Homo œconomicus qui, de la première à la dernière étape, ne contribue pas. Que font par contre les sujets des expériences ? Là encore, les nombreuses observations constituent de véritables faits stylisés en opposition avec les prédictions théoriques. Les contributions sont au départ, en général, de l’ordre de 40 à 60% de la dotation, puis diminuent pour se rapprocher du résultat théorique.

Selon une première interprétation, les sujets ont une rationalité limitée par rapport à Homo œconomicus. Ils ne sont pas capables de faire cette induction à rebours décrite plus haut et raisonnent donc dans le jeu répété comme si l’horizon était infini. Cette interprétation pourrait expliquer que leur comportement se rapproche du comportement théorique lorsque la fin de l’expérience approche, et donc que l’horizon apparaît manifestement fini. Ainsi les sujets seraient victimes d’une myopie qui ne leur permettrait pas de raisonner de façon rationnelle avant d’être suffisamment proches de la fin de l’expérience, mais cette limitation de leur rationalité leurs permettrait d’être plus proches de l’optimum social qu’Homo œconomicus.

Certains économistes ont voulu éliminer les effets stratégiques du jeu répété tout en laissant aux sujets la possibilité de pratiquer plusieurs fois les règles du protocole pour bien les maîtriser. Comment alors ne pas dénaturer l’esprit du jeu en le répétant plusieurs fois ? Ils ont proposé de comparer deux traitements. Dans le premier, dit traitement avec partenaires, le groupe de sujets reste le même pendant toute la durée de l’expérience ; dans le second, dit traitement avec étrangers, le groupe est reconstitué à chaque étape. L’idée sous-jacente est que les stratégies du jeu répété ne peuvent être mises en place qu’au sein d’un groupe de partenaires. La menace ne peut en effet être dissuasive si la relation n’est pas suivie dans le temps. On devrait donc s’attendre à ce que les sujets du traitement avec étrangers contribuent moins.

Or les résultats ont de quoi laisser perplexe Homo œconomicus. Dans les deux traitements, le schéma précédent persiste. Les contributions sont relativement généreuses au début puis diminuent pour atteindre des niveaux faibles en fin de partie. Il apparait clairement que la diminution est moins importante dans le traitement avec étrangers que dans le traitement avec partenaires, mais en définitive les sujets du traitement avec étrangers contribuent bien davantage que les sujets du traitement avec partenaires (Ledyard 1995). Plus rien ne semble tenir. Les interprétations en termes de coopération stratégique d’Homo œconomicus, même en supposant une rationalité limitée, ne marchent pas, puisque les sujets coopèrent même mieux lorsqu’ils n’ont pas de relation suivie.

Redéfinir la rationalité

Intrigués par ces résultats, les expérimentalistes se sont mis à regarder de plus près les données individuelles. S’écartant de la détection du comportement moyen et représentatif, ils ont pu découvrir une grande hétérogénéité de comportements. La littérature a alors développé un deuxième type d’interprétation, selon lequel les sujets n’ont pas une rationalité limitée par rapport à Homo œconomicus, mais des rationalités différentes. Autrement dit, il n’existerait pas une seule rationalité, celle qui est censée permettre à un individu un traitement optimal de l’information disponible pour maximiser son utilité, mais plusieurs. Plutôt que d’interpréter cette hétérogénéité comme la manifestation de comportements « déviants » par rapport à une norme rationnelle indépassable, les expérimentalistes ont commencé à étudier ces comportements hétérogènes comme doués d’une logique propre, et à établir des typologies.

Dans les expériences basées sur le jeu de contribution à un bien public qui nous intéressent ici, trois grandes catégories de sujets semblaient se dégager. Les opportunistes, qui se comportent comme Homo œconomicus, sont minoritaires. À l’inverse, des sujets versent la quasi-totalité de leur dotation dans le pot commun, indépendamment de ce que font les autres ; ceux-là aussi sont minoritaires. On trouve enfin les contributeurs conditionnels, qui commencent par contribuer beaucoup mais qui conditionnent ensuite leur générosité à celle qu’ont manifestée les autres au cours des étapes précédentes. Cette typologie permet de donner une tout autre interprétation des faits stylisés décrits ci-dessus. Selon cette interprétation, les contributions du début de la séquence résultent de la moyenne des contributions élevées des contributeurs inconditionnels et conditionnels et des contributions nulles ou faibles des opportunistes. Puis, au fur et à mesure que les contributeurs conditionnels observent un total des contributions en deçà de leurs espérances, ils commencent à diminuer leurs propres contributions, ce qui provoque un effet d’entraînement délétère. Parce qu’ils ne recourent pas à des menaces mais regardent vers le passé, les contributeurs conditionnels ne seront pas plus optimistes dans un groupe de partenaires que dans un groupe d’étrangers. La baisse de leurs contributions n’est pas une punition infligée à des partenaires qui ne sont pas suffisamment coopératifs mais manifeste leur adaptation aux circonstances. Ainsi dans le traitement avec étrangers, certains contributeurs conditionnels retrouvent parfois un peu d’optimisme sachant que la constitution du groupe change, et contribuent davantage qu’à l’étape précédente, ce qui ralentit la diminution du pot commun.

Cette interprétation en termes de rationalités différentes n’est pas sans rappeler une expérience d’un tout autre type, menée au début des années 1980 par le politiste américain Robert Axelrod (1984). Celui-ci avait lancé un tournoi entre des chercheurs de différentes disciplines, politistes, économistes, théoriciens des jeux, mathématiciens, statisticiens et autres, leurs demandant de proposer une stratégie pour jouer le dilemme du prisonnier répété. Si la théorie considère que l’équilibre en stratégies dominantes est particulièrement robuste parce que le joueur n’a pas besoin de savoir ce que sera la stratégie de son concurrent pour faire son choix, c’est parce qu’elle pose une hypothèse forte : tout le monde raisonne de la même façon. Axelrod lança son tournoi parce qu’il doutait de cette robustesse. Chaque participant soumit sa stratégie sous forme d’un mini programme. Axelrod associa chaque stratégie à une autre stratégie candidate, tirée au sort dans l’ensemble des propositions, pour jouer le dilemme du prisonnier cent fois. Pour chaque stratégie, il répéta l’opération des dizaines de fois, associant à chaque fois la stratégie à une concurrente tirée au sort. Il, calcula ainsi un score sur la base de la moyenne des gains de la stratégie. La stratégie gagnante fut une stratégie très simple, proposée par le politiste Anatol Rapoport et dénommée « Tit for Tat » [un prêté pour un rendu]. Tit for Tat commence toujours par coopérer puis fait, à chaque étape, ce que le concurrent a fait à l’étape précédente. Homo Œconomicus gagne (de peu) contre Tit for Tat seule, mais Tit for Tat fait bien mieux lorsque la stratégie est confrontée à tout un ensemble de stratégies différentes.

L’expérience d’Axelrod a pu servir d’argument au développement d’une nouvelle approche des situations d’interaction en économie, concurrente de la théorie des jeux standard, à savoir la théorie des jeux évolutionnaires. Selon cette approche, les agents ne sont plus nécessairement aussi rationnels qu’Homo œconomicus. Ce sont au contraire des automates aux stratégies très simples, mais différentes. Les jeux évolutionnaires reposent sur des méthodes construites par analogie avec la sélection naturelle darwinienne. Cette approche a d’ailleurs d’abord été développée dans les années 1970 en biologie, notamment par John Maynard Smith (Maynard Smith 1982), avant d’être importée en économie.

L’objectif de cette approche est de savoir comment, dans une population hétérogène d’agents, les proportions des différentes stratégies vont évoluer. Selon une première méthode, on considère une population hétérogène d’individus. Chacun se caractérise par une stratégie fixe. Les individus de cette population se rencontrent maintes fois de façon aléatoire. Ils se « reproduisent » alors proportionnellement à l’utilité qu’ils retirent de leurs interactions. Ce processus, qui fait évidemment écho à l’idée de sélection naturelle, est appelé la « dynamique du réplicateur ». Cette dynamique peut, à long terme, converger vers des proportions fixes des différentes stratégies.

Une autre méthode consiste à imaginer qu’existe une stratégie prévalente que tout le monde a adoptée. La population de départ est alors homogène et la question se pose de savoir si cette situation est stable. Des individus mutants, caractérisés par une autre stratégie, sont introduits de façon aléatoire dans la population à chaque période. On dit alors qu’une stratégie est évolutionnairement stable si la population homogène de départ ne peut pas être envahie par une stratégie mutante. Autrement dit, les individus jouant la stratégie mutante qui sont introduits dans la population ne parviennent pas à avoir une utilité supérieure à ceux qui continuent à jouer l’ancienne stratégie. On comprend que, dans cette approche, la rationalité est transférée du niveau de l’individu au niveau de la société. Loin de l’individualisme méthodologique cher aux sciences économiques, et en dépit de limites techniques importantes, cette littérature théorique continue de se développer parallèlement aux études consacrées à la rationalité de l’individu. Ces dernières ont connu par ailleurs d’autres bouleversements, comme nous allons le voir.
1   2   3   4   5   6   7   8   9

similaire:

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale
«Le syndicalisme européen est un acteur institutionnel; ce n'est pas un mouvement transnational»

Centre rhone –alpes d’ingenerie sociale solidaire & territoriale iconCentre rhone –alpes d’ingenerie sociale solidaire & territoriale
«Faut-il attendre la croissance ?» et «Einstein avait raison. IL faut réduire le temps de travail»






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com