Corps de l’article

Introduction

La conception des règles de vote donnant lieu aux choix collectifs pose la question importante de savoir si une « bonne » règle de vote devrait permettre de saisir et de rendre pleinement l’intensité des préférences des électeurs pour les différents candidats en lice. C’est cette question que nous souhaitons explorer dans cette étude. Les domaines de l’informatique, de la recherche opérationnelle et de la science politique ont été les premiers à s’intéresser à l’étude et à la conception des systèmes de vote qui permettent aux électeurs d’exprimer l’intensité de leurs préférences (voir Meek, 1975; Nurmi, 1981; Merrill, 1984; Cook et Kress, 1985; Merrill. 1985; Nurmi, 1993). Or, bon nombre de ces contributions initiales n’ont pas examiné la question des comportements stratégiques manifestés par les électeurs : on peut en effet attendre de ces derniers qu’ils exagèrent l’intensité de leurs préférences si ce comportement leur permet d’influencer les décisions collectives en leur faveur. Par conséquent, pour établir ce qui constitue une « bonne » procédure de vote lorsque les préférences des électeurs sont des informations privées, il est indispensable d’étudier la mesure dans laquelle les règles de vote incitent les individus à exprimer l’intensité de leurs préférences[1].

Un moyen de répondre à cette question en termes généraux serait d’adopter une approche de mechanism design dans un cadre qui prend en compte l’intensité des préférences des électeurs par l’intermédiaire de leurs utilités de Bernoulli à l’égard des candidats, ces utilités étant des informations privées. Cependant, les défis techniques seraient énormes, car il faudrait concevoir des mécanismes adaptés à des environnements au sein desquels les transferts monétaires ne peuvent pas servir d’instrument pour inciter les électeurs à communiquer leurs informations privées[2]. Pour contourner ces problèmes, nous étudions le comportement de vote à l’équilibre pour une catégorie particulière de règles de vote. Les équilibres induits par les différentes règles considérées sont alors comparés en fonction de leur efficacité à représenter l’ensemble des préférences de l’électorat.

En nous questionnant sur les systèmes de vote qui représentent au mieux les désirs des électeurs, nous reprenons un thème tiré de Weber (1978)[3]. Il a répondu à cette question (quoique de façon asymptotique dans un cadre caractérisé par un électorat arbitrairement grand) en proposant une mesure qui évalue l’efficacité avec laquelle un système de vote représente les préférences de l’ensemble de l’électorat. Dans cet article, nous proposons de modifier la mesure d’efficacité de Weber afin de comparer un large éventail de règles de vote (qui sont nombreuses à permettre l’expression de l’intensité des préférences) dans notre cadre d’analyse. Celui-ci comprend un nombre fini d’électeurs disposant d’informations privées quant à leurs préférences à l’égard des candidats. La principale différence avec Weber est l’existence de cas où le jeu induit par chaque règle de vote se solde par un seul équilibre de vote symétrique. Cela signifie que nous pouvons réellement comparer l’efficacité de deux règles de vote quelconques sans avoir à s’inquiéter du fait qu’il pourrait exister d’autres équilibres pour lesquels l’ordre de leur niveau d’efficacité serait inversé[4].

Les règles de vote sur lesquelles nous mettrons l’accent dans la dernière partie de cette recherche sont les règles de score à deux paramètres qui comprennent, comme cas particuliers, les procédures de vote bien connues telles que la règle de pluralité, la règle de Borda et le vote par assentiment, entre autres[5]. Une règle de score à deux paramètres nécessite de chaque électeur qu’il transmette un vecteur dont les composantes représentent les scores qu’il attribue aux candidats en lice. Plus précisément, chaque électeur doit assigner le score 1 à un candidat, le score 0 à un autre candidat, et un autre score entre x ou y (où 0 ≤ x ≤ y ≤ 1) au candidat qui reste. La somme par composantes de tous les vecteurs de scores transmis par les électeurs permet de sélectionner le candidat qui obtient le score le plus élevé, les ex aequo étant départagés de façon équiprobable.

Dans notre étude des règles de score à deux paramètres présentée dans la seconde partie de cet article, nous adoptons un cadre bayésien : chaque électeur est caractérisé par un vecteur composé de trois utilités de Bernoulli, une à l’égard de chacun des candidats et ces informations sont privées. L’état du monde est représenté par la collection de tous les vecteurs d’utilités des électeurs et est, d’un point de vue ex ante, modélisé comme une variable aléatoire dont la distribution de probabilité a priori est de connaissance commune. Comme il est d’usage dans la littérature sur la conception des mécanismes, nous supposons que cette distribution d’utilité est symétrique par rapport aux électeurs et neutre par rapport aux candidats (voir,par exemple, Schmitz et Tröger, 2012). Cette dernière propriété signifie que, pour un électeur donné, tous les classements ordinaux des trois candidats ont la même probabilité d’occurrence[6]. À l’étape intermédiaire à laquelle le vote a lieu, chaque électeur est pleinement informé de son propre vecteur d’utilités, mais pas de ceux des autres électeurs. L’efficacité d’une règle de score sera calculée au stade ex ante. D’après Weber (1978), l’efficacité est définie, en gros, comme le rapport entre l’espérance de bien-être utilitariste générée par le candidat vraiment élu en fonction de la règle de score et l’espérance de bien-être utilitariste générée par le candidat optimal du point de vue social. Ces deux espérances sont calculées par rapport à l’état du monde qui est inconnu ex ante. Comme il y a des règles de score à deux paramètres qui permettent l’expression de l’intensité des préférences (en l’occurrence celles avec x < y), nous pouvons traiter de la première question, à savoir si les règles de vote les plus efficaces permettent aux électeurs d’exprimer l’intensité de leurs préférences.

Pour caractériser le comportement de vote dans notre cadre d’analyse, nous caractérisons les équilibres bayésiens symétriques du jeu induit par les règles de score à deux paramètres. Notre première contribution principale est de montrer que la stratégie symétrique d’équilibre utilisée par les électeurs pour chaque règle de score exige que le vote soit sincère. Cela signifie que le vecteur de scores communiqué par un électeur correspond toujours à ses vraies préférences ordinales concernant les candidats. Il s’ensuit donc immédiatement que toutes les règles de score qui ne permettent pas aux électeurs d’exprimer l’intensité de leurs préférences induisent un seul équilibre bayésien sincère[7]. Ces résultats sont à rapprocher des résultats principaux de Carmona (2012). Il démontre que, dans son cadre d’analyse (qui diffère du nôtre), tous les équilibres symétriques induits par les règles de score ordinales impliquent généralement un comportement de vote sincère de la part des électeurs. Le fait que les électeurs votent de façon sincère dans tous les équilibres de notre modèle contraste avec l’existence d’équilibres avec vote stratégique dans certaines des contributions fondamentales de la littérature sur le vote (comme dans Myerson et Weber, 1993). Le contraste est notable parce que les preuves empiriques du vote stratégique paraissent limitées (voir par exemple, Blais et Degan, 2017).

Notre deuxième contribution est de montrer que pour toutes les règles de score à deux paramètres où x < y , une stratégie d’équilibre pour tout électeur repose sur un critère de seuil qui permet à l’électeur de déterminer s’il doit attribuer le score plus bas de x ou le score plus élevé de y au candidat qu’il classe au milieu en termes de préférences. Le seuil, défini comme la moyenne pondérée des utilités de Bernoulli de l’électeur, utilités associées au candidat qu’il préfère et au candidat qu’il aime le moins, peut être dégénéré (c’est-à-dire qu’il est égal à l’utilité associée au candidat préféré). Dans ce cas, l’électeur ne fera pas usage de la possibilité d’exprimer l’intensité de ses préférences. Notre deuxième résultat principal montre que dans les situations où il y a soit trois électeurs, soit cinq électeurs ou plus (que ce nombre soit pair ou impair), la stratégie de vote symétrique d’équilibre pour chaque règle de score où x < y implique l’expression de l’intensité des préférences.

Il est important de souligner que chaque fois que l’intensité des préférences est révélée à l’équilibre, la valeur précise du seuil caractérisant la stratégie de vote d’équilibre dépend des paramètres x et y de la règle de score et de la distribution des utilités. Formuler une expression analytique pour établir le seuil d’équilibre en fonction de ces paramètres du modèle sera, en général, impossible. En conséquence, la valeur du seuil à l’équilibre devra être obtenue à l’aide de simulations numériques[8]. C’est la raison pour laquelle nous rapportons des simulations numériques décrivant les niveaux d’efficacité générés par les différentes règles de score. Pour obtenir ces résultats, nous nous concentrons sur le cas de trois électeurs, puisqu’il s’agit du nombre d’électeurs le plus petit pour lequel l’intensité des préférences est transposée dans un équilibre pour toutes les règles de score à deux paramètres qui permettent son expression.

Nos simulations numériques indiquent que la règle de pluralité et le vote négatif sont les règles de score à deux paramètres les moins efficaces. Les règles les plus efficaces tendent à être celles qui présentent une valeur x relativement petite et une valeur y relativement grande. De telles règles permettent aux électeurs de transmettre à la fois leur classement ordinal complet et un certain degré d’intensité de leurs préférences. Bien que le vote par assentiment soit beaucoup plus efficace que la règle de pluralité et le vote négatif, il est dépassé par la meilleure règle ordinale[9]. Ce n’est pas étonnant, car le vote par assentiment permet l’expression de l’intensité des préférences, mais ne donne pas aux électeurs la possibilité d’exprimer sans ambiguïté leurs classements ordinaux. Nous constatons qu’il y a un gain à passer de la règle ordinale la plus efficace à la règle de score à deux paramètres la plus efficace, bien qu’il soit assez minime. Par conséquent, et compte tenu de la complexité supplémentaire imposée aux électeurs en situation réelle d’élection, il vaut peut-être mieux ne pas introduire des règles de vote qui permettent l’expression de l’intensité des préférences[10].

Le reste de cette étude est structuré comme suit. Dans la section 1, nous introduisons le modèle général et les concepts de base. Dans la section 2, nous présentons un tour d'horizon sélectif sur le vote, tandis que dans la section 3, nous précisons notre cadre bayésien de vote. Dans la section 4, nous présentons ensuite les caractéristiques de l’équilibre bayésien symétrique induit par toutes les règles de score à deux paramètres et un nombre quelconque d’électeurs. Dans la section 5, nous comparons les niveaux d’efficacité des diverses règles de score à deux paramètres dérivés de nos simulations numériques. La section 6 offre une brève conclusion.

1. Le modèle

Dans cette section, nous décrivons un modèle général qui englobe une grande partie de la littérature sur l’évaluation et la comparaison des différentes règles de vote. La structure de base du modèle est décrite dans la prochaine sous-section et les composantes du modèle sont précisées dans les sous-sections qui suivent[11].

1.1 Structure de base et séquence du jeu

Nous proposons ici un modèle de vote général dans lequel les règles de vote sont évaluées derrière le « voile d’ignorance » dans le sens où le concepteur est incertain des préférences des électeurs au sein de l’électorat. L’incertitude quant au profil de préférence de l’électorat est prise en compte au moyen d’une distribution de probabilité a priori commune sur tous les profils de préférence possibles, et le concepteur choisit une règle de vote qui maximise la valeur espérée ex ante de certains critères d'évaluation relativement à la distribution de probabilité a priori des profils de préférence des électeurs. Ce modèle général est défini par la séquence suivante :

  • Étape 1 : Le concepteur choisit une règle de vote au sein d’une famille de règles de vote disponibles.

  • Étape 2 : La nature choisit un état du monde – qui ici est un profil de préférence pour tout l’électorat – conformément à la distribution de probabilité commune a priori.

  • Étape 3 : Les électeurs reçoivent de l’information (partielle ou complète) sur l’état du monde et révisent leurs croyances en utilisant la règle de Bayes.

  • Étape 4 : Sur la base de leurs informations privées, de leurs croyances et de leurs préférences, les électeurs jouent un jeu dont les règles sont fixées par la règle de vote choisie par le concepteur.

Nous allons maintenant décrire avec plus de précision les composantes du modèle qui viennent d’être mentionnées.

1.2 Électeurs, candidats et préférences

Nous noterons N = {1, 2,…, n + 1} l’ensemble fini de joueurs qui comprend | | = n + 1 électeurs. Les électeurs doivent collectivement faire un choix à partir de l’ensemble fini K de candidats ou options en votant individuellement, conformément à une règle de vote R. Chaque électeur  N a un ordre de préférence sur K qui dépend de son type. Cela va nous permettre de modéliser l’idée que n’importe quel choix d’une règle de vote et de la décision qui s’ensuit sur la façon de voter doivent généralement se faire sans connaissance parfaite des préférences des électeurs. Pour chaque électeur  N, il existe un ensemble i des types possibles. Chaque type ti ∈ T i de l’électeur  N donne lieu à une fonction von Neumann-Morgenstern (vNM) d’utilité ui : × T i → R, (kti) ↦ ui(kti) de laquelle découle, par voie de conséquence, un ordre de préférenceforme: 2043019n.jpg des candidats dans K[12],[13]. Par exemple, si K = {ABC} et le type ti de l’électeur i est tel que forme: 2043020n.jpg.

1.3 Règles de vote

Une règle de vote est une forme de jeu R sur un ensemble K de candidats qui précise des ensembles d’actionsforme: 2043021n.jpg et une fonction de résultat forme: 2043022n.jpg, forme: 2043023n.jpg, où Δ(K) désigne l’ensemble de toutes les distributions de probabilité sur K permettant de tenir compte de la possibilité d’avoir à départager de façon aléatoire des ex aequo entre candidats. La règle de vote R (de pair avec les fonctions d’utilité des électeurs et leurs croyances quant aux types des autres électeurs) induit un jeu entre n + 1 électeurs qui peut être de forme normale ou extensive, incluant le cas échéant une incertitude exogène se présentant comme une « décision » du hasard. Ce cadre est suffisamment riche pour englober des protocoles de vote unique comme, par exemple, les règles de pluralité ou de Borda, mais aussi les procédures de vote dynamique comme la pluralité avec élimination, et bien d’autres. Étant donné R, chaque électeur i dispose d’un ensemble forme: 2043024n.jpg de stratégies (pures), où forme: 2043025n.jpg désigne une stratégie précise de l’électeur i. Chaque résultat r(σ) du jeu de vote correspond au choix d’un candidat dans K, et nous écrivons forme: 2043026n.jpg et forme: 2043027n.jpg en vue de simplifier les notations.

Une règle de vote est dite directe (DVR en anglais pour direct voting rule) si elle exige de chaque électeur qu’il dévoile directement ses préférences au concepteur, c’est-à-dire, forme: 2043028n.jpg pour tous les électeurs ∈ N. Une DVR est ordinale si elle demeure constante lorsque l’utilité est recalibrée. Sans perte de généralités, nous pouvons définir une DVR ordinale comme une règle où forme: 2043029n.jpg, avec Li qui désigne l’ensemble des classements ordinaux possibles des candidats dans K induits par i. Par exemple, si K = {AB, C}, alors Li pourrait comprendre jusqu’à 13 classements possibles ou seulement six classements stricts si l’électeur i n’est jamais indifférent entre deux candidats. Désormais, nous allons désigner par L les ordres de préférence stricts sur K[14].

1.4 Structure de l’information

Nous supposons que le profil de types forme: 2043030n.jpg est inconnu ex ante lorsque le concepteur choisit la règle de vote qui est utilisée par la suite pour effectuer le choix collectif à partir de l’ensemble de candidats dans K. La distribution de probabilité subjective du concepteur se présente sous les traits d’une distribution de probabilité jointe λ, où λi est la distribution de probabilité marginale sur i. Par exemple, dans la deuxième partie de cet article, nous étudierons le cas particulier où K = {ABC}, i = [0, 1]3, forme: 2043831n.jpg, forme: 2043832n.jpg, et forme: 2043031n.jpg pour tous les électeurs ∈ N. Dans ce cadre, nous allons supposer en outre que forme: 2043032n.jpg (où forme: 2043033n.jpg ∈ [0, 1] pour tous les k ∈ K) et que forme: 2043034n.jpg pour tous les i ∈ N, où g est une fonction de densité continue et strictement positive sur (0, 1). Ces hypothèses impliquent que les types t1t2,…, tn+1 des n + 1 électeurs sont stochastiquement indépendants et de probabilité identique (i.i.d.) et que la probabilité qu’un électeur donné ait un classement ordinal particulier soit la même pour chacun des six classements ordinaux possibles sur K = {AB, C} c’est à dire 1/6. Il en résulte que les profils des ordres de préférence des électeurs sont équiprobables : la probabilité d’occurrence est égale à forme: 2043035n.jpg. Cette structure de l’information est dite de culture impartiale (IC en anglais) dans la littérature consacrée à l’approche statistique du choix social. Voir par exemple, Lepelley et Valognes (2003).

Le cas où K = {AB, C}et où l’ensemble de types Ti de chaque électeur correspond à l’ensemble L de tous les classements stricts de candidats dans K fournit un autre exemple (voir Gehrlein et Lepelley, 2001; Gehrlein, Lepelley et Plassmann, 2016 et Green-Armytage,Tideman et Cosman, 2016). Dans de tels contextes, le terme culture impartiale anonyme (IAC en anglais) désigne la structure de l’information suivant laquelle les profils de types réels ∈ T de l’électorat ne peuvent pas être observés directement, alors que l’information sommaire sur le nombre d’électeurs dans n + 1 favorisant chacun des six classements dans L devient observable. Plus précisément, ce qui devient observable est un vecteur (l1l2,…, l6) avec l1 + l2 +…+ l6 = n + 1 où l1 est le nombre d’électeurs dont le premier ordre de préférence se trouve dans L, l2 est le nombre d’électeurs dont le deuxième ordre de préférence se trouve dans L et ainsi de suite (un tel vecteur (l1l2,…, l6) désigne ce que Lepelley et Valognes (2003) considèrent comme une situation de vote). Par exemple, s’il y a n + 1 = 3 électeurs dans N, alors il y a par conséquent 56 façons de répartir ces trois électeurs entre les 6 ordres stricts de préférence dans L. Plus précisément, il existe 6 situations de vote vis-à-vis desquelles les 3 électeurs affichent le même classement ordinal, il existe 30 situations de vote vis-à-vis desquelles 2 des 3 électeurs affichent le même classement ordinal, tandis que l’électeur qui reste affiche un classement différent et, finalement, il existe 20 situations de vote vis-à-vis desquelles chacun des 3 électeurs possède un classement ordinal différent dans L. Dans un contexte IAC, on suppose que toutes les situations de vote sont aussi probables les unes que les autres, ce qui signifie dans le cas de cet exemple que chaque situation de vote a une probabilité d’occurrence de 1/56 [15].

À l’étape intermédiaire (c’est-à-dire, une fois que le concepteur a choisi la règle de vote et que la nature a choisi un profil de types ∈ T, mais avant que les électeurs aient voté), nous pouvons distinguer deux autres environnements : dans l’environnement bayésien, chaque électeur i ∈ N apprend son type ti, mais pas celui des autres électeurs. Compte tenu de son type ti, chaque électeur actualise sa perception du profil de types des autres électeurs, conformément à la règle de Bayes. Il s’agit ici de l’hypothèse utilisée dans le contexte de vote spécifique présenté dans la section 4 ci-dessous. Selon une autre hypothèse, tous les électeurs prennent connaissance de l’entièreté du profil de types t. C’est ce qu’on appelle l’environnement d’information complet (voir par exemple, De Sinopoli, Dutta et Laslier, 2006 et Buenrostro, Dhillon et Vida, 2013).

1.5 Comportement de vote

1.5.1 Choix rationnel dans le cadre bayésien

Dans ce cas, les électeurs jouent un jeu bayésien, induit par la règle de vote R, de leurs propres types ti, ainsi que de leurs croyances a posteriori quant aux types des autres électeurs, croyances qu’ils ont obtenues en actualisant la distribution a priori λ. Pour chaque électeur i ∈ N, une stratégie pure est une fonction de vote forme: 2043036n.jpg[16]. Donc, vi spécifie pour chaque type ti un bulletin σi ∈ σi que l’électeur i doit transmettre. Un équilibre de Bayes-Nash de ce jeu est un profil (v1(⋅), v2(⋅),…,vn+1(⋅)) de n + 1 fonctions de vote (une pour chaque électeur), tel que pour chaque i ∈ N :

pour tous les ti ∈ i et σi ∈ ΣiR

forme: 2043038n.jpg désigne le profil des fonctions de vote pour tous les électeurs autres que i.

1.5.2 Choix rationnel en information complète

Dans ce cas, les électeurs se prêtent à un jeu en information complète compte tenu de leur connaissance de l’entièreté du profil de types t pour l’ensemble de l’électorat (voir, par exemple, De Sinopoli, Dutta et Laslier, 2006). Dans le cas de jeux de vote simultanés, les concepts d’équilibre appropriés comprennent : l’équilibre de Nash, l’équilibre de Nash non dominé, l’équilibre de Nash parfait en main tremblante (voir Selten, 1975), l’équilibre de Nash propre (voir Myerson, 1978) et l’équilibre de Nash Mertens-stable (voir Mertens, 1989). Comme l’ont souligné De Sinopoli, Dutta et Laslier (2006), la raison de procéder à des raffinements de l’équilibre de Nash tient à son manque de pouvoir prédictif dans les jeux de vote en information complète, par exemple dans le jeu induit par le vote par assentiment. En ce qui concerne les jeux de vote sous forme extensive, l’équilibre de Nash parfait en sous-jeux et ses raffinements constituent des concepts appropriés.

1.5.3 Autres normes de comportement

Dans la théorie du vote, il est souvent supposé que les électeurs votent de façon sincère. Selon la règle de vote considérée, il n’est pas toujours simple de définir la sincérité. Par exemple, dans le cas du vote par assentiment, une stratégie est dite sincère (selon Brams et Fishburn, 1978) si un électeur qui approuve (sincèrement) un candidat donné  K approuve également tout candidat qu’il préfère à k. En ce qui concerne les règles de vote directe, il est aisé de définir la sincérité comme la révélation du véritable type d’un électeur. S’il est de toute évidence contraignant de simplement supposer que le vote est sincère (plutôt que de l’obtenir de façon endogène dans l’équilibre induit par un jeu où les électeurs ont l’opportunité de voter de façon stratégique ou de dissimuler leur vrai type), certaines études empiriques ne rejettent pas systématiquement l’hypothèse de vote sincère (voir par exemple, Blais et Degan, 2017). Ainsi, il est peut-être justifié d’étudier et de comparer les propriétés de règles de vote particulières (par exemple, leur tendance à sélectionner le gagnant de Condorcet, chaque fois qu’il en existe un) sous l’hypothèse de la sincérité du vote.

1.6 Critères d'évaluation

Il est utile de contraster les objectifs privés et sociaux. Tout électeur i peut être décrit par une fonction Wi(σ, t) ≡ ui(r(σ), ti). Étant donnée une règle de vote R, on notera vR(t) le profil de stratégies de vote (possiblement mixtes) d’équilibre[17] . Au stade intérim, l’utilitée espèrée de l’électeur i est égale à Et – i[Wi(vR(t), t) | ti]. Finalement, l’utilité espérée ex ante de l’électeur i est obtenue comme l’espérance de cette expression :

Une première famille de critères d’évaluation pour le concepteur dérive de l’agrégation à l’aide d’une fonction de bien-être social du vecteur des bien-être individuels (1R;2R,…,nR). On obtient ainsi une expression WR du bien-être social. Une seconde famille de critères d’évaluation pour le concepteur dérive d’une fonction W(σ, t) qui assigne une valeur à chaque paire constituée d’un profil de stratégies σ ∈ ΣR et d’un profil de types t ∈ T. Comme pour les électeurs, on obtient une valeur espérée ex ante décrite par l’expression WR = Et[WR(t)] où WR(t) = W(vR(t), t).

Une régle de vote optimale R* est une régle de vote qui résout maxR ∈ WR, où forme: 2043040n.jpg désigne l’ensemble des règles de vote parmi lesquelles le concepteur peut choisir. On trouvera ci-dessous, à titre d’exemples, une liste de critères d’évaluation ayant été utilisés dans la littérature sur le vote:

  1. Bien-Être Utilitariste WR = Σi ∈ N WiR

  2. Bien-Être Rawlsien: WR = mini ∈ N WiR.

  3. Efficacité de Condorcet : un vainqueur de Condorcet est un candidat préféré par une majorité à tous les autres candidats par la majorité des électeurs dans le cadre de choix binaires. Nous pouvons ensuite formaliser le critère d'évaluation basé sur l’efficacité de Condorcet comme suit :

    forme: 2043042n.jpg

    Il convient de noter que W(σ, t) est défini ici exclusivement pour les profils de types t pour lesquels un candidat de Condorcet existe. Nous désignons par TC l’ensemble des profils de types pour lesquels un candidat de Condorcet existe. Par conséquent, à strictement parler, le concepteur doit choisir une règle de vote de façon à maximiser la probabilité conditionnelleforme: 2043043n.jpg que le candidat de Condorcet soit élu. Il convient également de noter que si l’efficacité de Condorcet est le critère d'évaluation et que si l’ensemble forme: 2043044n.jpg des règles de vote parmi lesquelles le concepteur peut choisir n’est pas restreint, alors toute correspondance de choix social de Condorcet résoudra l’objectif du concepteur. Cependant, si forme: 2043041n.jpg est restreint (par exemple, à une sous-classe de règles de vote), alors le concepteur doit tenir compte des contraintes supplémentaires.

  4. Robustesse de la manipulation :

    forme: 2043045n.jpg

  5. Efficacité (Weber, 1978) : la mesure d’efficacité de Weber est définie comme la différence entre le gain de bien-être induit par une règle de vote et le gain d’une sélection aléatoire de candidats dans K, divisé par la différence de gain de bien-être induit par une règle de décision de « premier rang » par rapport à une sélection aléatoire. Le dénominateur de ce ratio représente par conséquent le bien-être maximal qu’on peut raisonnablement attendre dans un scénario hypothétique où les problèmes de révélation des préférences des électeurs sont absents. Nous utiliserons cette mesure de bien-être social dans la section 6, en la définissant de façon formelle.

Comme la liste ci-dessus le démontre, il existe une abondance de critères d'évaluation parmi lesquels on peut choisir. Des cinq considérés ici, trois correspondent à des critères d'évaluation qui dépendent véritablement de l’alternative sélectionnée par la règle de vote et le profil des types. Les deux premiers critères sont basés sur le bien-être social, tandis que le troisième n’est pas directement lié à des considérations de bien-être. Le quatrième critère dépend du profil de votes. Dans le cas d’information complète et de l’équilibre de Nash, nous obtenons une mesure de la résistance de la règle de vote au comportement de vote stratégique des individus. Dans le cas de l’équilibre de Nash fort, nous obtenons une mesure de la résistance de la règle de vote au comportement de vote stratégique de coalition. Comme nous le verrons dans la section 2, ces mesures ont été principalement élaborées et utilisées dans les cadres impliquant des DVR et des DVR ordinales. Nous pourrions aussi définir une mesure de la vulnérabilité à la manipulation stratégique sous la forme d’un indice où les places de 0 et 1 dans le critère d'évaluation sont inversées. Bien entendu, de nombreuses autres façons de mesurer la sensibilité d’une règle de vote à la manipulation stratégique peuvent être considérées. Certaines de ces mesures n’entrent pas dans le cadre formel considéré ici. Par exemple, Smith (1999) considère quatre indices de manipulabilité. Certains d’entre eux s’intègrent parfaitement à notre cadre d’analyse, mais pas tous. Nous pourrions même ne pas tenir compte de la distribution de probabilité a priori, comme on le fait notamment dans Carroll (2013) et adopter plutôt une mesure numérique de la sensibilité à la manipulation définie par le gain maximum d’utilité espérée par un agent générique qui profite d’une opportunité de manipulation, où le supremum est pris sur tous les types, déviations et croyances que l’agent pourrait avoir vis-à-vis du comportement des autres agents en fonction de la règle de vote. Ces différentes mesures peuvent entraîner des différences dans les classements relatifs des règles de vote par rapport aux classements qui sont cités dans notre recherche plus loin.

2. Un tour d'horizon sélectif

Dans cette section, nous décrivons plusieurs branches de la littérature sur le vote et la conception des mécanismes ayant des liens avec la comparaison bayésienne des règles de vote présentée dans les sections 3 à 5 de cet article. La première direction se rapporte à l’approche statistique en choix social, qui comprend des contributions anciennes et récentes ayant pour objet commun d’évaluer la performance des systèmes électoraux uninominaux (dont la règle de pluralité, le vote par assentiment, la règle de Borda, ainsi que différentes règles de vote à plusieurs tours où les candidats sont éliminés en fonction du nombre de premiers votes/classements qu’ils reçoivent) en postulant que les électeurs votent sincèrement, c’est-à-dire sur la base de leurs véritables préférences à l’égard des candidats en lice. Il s’agit d’une hypothèse clairement héroïque et divers contributeurs à cette littérature reconnaissent l’importance de cette question en accordant au moins une certaine attention à la vulnérabilité des diverses règles de vote à la manipulation stratégique ou à la manière dont elles pourraient être modifiées pour induire un vote sincère (voir Merrill, 1984 ou Pivato, 2016).

2.1 Approche statistique en choix social

Les contributions à cette littérature diffèrent généralement par la structure informationnelle qu’elles supposent, c’est-à-dire par la distribution de probabilité sur les profils de types ou les situations de vote possibles lors des élections à trois candidats (ou plus). Une structure de l’information qui a été étudiée dans cette littérature repose sur l’hypothèse de la culture impartiale, hypothèse décrite dans la section 1.4 et qui sera avancée dans la comparaison bayésienne des règles de vote des sections 2 à 4.

2.1.1 Culture impartiale

Un critère d'évaluation pris en compte dans cette littérature (voir Merrill, 1984) – et qui sera également étudié dans la section 3 ci-dessous du présent article – est l’efficacité de la règle de vote. Ce critère de bien-être social est supérieur à l’efficacité de Condorcet si l’intensité des préférences des électeurs doit être prise en compte (même si Merrill (1984) analyse une seule règle, à savoir le vote par assentiment, en fonction duquel les électeurs peuvent exprimer l’intensité de leurs préférences). Afin d’évaluer la performance des différentes règles de vote, Merrill (1984) simule un grand nombre d’élections à 25 électeurs et un nombre variable de candidats (de 2 à 5 candidats, puis 7 et 10 candidats, respectivement). Afin de générer les types de l’électeur, il procède à des extractions indépendantes, à partir de la même distribution, de chaque élément du vecteur de types de l’électeur (toutefois, contrairement à notre comparaison bayésienne plus loin, Merrill (1984) se limite à la distribution uniforme). Bien que notre comparaison bayésienne de l’efficacité des règles de vote est centrée sur le cas de 3 électeurs, nous comparons néanmoins ici l’efficacité des règles de vote pour les élections à 3 candidats et 25 électeurs discutée dans Merrill (1984) à celle dérivée de nos simulations numériques pour la distribution uniforme : nous obtenons un niveau d’efficacité de 83,98 % pour la règle de pluralité (par rapport à 83 % dans Merrill (1984) où le vote est supposé être sincère), une efficacité de 91,91 % pour le vote par assentiment (par rapport à 95,4 % dans Merrill, 1984) et une efficacité de 94,47 % pour la règle de Borda (par rapport à 94,8 % dans Merrill, 1984). Il est intéressant de noter que le vote par assentiment surpasse de peu la règle de Borda dans Merrill (1984) alors que la règle de Borda surpasse clairement le vote par assentiment dans notre contexte (et non seulement pour la distribution uniforme, mais, en moyenne, pour toutes les 25 distributions bêta que nous considérons). L’exemple 1 de la section 2 ci-dessous suggère que cette différence est due au fait que dans l’équilibre de Bayes-Nash du vote par assentiment dans notre modèle, les électeurs « approuvent »moins souvent que dans Merrill (1984) le candidat qu’ils préfèrent en second. En se fondant sur l’hypothèse IC, de nombreuses contributions à la littérature cherchent à comparer et à évaluer les DVR ordinales au regard des manipulations individuelles. Par exemple, Smith (1999) compare cinq règles de vote ordinales populaires, tandis que Maus, Peters et Storcken (2007) définissent la classe des DVR ordinales anonymes, surjectives et à préférence unique tops-only qui réduit au minimum la vulnérabilité à la manipulation individuelle, lorsque le nombre d’électeurs | | est plus grand que le nombre de candidats | |. Le lecteur peut consulter les références présentées ici pour des résultats supplémentaires[18].

Un deuxième critère d'évaluation considéré sous cette structure d’information est l’efficacité de Condorcet. Dans le cas de | | = 3 candidats, Merrill (1985) conclut que le vote par assentiment (avec une efficacité de Condorcet à 76 %) est surpassé par la règle de pluralité (avec une efficacité de Condorcet à 79,1 %) qui, à son tour, est surpassée par la règle de Borda (avec une efficacité de Condorcet à 90,8 %). La meilleure des règles étudiées par Merrill (1985), cependant, est celle de Hare, qui présente une efficacité de Condorcet à 96,2 %[19].

Les deux derniers critères d'évaluation étudiés sous l’hypothèse de « culture impartiale » sont l’efficacité utilitariste et la résistance à la manipulabilité, ainsi qu’une combinaison de ces deux objectifs. Green-Armytage, Tideman et Cosman (2016) définissent la résistance à la manipulation comme la robustesse à la manipulation (telle que définie dans la section 1.6) constitutive d’un équilibre de Nash fort. Ils constatent qu’avec | | = 99 électeurs, les règles de Hare et Condorcet-Hare (qui sélectionne le gagnant de Condorcet s’il en existe un et sinon le gagnant selon la règle de Hare) surpassent chacune les 54 autres règles de vote considérées en ce qui a trait à la mesure de la résistance à la manipulabilité (plus de 80 % des élections donnant lieu à un résultat non manipulable). Notons que Green-Armytage, Tideman et Cosman (2016) n’imposent pas de contrainte d’incitation sur le comportement de vote, parce qu’ils supposent simplement que le vote est sincère. Il s’ensuit que leurs résultats passent sous silence le fait que le vote n’est peut-être pas sincère en réalité et, par conséquent, ne permettent pas que la perte de bien-être associée à toute instance de vote stratégique soit chiffrée.

S’agissant de la mesure de l’efficacité utilitariste, la règle de Borda a obtenu les meilleurs résultats (avec un bien-être utilitariste maximisé dans environ 74 % des élections), ce qui n’est pas étonnant puisque le bulletin de vote permet aux électeurs d’exprimer leur classement ordinal complet des trois candidats. Lorsque les deux critères d'évaluation, en l’occurrence l’efficacité utilitariste et la résistance à la manipulabilité, sont imposés conjointement, le compromis optimal entre les deux est réalisé par les règles de Hare et Condorcet-Hare, qui atteignent toutes les deux un score à peu près identique, soit d’environ 71 % et 85 % respectivement en termes d’efficacité et de résistance à la manipulabilité.

En ce qui concerne le critère d'évaluation basé sur l’efficacité utilitariste, Apesteguia, Ballester et Ferrer (2011) montrent enfin que parmi les règles de vote direct ordinales, les règles de score (c’est-à-dire les règles en fonction desquelles chacun des | | électeurs attribue un score à chaque candidat  K, sous réserve de certaines contraintes, de sorte que le candidat qui obtient le score agrégé le plus élevé est le vainqueur) maximisent l’efficacité utilitariste espérée ex ante lorsque l’on suppose que les électeurs déclarent leurs véritables préférences. En outre, ils déterminent laquelle des règles de vote en particulier est optimale selon la distribution λ a priori sur les profils de types des électeurs. Dans un environnement connexe où la structure de l’information est plus générale (permettant la « culture impartiale », la « culture impartiale anonyme » et d’autres comme cas spéciaux), Pivato (2016) étudie une version de notre modèle de vote général décrit dans la section 1 pour un grand électorat (c’est-à-dire | | → ∞). Ses résultats montrent que les règles de sélection simples, par exemple, la règle de Borda ou le vote par assentiment, permettent de choisir avec quasi-certitude un candidat qui maximise (ou presque) l’efficacité utilitariste.

2.1.2 Culture impartiale anonyme

La deuxième structure d’information importante qui a été étudiée à fond dans la littérature sur l’approche statistique en choix social est l’hypothèse IAC présentée dans la section 1.4. En se reportant au critère d'évaluation basé sur l’efficacité de Condorcet, Gehrlein et Lepelley (2001) comparent un certain nombre de règles de vote importantes dans le contexte d’élections à trois candidats : la règle de pluralité, le vote négatif (qui demande à chaque électeur lequel des trois candidats il souhaite éliminer), la règle de Borda et la méthode de pluralité avec élimination à deux tours (laquelle, pour | | = 3, correspond à la règle de Hare décrite ci-dessus), ainsi que la pluralité avec élimination négative (au premier tour, on élimine le candidat le mieux classé, puis au deuxième tour, on choisit le candidat majoritaire parmi les deux qui restent). Conformément à l’efficacité de Condorcet, les règles de vote sont constamment classées de la manière suivante, quel que soit le nombre | | d’électeurs : la pluralité avec élimination négative surpasse la règle de Borda (d’environ 6 points de pourcentage), laquelle, à son tour, surpasse la règle de pluralité d’environ 3 points de pourcentage[20].

Dans un article récent, Gehrlein, Lepelley et Plassmann (2016) affinent la comparaison de trois règles de vote à un tour (à savoir la pluralité, la pluralité négative et la règle de Borda) dans un contexte de culture impartiale anonyme et en termes d’efficacité de Condorcet, en ne considérant uniquement que les situations de vote dans lesquelles les trois règles de vote ne déterminent pas le même gagnant (dans les situations de vote où les trois déterminent le même gagnant, elles entraînent également la même efficacité de Condorcet)[21]. Cette structure d’information modifiée est appelée « culture impartiale anonyme modifiée (MIAC) ». Bien que MIAC entraîne en général des scores d’efficacité de Condorcet inférieurs à ceux de IAC, le classement des trois règles de vote en termes d’efficacité de Condorcet est toujours le même : Borda (82,4 % dans le contexte de MIAC, 90,7 % dans le contexte de IAC) surpasse la règle de pluralité (75,9 % dans le contexte de MIAC, 87,6 % dans le contexte de IAC), laquelle, à son tour, surpasse le vote négatif (21,6 % dans le contexte de MIAC, 62 % dans le contexte de IAC).

Dans le document mentionné précédemment, Green-Armytage, Tideman et Cosman (2016) considèrent également 54 règles de vote dans le contexte de IAC, avec | | = 3 candidats et | | = 99 électeurs. Comme dans le contexte de IC, les règles de Hare et Condorcet-Hare surpassent toutes les 54 autres règles de vote considérées en ce qui a trait à la mesure de la résistance à la manipulabilité, tandis que la règle de Borda a le mieux performé en termes de bien-être utilitariste. Lorsque les deux critères d'évaluation, en l’occurrence l’efficacité utilitariste et la résistance à la manipulabilité, sont imposés conjointement, le compromis optimal entre les deux est de nouveau réalisé par les règles de Hare et Condorcet-Hare, ces dernières atteignant des scores pratiquement identiques d’environ 85 % et 90 % en termes d’efficacité et de résistance à la manipulabilité, respectivement.

En résumé, bien que l’hypothèse irréaliste du vote sincère limite grandement l’attrait des conclusions de la littérature sur l’approche statistique en choix social, il serait toutefois mal avisé de les rejeter, d’autant plus que cette littérature a étudié de nombreuses règles de vote importantes ignorées jusqu’à présent par les modèles de vote plus sophistiqués, en particulier les règles de vote à plusieurs tours telles que la règle de pluralité avec élimination ainsi que d’autres règles.

Un deuxième volet important de la littérature sur le vote porte sur les équilibres des jeux de vote (équilibre de Nash et ses raffinements) en situation d’information complète quant aux types des électeurs.

2.2 Vote rationnel en information complète

Si le profil de types t des électeurs est connaissance commune au début de l’étape 2 de notre modèle de vote général, alors le jeu induit par la règle de vote du concepteur est un jeu en information complète. De Sinopoli, Dutta et Laslier (2006) étudient le jeu en information complète induit par la règle de vote par assentiment, laquelle permet aux électeurs de voter pour autant de candidats dans K qu’ils le souhaitent[22]. En prenant comme point de départ le résultat de Fishburn et Brams (1981), qui établit que si le profil de types t est tel qu’un gagnant de Condorcet existe, alors le jeu admet un équilibre de Nash en stratégies non dominées qui sélectionne le gagnant de Condorcet comme vainqueur de l’élection. Cependant, comme il y a d’autres équilibres de Nash, il est naturel de se demander si l’équilibre de Nash qui sélectionne le gagnant de Condorcet survit si le concept fait l’objet de raffinements. De Sinopoli, Dutta et Laslier (2006) montrent à l’aide d’exemples que ce n’est pas le cas. Tout d’abord, dans le cas où | | = | | = 3, il existe un profil de types pour lequel un gagnant de Condorcet existe et qui est tel que dans l’équilibre unique obtenu par l’élimination itérative des stratégies dominées, il y a égalité dans le nombre de votes reçu par chacun des trois candidats. Compte tenu de l’hypothèse de départage équiprobable des ex aequo, le gagnant de Condorcet ainsi que tous les autres candidats peuvent donc être élus avec la même probabilité. Un autre exemple montre avec | | = 3 électeurs et | | = 4 candidats qu’il existe des profils de types tels que dans l’équilibre unique obtenu en éliminant de manière itérative les stratégies dominées, le gagnant de Condorcet ne reçoit aucun vote. Et enfin, ils construisent un exemple avec | | = 4 candidats et un nombre impair | | ≥ 3 d’électeurs qui montre que l’unique meilleure réponse d’un électeur aux stratégies des autres électeurs (deux électeurs jouent des stratégies mixtes tandis que les autres jouent leurs stratégies dominantes) implique un vote non sincère. En revanche, si dans cet exemple, la règle de pluralité est utilisée plutôt que le vote par assentiment, alors l’équilibre stable exige le vote sincère de la part de tous les électeurs. Cela montre que l’argument en faveur du vote par assentiment est plus nuancé que ce qu’avancent Fishburn et Brams (1981).

Dans l’article de Buenrostro, Dhillon et Vida (2013), on applique le concept d’équilibre de Nash en stratégies non dominées à une catégorie élargie de règles de vote (à savoir les règles de score) qui comprend le vote par assentiment comme cas particulier. Les auteurs se concentrent sur des élections à | | = 3 options et | | ≥ 4 électeurs pour démontrer que chaque fois que le jeu en information complète induit par une règle de score donnée peut être résolu par l’élimination successive des actions dominées (c’est-à-dire est dominance solvable), les candidats élus à l’équilibre correspondent à l’ensemble des gagnants de Condorcet. En outre, les auteurs montrent que le vote par assentiment est dominance solvable chaque fois qu’une autre règle de score est dominance solvable (ce qui en fait une règle supérieure aux autres du point de vue de ce critère de dominance). Cela porte à croire que le vote par assentiment est une règle attrayante lorsqu’il n’y a que trois candidats. Notons, cependant, que dans une élection avec trois candidats localisés dans un espace idéologique unidimensionnel et où les préférences des électeurs sont déterminées par la distance entre leur idéologie individuelle et celle du vainqueur de l’élection, il y a des cas où le vote par assentiment ne parvient pas à sélectionner le gagnant de Condorcet, alors que la règle de pluralité y parvient avec certitude (voir De Sinopoli, Iannantuoni et Pimienta, 2014).

Enfin, le troisième volet de la littérature connexe traite des contextes en information incomplète et des comportements stratégiques des électeurs. C’est dans ces situations qu’on peut mesurer les problèmes de compatibilité d’incitation et les pertes de bien-être causées par l’asymétrie d’information.

2.3 Approche bayésienne et approche de mechanism design appliquées au vote

Myerson (2002) caratérise et compare les équilibres des règles de score dans un contexte où le nombre d’électeurs prenant part à l’élection n’est pas connu – ce contexte n’est pas un cas particulier du cadre décrit dans la section 1 du présent document, qui suppose un nombre fixe et connu d’électeurs et permet un continuum de vecteurs de types possibles pour chaque électeur. Également en lien avec ce contexte, mais ne constituant pas un cas particulier de notre modèle de la section 1, Ahn et Oliveros (2016) explorent, dans leur article, la capacité des règles de score à synthétiser l’information dans un cadre d’analyse à valeur commune – nous nous concentrons ici explicitement sur les cadres d’analyse à valeurs privées où la difficulté d’agréger l’information efficacement est absente. Dans les articles connexes suivants, les auteurs se penchent sur les approches de mechanism design en choix collectif en l’absence d’utilité transférable (voir par exemple, Jackson et Sonnenschein, 2007; Börgers et Postl, 2009; Miralles, 2012; Schmitz et Tröger, 2012; Kim, 2016), en tenant compte explicitement du comportement stratégique de vote et des contraintes d’incitation. Cela augmente nettement la difficulté de concevoir une règle de vote qui maximise le bien-être social utilitariste en comparaison avec les situations où le vote sincère est supposé. Schmitz et Tröger (2012) traitent de cette difficulté en caractérisant des règles de vote à deux candidats qui optimisent le bien-être et résistent aux stratégies dans une structure d’information de culture impartiale, tandis que Barberà et Jackson (2006) caractérisent des règles à la majorité pondérée à plus de deux candidats qui optimisent le bien-être utilitariste dans une structure d’information asymétrique (c’est-à-dire que les marginales λi n’ont pas besoin d’être les mêmes pour tous les électeurs  N)[23]. Cependant, les résultats analogues dans les contextes à trois candidats (reposant sur l’instauration d’une stratégie bayésienne ou dominante) sont jusqu’à présent absents de la littérature[24]. Dans un travail indépendant, Kim éclaire quelque peu cette question. En utilisant la même structure d’information que celle employée ici, il montre que si les types de trois électeurs ou plus présentent une distribution uniforme, il existe un mécanisme de révélation direct qui utilise les vecteurs entiers d’utilités des électeurs (c’est-à-dire pas seulement les classements ordinaux s’y rapportant) et qui génère une espérance de bien-être ex ante supérieure à celle générée par tout autre mécanisme qui fait reposer les choix collectifs sur les classements ordinaux des électeurs seuls[25]. Ce résultat est conforme à nos résultats de calcul dans le cas de la distribution uniforme. Toutefois, notre travail se distingue du sien de trois façons importantes : premièrement, nous présentons une caractérisation des équilibres de vote Bayes-Nash symétriques pour toutes les règles de sélection à deux paramètres et pour toutes les distributions d’utilité; deuxièmement, nous comparons, quoiqu’à l’aide de simulations numériques, l’efficacité de toutes les règles de score à deux paramètres pour les distributions autres que la distribution uniforme; et troisièmement, nous offrons un aperçu de la connexion entre les règles de score optimales à deux paramètres et les règles de vote optimales dites de second rang (c’est-à-dire des règles qui, parmi tous les mécanismes de révélation directe possédant la propriété de compatibilité d’incitation, maximisent le bien-être ex ante)[26].

3. Une comparaison bayésienne détaillée des règles de score à deux paramètres sous l’hypothèse de culture impartiale

3.1 Modèle de base

Nous étudions maintenant une version du modèle général décrit dans la section 1, dans lequel il y a trois candidats : K = {ABC} et n + 1 électeurs. Pour chaque électeur  N, l’ensemble des types est désigné par i = [0, 1]3. En ce qui concerne la structure d’information, nous supposons que chaque type forme: 2043046n.jpg  est une variable aléatoire dont la réalisation est observée seulement par l’électeur i. Les types des n + 1 électeurs sont stochastiquement indépendants et indépendamment distribués (i.i.d.). Nous supposons de plus que pour chaque électeur i, les trois éléments de son vecteur de types ti, soit forme: 2043047n.jpg, sont tirés dans l’intervalle unitaire [0, 1], conformément à une distribution G de densité continue et strictement positive g sur (0, 1). Par conséquent, pour un électeur, la probabilité d’être décrit par l’un ou l’autre des six classements ordinaux possibles est la même. Les caractéristiques des fonctions d’utilité von Neumann-Morgenstern décrites ci-dessus et la distribution combinée des types (t1,…,tn+1) sont connaissances communes des électeurs. Il convient d’observer que la structure d’information supposée ici rend notre modèle symétrique de deux façons :

Symétrie quant aux électeurs, parce que chaque type ti (avec  N) est tiré de la même distribution sur [0, 1]3.

Symétrie quant aux options, parce que chaque élément tik de ti (avec ∈ K) est tiré de manière indépendante de la même distribution G sur [0, 1].

3.2 Règles de score à deux paramètres

Dans le cadre du modèle décrit à la section 1.1, nous étudions et comparons les mécanismes de vote qui sont des règles de score. En fonction d’une règle de score donnée, un électeur se voit demander d’attribuer un score à chaque option  K. Les scores attribués à chaque option sont par la suite additionnés et l’option remportant le score agrégé le plus élevé est choisie. En cas d’ex aequo, une option est choisie au hasard de façon équiprobable parmi les options ayant obtenu le score maximal. Comme dans Myerson (2002), nous examinons en particulier la famille des règles de score (x, y), qui est caractérisée par deux paramètres x et y tels que 0 ≤  y  1. Compte tenu d’une règle de score (x, y), chaque électeur doit choisir un triplet constituant une permutation (1, x, 0) ou de (1, y, 0). C’est-à-dire que chaque électeur doit attribuer le score 1 à l’une des trois options possibles dans K, le score 0 à l’une des deux options restantes dans K, et le score x ou y à la dernière option. De nombreuses règles bien connues sont des cas particuliers des règles de score (x, y). La partie ombragée du graphique 1 illustre l’ensemble de toutes les règles de score à paramètres (x, y) en soulignant les cas particuliers bien connus. Par exemple :

  1. Règle de pluralité : x = y = 0. Chaque électeur doit faire un choix entre trois vecteurs de score issus des permutations de (1, 0, 0).

  2. Vote négatif : x = y = 1. Chaque électeur doit faire un choix entre trois vecteurs de score issus des permutations de (1, 1, 0).

  3. Règle de Borda : x = y = 0,5. Chaque électeur doit faire un choix entre six vecteurs de score issus des permutations de (1; 0,5; 0).

  4. Vote par assentiment : x = 0 et y = 1. Chaque électeur doit faire un choix entre 12 vecteurs de score issus des permutations de (1, 0, 0) et (1, 1, 0).

Graphique 1

Ensemble de toutes les règles de sélection à paramètres (x, y)

Ensemble de toutes les règles de sélection à paramètres (x, y)

-> Voir la liste des figures

Pour décrire plus formellement les règles de score à paramètres (x, y), nous désignons par Σx, y l’ensemble de tous les vecteurs de scores sur lesquels un électeur peut arrêter son choix, compte tenu d’une règle de score à paramètres (x, y) donnée. Un vecteur de score générique pour l’électeur  N est désigné par forme: 2043048n.jpg, où σik représente le score que l’électeur i attribue à l’option k. Comme les règles de score à paramètres (xy) donnent lieu à un choix collectif sur la base du score agrégé le plus élevé, nous définissons le vecteur de scores agrégés de la manière suivante :

Définition 1 Pour tout sous-ensemble donné forme: 2043049n.jpg de forme: 2043050n.jpg électeurs, le vecteur de scores agrégés sm sur la base de tous les électeurs dans forme: 2044015n.jpg est la somme des vecteurs de scores individuels forme: 2043051n.jpg. Nous désignons par forme: 2043052n.jpg l’ensemble de tous les vecteurs de scores agrégés Sm qui peuvent se présenter pour le sous-ensemble forme: 2043053n.jpg d’électeurs. L’ensemble forme: 2043054n.jpg est obtenu par l’addition, pour chaque profil de m vecteurs de scores individuels dans forme: 2043055n.jpg, des scores associés à chaque option k[27].

En utilisant la notion de vecteur de scores agrégés, nous pouvons introduire la notation formelle pour exprimer la distribution de probabilité sur les résultats induits par une règle de score (xy) en raison de la possibilité d’un ex aequo entre options. Nous utilisons cette notation abondamment dans le reste de l’article :

Définition 2 Pour chaque sous-ensemble donné forme: 2043056n.jpg de forme: 2043057n.jpg électeurs et chaque vecteur de scores agrégés forme: 2043058n.jpg, une règle de score à paramètres (xy) induit une distribution de probabilité sur l’ensemble des options dans K : forme: 2043059n.jpg. Plus précisément, la probabilité δA(sm) associée à l’option A est la suivante :

Les probabilités δB(sm) et δC(sm) des optionsB et C (resp.) sont définies de manière analogue, avec δA(sm) + δB(sm) + δC(sm) = 1 pour tous les forme: 2043061n.jpg.

4. Stratégies de vote d’équilibre

Toutes les règles de score (xy) donnent lieu à un jeu bayésien comportant n + 1 joueurs. Dans ce jeu, la stratégie pure du joueur i est une fonction à valeurs vectorielles vi : [0, 1]3 → Σx, yti ↦ vi(ti). C’est-à-dire que vi précise pour chaque type ti le vecteur de score dans Σx, y devant être soumis par l’électeur i. Lorsque le type de l’électeur i est ti, nous désignons par vik(ti) le score attribué à l’option  K compte tenu de la stratégie vi. En raison des deux types de symétrie inhérentes à notre cadre, il est naturel de mettre l’accent sur les équilibres de Bayes-Nash (v1,…,vn+1) qui sont symétriques au sens des deux propriétés suivantes :

S1. Chaque électeur utilise la même fonction v pour choisir un vecteur de score sur la base de son type : vi(ti) = v(ti) pour tous les ti ∈ [0, 1]3 et tous les  N. C’est-à-dire que deux électeurs du même type transmettent le même vecteur de score.

S2. Pour tous les électeurs i et tout ti et forme: 2043063n.jpg, où forme: 2043064n.jpg est dérivé de ti par suite d’une permutation de ses éléments, v apparie forme: 2043065n.jpg et forme: 2043066n.jpg, ce dernier étant dérivé de σi = v(ti) par suite de l’application de la même permutation des éléments de σi. Par exemple, posons forme: 2043067n.jpg et forme: 2043068n.jpg. Si v(ti) = (1, x, 0), alors forme: 2043069n.jpg.

Nous appelons une stratégie v qui satisfait la propriété S2 une stratégie symétrique et un équilibre de Bayes-Nash symétrique (cf. S1) en stratégies symétriques (cf. S2) un équilibre de Bayes-Nash pleinement symétrique (FSE). Pour montrer qu’un tel équilibre existe, nous devons considérer la décision de tout électeur i quant au vecteur de score dans Σx, y qu’il souhaite transmettre lorsque tous les autres électeurs utilisent la même stratégie symétrique v. À cette fin, nous devons déterminer les croyances de l’électeur i concernant les vecteurs de score transmis par les autres électeurs. Attardons-nous sur le cas d’un électeur  i qui a transmis le vecteur de score v(j). Comme l’électeur i ne connaît pas le type de j, il considère le vecteur de score v(j) à titre de variable aléatoire dans l’espace Σx, y. Comme v et notre cadre d’analyse sont tous deux symétriques, l’électeur i croît que toutes les permutations du vecteur de score forme: 2043070n.jpg ont la même probabilité d’occurrence que v(j). Plus précisément, si la règle de score à paramètres (x, y) stipule que x < y, alors toutes les permutations du vecteur de score (1, x, 0) ont la probabilité d’occurrence forme: 2043071n.jpg [0,1/6]et toutes les permutations de (1, y, 0) ont la probabilité d’occurrence forme: 2043072n.jpg. À partir de ces observations, nous pouvons établir notre prermier résultat principal :

Proposition 1 Tout FSE d’une règle de score à paramètres (x, y) implique une stratégie de vote sincère v. C’est-à-dire que v1(ti) = 1 et v3(ti) = 1 pour tous les i  N et tous les ti ∈ [0, 1]3, où v1(ti) et v3(ti), resp., désignent les scores attribués par v à l’option la mieux et la moins bien classée de i lorsque son type est ti.

On peut trouver la preuve de la Proposition 1 dans l’annexe de Giles et Postl (2014) (voir la section A.1). Pour mettre en lumière le raisonnement intuitif qui sous-tend ce résultat, il convient de noter que nous pouvons exploiter la symétrie de notre structure d’information pour montrer que, du point de vue de l’électeur i, les options A, B et C sont aussi susceptibles l’une que l’autre de correspondre au choix collectif des autres n électeurs utilisant la même stratégie de vote symétrique v[28]. En d’autres mots, en termes d’espérance, le comportement de vote des autres électeurs se solde par une distribution uniforme sur l’ensemble des options dans K : forme: 2043073n.jpg. En transmettant un vecteur de score σi qui attribue le score 1 à son option préférée, le score x ou y à son option du milieu et le score 0 à l’option qu’il aime le moins, l’électeur i génère la distribution de probabilité espérée forme: 2043074n.jpg sur K, qui domine stochastiquement à l’ordre 1 toute distribution forme: 2043075n.jpg pouvant prévaloir s’il soumet n’importe quel vecteur de score non sincère forme: 2043076n.jpg.

La Proposition 1 caractérise le FSE unique de la règle de score (x, y) avec x = y (ce qu’on appelle une règle de score « ordinale », puisqu’elle ne permet pas aux électeurs de déclarer l’intensité de leurs préférences). Cela renvoie également au résultat principal dans Carmona (2012) en ce qui a trait à un contexte où seules les règles de score ordinales sont prises en compte et où les préférences des électeurs dépendent non seulement de l’option choisie dans K, mais également des scores agrégés remportés par toutes les autres options. Il montre que les équilibres de Bayes-Nash sont sincères pour pratiquement toutes les distributions de probabilité à partir desquelles sont extraits les types des électeurs (c’est-à-dire leurs classements ordinaux). La Proposition 1 implique en outre qu’en ce qui concerne les règles de score à paramètres (xy) avec x < y, il ne reste à l’électeur qu’à décider s’il attribue le score le plus bas x ou le score le plus élevé y à son option du milieu. Comme corollaire à la Proposition 1, il est aisé d’établir le résultat suivant :

Corollaire 1 Tout FSE d’une règle de score à paramètres (xy) avec x < y implique une stratégie de vote sincère v qui attribue le score v2(ti) ∈ {xy} à l’option du milieu de chaque électeur i, conformément à la règle en valeur critique suivante : pour un certain α ∈ [0, 1],

En conséquence du corollaire 1, l’électeur i s’attend à ce que tout autre électeur  i transmette le vecteur de score (1, x, 0) (et toute permutation de ce dernier) selon la probabilité que voici :

De la même manière, l’électeur i s’attend à ce que j transmette chaque permutation de (1, y, 0) selon la probabilité complémentaire forme: 2043079n.jpg. Notons que (2) définit p(α) comme fonction monotone croissante et dérivable (c’est-à-dire p'(α) > 0 pour tous les α), avec p(0) = 0 et p(1) = 1/6.

Nous présentons maintenant la preuve du corollaire 1, parce que c’est sur lui que repose la détermination du poids d’équilibre α dans (1). Le poids α est la dernière pièce constitutive du FSE des règles de score à paramètres (xy) avec x < y.

Preuve. Considérons l’électeur i et supposons sans perte de généralité que son type ti est tel que tiA > tiB > tiC. Son utilité espérée dérivée de la transmission du vecteur de score σi = (1, σiB, 0) (avec σiB, ∈ {xy}) est[29] :

La solution optimale pour l’électeur i est de transmettre le vecteur de score σi = (1, y, 0) si Ui((1, y, 0), ti) > Ui((1, x, 0), ti). Nous reportant à (3), cette inégalité peut être reformulée de la manière suivante :

La condition posée dans (4) stipule que la meilleure réponse de l’électeur i à la stratégie symétrique v utilisée par tous les autres électeurs est d’attribuer le score le plus élevé y à son option du milieu B si l’utilité tiB qu’il en tire excède la moyenne pondérée des utilités associées aux options qu’il préfère le plus et le moins. Si l’inverse survient, il a tout intérêt à attribuer le score le plus bas x à son option du milieu. Il convient d’observer que le poids utilisé dans la moyenne du côté droit de (4) est un nombre dans [0, 1]. Cela découle immédiatement du fait que d’attribuer le score le plus élevé y à l’option classée au milieu B déplace la masse des probabilités de l’option A et/ou C vers l’option B, relativement à une situation où le score le plus bas x est attribué à B : forme: 2043083n.jpgforme: 2043084n.jpg pour tous les forme: 2043085n.jpg.

Afin de fixer la ou les valeurs particulières du poids α qui permet à la stratégie de vote symétrique, tel qu’énoncée dans le corollaire 1, de constituer un équilibre, nous nous concentrons sur l’équation (4) ci-dessus. Plus précisément, notre intérêt porte sur le poids rattaché à l’utilité de l’électeur i à l’égard de son option préférée, que nous désignons comme le « ratio perte-gain » :

Définition 3 Le ratio perte-gain est calculé au moyen de l’expression suivante :

Notons que L est une fonction dérivable de α parce que la probabilité d’occurrence de chaque vecteur de score individuel des autres électeurs est p(α) ou (1/6) – p(α).

Le numérateur du ratio perte-gain représente l’espérance de perte de probabilité sur l’option préférée de l’électeur i lorsqu’il attribue le score le plus élevé y à l’option qu’il classe au milieu, par opposition au score le plus bas x. Le dénominateur est, à son tour, l’espérance de gain de probabilité sur l’option classée au milieu lorsque l’électeur i lui attribue le score y (plutôt que x). Avant d’intégrer le ratio perte-gain dans (5) pour fixer la valeur du poids α dans un FSE, il est utile de considérer un exemple de stratégie de vote symétrique sincère de la forme soulevée dans le Corollaire 1, qui ne constitue pas un FSE dans notre modèle.

Exemple 1 Considérons la stratégie de vote symétrique présentée dans Weber (qui s’intéresse aux équilibres asymptotiques du vote par assentiment (c’est-à-dire (xy) = (0, 1)) dans un modèle qui comprend notre structure d’information en tant que cas particulier, mais qui, contrairement au nôtre, se caractérise par un grand nombre d’électeurs). Dans la stratégie de Weber, chaque électeur i choisit à partir de Σ0, 1 le vecteur de score iA, σiB, σiC) qui maximise forme: 2043087n.jpg,forme: 2043088n.jpg désigne la moyenne des utilités de Bernoulli de l’électeur i. Cela signifie que chaque électeur vote de façon sincère et attribue le score plus bas 0 à l’option qu’il classe au milieu si forme: 2043089n.jpg et le score plus élevé 1 si forme: 2043090n.jpg. C'est-à-dire que dans la stratégie de Weber, le classement du milieu de chaque électeur se voit attribuer un score conformément à la règle en valeur critique définie dans le Corollaire 1 avec un poids α = 0,5.

Pour bien voir que la stratégie de Weber ne constitue pas un FSE du vote par assentiment dans notre contexte, qui se caractérise par un nombre fini d’électeurs, supposons qu’il y a deux électeurs i et j. Si j utilise la stratégie de Weber, alors i s’attend à ce que la probabilité d’occurrence de chaque permutation du vecteur de score (1, 0, 0) soit p(0,5) ∈ (0, 1/6) (où p(0,5) est calculé conformément à (2)) et que la probabilité d’occurrence de chaque permutation de (1, 1, 0) soit (1/6) – p(0,5). Il est facile de confirmer qu’il existe certains types de l’électeur i pour lesquels voter conformément à la stratégie de Weber ne constitue pas le meilleur choix. Plus précisément, nous avons forme: 2043091n.jpg pour tous les ti ∈ [0, 1]3 tels que :

Cette inégalité éclaire le fait que le poids α = 0,5 associé à la stratégie de Weber diffère du ratio perte-gain de l’électeur i :

forme: 2044016n.jpg pour toute distribution G. C’est cet écart entre α et forme: 2043093n.jpg qui disqualifie la stratégie de Weber à titre de FSE dans le cas du vote par assentiment.

L’exemple 1 illustre le rôle central joué par le ratio perte-gain dans la détermination des poids α associés aux stratégies de vote donnant lieu à un FSE dans le cas des règles de score (xy) avec y. En fait, à l’équilibre, la valeur du poids α doit être égale au ratio perte-gain de chaque électeur. De manière plus formelle, une stratégie de vote donnant lieu à un FSE doit mettre en évidence un poids α* ∈ [0, 1] tel que forme: 2043094n.jpg. En d’autres mots, le poids d’équilibre α* est un point fixe du ratio perte-gain. Pour définir l’équilibre, il faut donc essentiellement déterminer les points fixes de la fonction forme: 2043095n.jpg. Dans ce contexte, la question de savoir s’il existe un point fixe α* à l’intérieur de l’intervalle [0, 1] présente un intérêt particulier. Cela s’explique par le fait que c’est uniquement lorsque α* ∈ (0, 1) que les électeurs expriment à l’équilibre l’intensité de leurs préférences, dans la mesure où c’est possible sous une règle de score (xy) avec y.

Comme condition suffisante pour que le ratio perte-gain présente des points fixes intérieurs relativement aux paramètres donnés x, y, n du modèle et à G, nous avons : forme: 2043096n.jpg. Cela est dû au fait que chaque fois que les deux inégalités sont confirmées, nous pouvons nous reposer sur le théorème des valeurs intermédiaires pour établir l’existence d’une valeur α* ∈ (0, 1) telle que forme: 2043097n.jpg. Le résultat suivant montre que la première inégalité est confirmée pour tous les paramètres du modèle :

Lemme 1 Le ratio perte-gain est positif au point forme: 2043098n.jpg pour tous les x y, tous les n et tous les G.

Pour donner aux lecteurs une idée de la manière d’établir ce résultat, nous présentons ici la preuve dans les cas de deux, trois et quatre électeurs. Nous renvoyons le lecteur à Giles et Postl (2014) pour plus de renseignements dans le cas de cinq électeurs ou plus.

Preuve. Considérons l’électeur i et supposons sans perte de généralité que son type ti est tel que tiA > tiB tiC. Compte tenu de la définition du ratio perte-gain dans (5), il suffit de démontrer qu’il existe un vecteur de scores agrégés forme: 2043099n.jpg dont la probabilité d’occurrence est positive au point α = 0 (c’est-à-dire forme: 2043100n.jpg) tel que la probabilité de sélection de l’option préférée de l’électeur i est strictement plus faible lorsqu’il transmet le vecteur de score individuel σi = (1, y, 0) que lorsqu’il transmet le vecteur de score σi = (1, x, 0). Dans ce cas, l’addition dans le numérateur du ratio perte-gain comprend au moins un élément positif : forme: 2043101n.jpg pour au moins un forme: 2043102n.jpg.

  1. Dans le cas de deux électeurs (n = 1), le tableau ci-dessous montre le vecteur de score (individuel et agrégé) s1 = (y, 1, 0) qui se réalise avec la probabilité Pr[s1] = 1/6 au point α = 0 :

    forme: 2043103n.jpg

    La transmission du vecteur de score individuel σi = (1, y, 0) par l’électeur i déplace la masse de probabilités de l’option A à B, par rapport à la transmission de forme: 2043104n.jpg.

  2. Dans le cas de trois électeurs (n = 2), le tableau ci-dessous montre le vecteur de scores agrégés s2 = (y, 1, 1 + y) qui se réalise avec la probabilité Pr[s2] = 1/36 à α = 0 :

    forme: 2043105n.jpg

    La transmission du vecteur de score individuel σi = (1, y, 0) par l’électeur i déplace la masse de probabilités de l’option A à B, par rapport à la transmission de forme: 2043106n.jpg.

  3. Dans le cas de quatre électeurs (n = 3), le tableau ci-dessous montre le vecteur de scores agrégés s3 = (1 + 2y, 2 + y, 0) qui se réalise avec la probabilité Pr[s3] = 1/216 à α = 0 :

    forme: 2043107n.jpg

La transmission du vecteur de score individuel σi = (1, y, 0) par l’électeur i déplace la masse de probabilités de l’option A à B, par rapport à la transmission de forme: 2043108n.jpg.

Nous allons maintenant montrer en fonction de quels paramètres du modèle la deuxième partie de la condition suffisante pour l’existence de l’équilibre est confirmée (c’est-à-dire forme: 2043109n.jpg). Cela nous permet d’établir notre deuxième résultat principal :

Proposition 2 Dans les cas où il y a trois électeurs ou cinq électeurs et plus (nombre pair ou impair), tout FSE de toute règle de score (x, y) avec x < y implique une stratégie de vote de la forme énoncée dans le corollaire 1 avec un poids α* ∈ (0, 1), quelle que soit la distribution G de laquelle sont extraites les composantes du type de l’électeur.

Ce qu’implique la Proposition 2, c’est que les électeurs expriment à l’équilibre l’intensité de leurs préférences dans la mesure admise par les règles de score avec x < y. Pour donner au lecteur une idée de la manière d’établir ce résultat, nous nous appuyons ici sur la preuve présentée dans le cas de trois électeurs et référons le lecteur à l’annexe A.3 de Giles et Postl (2014) pour plus de renseignements sur la preuve présentée dans le cas de cinq électeurs et plus.

Preuve. Considérons l’électeur i et supposons sans perte de généralité que son type ti est tel que tiA > tiB > tiC. Nous établissons maintenant que forme: 2043110n.jpg. Compte tenu de la définition du ratio perte-gain dans (5), il suffit de démontrer qu’il existe un vecteur de score agrégé s2 ∈ S2x, y qui se réalise avec une probabilité positive au point α = 1 (c’est-à-dire forme: 2043111n.jpg) tel que l’option du milieu de l’électeur i accroît sa masse de probabilité par rapport à son option la moins souhaitée (et non pas seulement par rapport à son option préférée) lorsqu’il transmet le vecteur de score individuel σi = (1, y, 0) plutôt que le vecteur de score σi = (1, x, 0). Dans ce cas, le numérateur du ratio perte-gain est strictement plus petit que le dénominateur : forme: 2043112n.jpg. Considérons maintenant le vecteur de scores agrégés forme: 2043113n.jpg dans le tableau ci-dessous, qui survient avec la probabilité Pr[s2] = 1/36 :

forme: 2043114n.jpg

Le tableau montre que pour s2 = (x, 1, 1 + x), la transmission du vecteur de score σi = (1, y, 0) par l’électeur i déplace la masse de probabilité des options A et C vers B, relativement à la transmission de σi = (1, x, 0) :

Comme le gain lié à l’option B (qui apparaît dans le dénominateur de L) surpasse la perte liée à l’option A (qui apparaît dans le numérateur de L), il s’ensuit immédiatement que forme: 2043116n.jpg. Combiné avec le fait que forme: 2043117n.jpg à partir du lemme 1, nous pouvons déduire, en nous reposant sur le théorème des valeurs intermédiaires, qu’il existe au moins un poids d’équilibre α* ∈ (0, 1) pour chacune des règles de score (x, y) avec x < y et chacune des distributions G.

Limites de la Proposition 2. Nous soulignons d’abord que la Proposition 2 affirme essentiellement qu’un résultat existe : elle montre qu’il y a une valeur α* telle que la stratégie d’équilibre des électeurs les incite à exprimer l’intensité de leurs préférences. Cependant, elle n’établit pas l’unicité de α*, ni n’explique comment α* varie en fonction des paramètres x, y, n du modèle et de la distribution G. Pour traiter au moins partiellement de ces limites, nous offrons ci-dessous une description exhaustive du ratio perte-gain dans le cas de trois électeurs, car dans cette situation, le nombre de vecteurs de scores agrégés possibles est encore gérable. Pour un traitement du contexte à deux électeurs et un aperçu du contexte à quatre électeurs, voir Giles et Postl (2014), où on montre que ce ne sont pas toutes les règles de score (x, y) avec x < y qui induisent un FSE transposant l’intensité des préférences, même lorsque la règle de vote le permet.

Proposition 3 Dans le cas de trois électeurs, la stratégie de vote du FSE répartit l’ensemble des règles de score (x, y) avecx < y dans 64 classes d’équivalence, quelle que soit la distribution G de laquelle les utilités de Bernoulli des électeurs sont tirées. Pour 38 de ces classes d’équivalence – qui présentent toutes un ratio perte-gain monotone – il existe un poids d’équilibre unique α* pour chaque G. En ce qui concerne les 26 dernières classes d’équivalence – qui présentent un ratio perte-gain non monotone – l’unicité du poids d’équilibre α* est spécifique à la distribution employée[30].

Nous renvoyons le lecteur à l’annexe A.5 de Giles et Postl (2014) pour la preuve de la Proposition 3. Le lecteur intéressé y trouvera un tableau contenant toutes les 64 classes d’équivalence qui surgissent avec trois électeurs, de pair avec le ratio perte-gain de chacune des classes d’équivalence. Pour une illustration graphique de ces classes d’équivalence, voir les partitions indiquées par les lignes pointillées dans le graphique 2 ci-dessous. Bien que nos résultats dans la Proposition 3 montrent que le nombre de classes d’équivalence pour un nombre donné d’électeurs n’est pas spécifique à la distribution employée, il est évident que la ou les valeurs du poids d’équilibre α* rattaché à chaque classe d’équivalence dépendent de la distribution G par le biais du ratio perte-gain. Même dans la situation relativement simple où il y a trois électeurs, il est impossible de formuler une expression analytique pour représenter le poids d’équilibre α* comme fonction des paramètres x et y du modèle et de la distribution G. Ce n’est pas possible parce que même dans le cas des distributions paramétrisées les plus simples (telles que G(ξ) = ξb, avec b > 0), la condition d’équilibre forme: 2043118n.jpg génère des expressions compliquées par l’intermédiaire desquelles les résultats pour α* ne peuvent être obtenus qu’au moyen de simulations numériques. Dans le cas de trois électeurs et de la distribution G uniforme – contexte dans lequel un poids d’équilibre unique α* existe pour chaque classe d’équivalence parce qu’au moins une des deux conditions suffisantes décrites dans la note 30 de bas de page est satisfaite – le graphique 2 illustre certains résultats numériques obtenus pour α* en fonction de x et y. Afin de faciliter l’interprétation de la figure, notons que chacun des nombres superposés sur le polygone du graphique 2 correspond à la valeur α* relative à toutes les règles de score à deux paramètres dont les valeurs x et y forment un point à l’intérieur de ce polygone (à l’exclusion des bordures pointillées)[31].

Graphique 2

Valeurs d’équilibre de α*pour trois électeurs et une distribution G uniforme

Valeurs d’équilibre de α*pour trois électeurs et une distribution G uniforme

-> Voir la liste des figures

5. Efficacité des règles de score à deux paramètres

5.1 Notions de bien-être et efficacité

Dans cette section, nous nous reposons sur notre caractérisation de l’équilibre présentée dans la section 4 pour comparer les règles de score (xy) sur la base de leur efficacité à choisir une option qui est représentative des préférences des électeurs. Nous utilisons la définition de l’efficacité présentée dans Weber (1978). Formulée au moyen du vocabulaire utilisé dans la littérature du mechanism design, la mesure d’efficacité de Weber est définie comme la différence de gain de bien-être entre une règle (xy) et une sélection aléatoire d’une option dans K, divisée par la différence de gain de bien-être dérivé d’une règle de décision optimale de premier rang et une sélection aléatoire. Le dénominateur de ce ratio représente par conséquent le gain maximal de bien-être qu’on peut raisonnablement attendre de ce scénario hypothétique selon lequel les problèmes de révélation des préférences de l’électeur sont absents.

Nous entendons par bien-être d’une règle de score (xy), l’espérance de bien-être utilitariste dérivée de l’addition des utilités espérées ex ante des électeurs dans un FSE de la règle de score. En raison de la symétrie dans notre modèle de la section 3, où tous les électeurs sont identiques ex ante, il suffit de calculer l’utilité espérée ex ante d’un électeur représentatif et de la multiplier par le nombre d’électeurs (c’est-à-dire par n + 1) pour obtenir le bien-être espéré. En outre, comme tous les classements ordinaux des options dans K ont la même probabilité d’occurrence, nous pouvons calculer l’utilité espérée ex ante de tout électeur i en fixant un classement ordinal représentatif (associé aux utilités ti1 > ti2 > ti3.) et en multipliant ensuite par l’utilité espérée de six électeurs i du classement représentatif[32]. Ainsi, le bien-être espéré, désigné par Wx, y, est :

Afin de définir formellement la mesure d’efficacité de Weber, nous devons préciser les notions d’ « optimum de premier rang » et de « sélection aléatoire ». Les deux notions sont des cas de ce qu’on appelle les règles de vote directes. Décrite de manière formelle, une règle de vote directe (DVR) dans le présent modèle est une fonction forme: 2043120n.jpg, où Δ(K) est l’ensemble des distributions de probabilité sur K, et 𝑓k(t) est la probabilité que l’option  K soit choisie par le mécanisme lorsque le profil de types des électeurs est  (t1,…, tn + 1). Le bien-être espéré ex ante associé à une DVR est :

Lorsque nous parlons de « sélection aléatoire », nous entendons ici la DVR forme: 2043122n.jpg qui sélectionne chaque option dans K avec la même probabilité, quels que soient les types des électeurs :

Définition 4 La DVR forme: 2043123n.jpg implémente une sélection aléatoire si

Une DVR qui est un « optimum de premier rang », à l’opposé, est une DVR qui maximise le bien-être espéré dans (6) en fonction du scénario hypothétique où les types ti de tous les n + 1 électeurs, une fois réalisés, deviennent observables avant que le choix collectif n’ait à être fait[33] :

Définition 5 Une DVR 𝑓FB est un optimum de premier rang si pour chaque k ∈ K :

Selon la définition 5, le bien-être espéré ex ante d’une DVR qui est un optimum de premier rang diminue l’espérance de la statistique d’ordre max{wAwBwC}, où forme: 2043126n.jpg est une variable aléatoire sur le support [0, n + 1], tandis que les variables aléatoires de toute paire wk, wl (k, l ∈ K k) sont indépendantes et identiquement distribuées[34]. Nous pouvons maintenant définir formellement l’efficacité d’une règle de vote (xy) :

5.2 Simulations numériques

Dans cette section, nous présentons les résultats de simulations numériques relativement aux niveaux d’efficacité de toutes les règles de score (x, y) dans une élection avec trois électeurs[35]. Nous cherchons avant tout à améliorer nos connaissances quant à la règle qui est la plus efficace pour choisir l’option représentative des préférences des électeurs. Nous souhaitons également découvrir si les règles de score (x, y) qui permettent l’expression de l’intensité des préférences sont plus efficaces que celles qui permettent aux électeurs d’exprimer leurs classements ordinaux seulement (ces dernières règles sont celles qui se trouvent sur la ligne à 45 degrés à l’intérieur du carré, et la règle de Borda est l’une d’elles)[36].

Pour obtenir les résultats de nos simulations numériques, nous avons choisi des distributions G particulières à partir desquelles ont été extraites les composantes du type de l’électeur tik et avons ensuite utilisé Mathematica pour calculer les poids d’équilibre α* qui caractérisent les stratégies de vote dans un FSE. Pour rendre la portée des résultats de nos simulations aussi étendue que possible, nous avons utilisé 25 distributions bêta différentes pour G. La fonction de densité g(ξ; ab) et la fonction de distribution cumulative G(ξ; ab) de la distribution bêta sont paramétrisées au moyen de deux paramètres de forme ab > 0 : forme: 2044017n.jpg pour 0 ≤ ξ ≤ 1. Afin d’accélérer le calcul des poids d’équilibre α* et des niveaux de bien-être qui leur sont associés, nous générons nos 25 distributions bêta en faisant varier séparément chacun des deux paramètres de forme a et b de 1 à 5 par incréments de 1 (plutôt qu’en incréments plus petits). Par exemple, la distribution uniforme correspond au cas où a = b = 1.

Notons que nous pouvons vraiment comparer les niveaux d’efficacité des différentes règles de score (xy) ici parce que nous avons choisi nos 25 distributions bêta de telle sorte que chaque règle donne lieu à un point d’équilibre unique α* ∈ (0, 1). Les résultats de nos simulations indiquent que les règles de score (xy) qui entraînent l’efficacité moyenne la plus élevée pour toutes les 25 distributions bêta sont celles qui apparaissent dans le coin supérieur gauche du graphique 3 (celles qui génèrent une efficacité de 89,06 %)[37]. Ces règles permettent aux électeurs d’exprimer l’intensité de leurs préférences parce que x < y. Nous constatons également que les règles ordinales (c’est-à-dire celles où x = y) ne génèrent pas l’efficacité maximale.

Dans le tableau 1 plus bas, figurent dans la première colonne les niveaux d’efficacité des cas particuliers bien connus des règles de score (xy) (le contenu de la deuxième colonne sera expliqué dans la section 5.3). Le schéma suivant émerge : le vote négatif est la règle de score à deux paramètres la moins performante, la règle de pluralité arrivant à l’avant-dernière place. Le vote par assentiment surpasse ces deux règles en termes de performance, mais il est surpassé par la meilleure règle ordinale[38]. Ce n’est pas étonnant, compte tenu du fait que le vote par assentiment ne permet pas aux électeurs d’exprimer sans ambiguïté leurs classements ordinaux, même s’il leur permet d’exprimer l’intensité de leurs préférences. Les règles les plus efficaces permettent aux électeurs d’exprimer à la fois leur classement ordinal et l’intensité de leurs préférences.

Graphique 3

Efficacité moyenne en % pour 25 distributions bêta

Efficacité moyenne en % pour 25 distributions bêta

-> Voir la liste des figures

Tableau 1

Efficacité moyenne des règles de vote bien connues

Efficacité moyenne des règles de vote bien connues

-> Voir la liste des tableaux

Graphique 4

Illustration graphique des classes I-IV

Illustration graphique des classes I-IV

-> Voir la liste des figures

Nous concluons cette section en tentant de mieux comprendre la mesure dans laquelle l’efficacité maximale varie selon la distribution G. Nos résultats révèlent que parmi les 64 classes d’équivalence des règles de score (xy) avec x < y, seulement 5 maximisent l’efficacité (chaque classe pour un sous-ensemble différent de nos 25 distributions bêta). Les trois premières classes sont indiquées par les nombres superposés sur les régions ombragées du graphique 4 (les classes I, II et IV sont toutes les 3 représentées par un triangle gris), tandis que les classes III et V sont représentées par les lignes épaisses de couleur noire[39]. Le graphique confirme les attentes que nous avons formulées à propos des niveaux moyens d’efficacité, à savoir que les règles ordinales ne génèrent pas le niveau d’efficacité maximal pour chacune des 25 distributions bêta.

Pour illustrer les types de distributions associés à chacune des classes d’équivalence d’efficacité maximale, nous dressons dans le tableau 2 la liste des 5 classes en fonction des distributions bêta vis-à-vis desquelles chacune de ces classes est la plus efficace. Nous illustrons également, à titre indicatif, la forme de la densité associée à chaque distribution bêta de manière à donner une idée de la mesure dans laquelle la classe de règles de sélection d’efficacité maximale varie en fonction de la concentration de la masse de probabilité dans chaque distribution. L’observation qui ressort du tableau 2 montre que pour les distributions qui placent une grande partie de leur masse de probabilité sur les utilités élevées, la règle de score (xy) la plus efficace comporte une valeur x près de 0,5 et une valeur y > 1 – 0,5x (voir les règles IV et V); en ce qui concerne les distributions dont la masse de probabilité est répartie de manière plus égale, les règles les plus efficaces comportent un écart entre les valeurs x et y (voir les règles II et III) qui excède celui qui est dégagé conformément aux règles IV et V. Toutefois, comme le graphique 3 l’indique, les niveaux d’efficacité des classes II, III et IV sont pratiquement identiques (l’efficacité de la classe III, qui a été omise du graphique 3, est de 89,04 %). Cela permet de croire que toutes ces règles sont susceptibles de très bien performer pour un large éventail de distributions. La classe I est la plus efficace seulement quand la masse de probabilité est très concentrée autour de valeurs peu élevées (comme dans B(1, 5)).

Tableau 2

Règle de sélection (xy) la plus efficace associée à chaque distribution bêta

Règle de sélection (x, y) la plus efficace associée à chaque distribution bêta

-> Voir la liste des tableaux

5.3 Une mesure supérieure de l’efficacité

Il est important de noter que l’évaluation des règles de score à deux paramètres donne un portait peu flatteur de leur efficacité par rapport aux règles de décision constituant un optimum de premier rang. Cette situation s’explique par le fait que la règle de décision qui constitue un optimum de premier rang n’a pas à satisfaire des contraintes visant à assurer que tous les électeurs déclarent leurs types de façon sincère. Par conséquent, nous souhaiterions utiliser un jalon plus réaliste pour comparer les règles de score à deux paramètres. Idéalement, nous aimerions les comparer à la règle de décision qu’on appelle « optimum de second rang » (c’est-à-dire les règles DVR possédant la propriété de compatibilité d’incitation qui maximisent le bien-être ex ante). Toutefois, une caractérisation complète des DVR possédant cette propriété va au-delà de la portée du présent article. Afin de faire des progrès malgré cette difficulté, nous soulignons ici une propriété d’équilibre des règles de classement (xy) qui doit également se confirmer pour toute DVR possédant la propriété de compatibilité d’incitation : considérons tout électeur i et choisissons deux types proportionnels forme: 2043129n.jpg qui traduisent le même classement ordinal des options. Par « proportionnel », on entend que forme: 2043130n.jpg pour certains scalaires à valeur réelle c > 0. Observons que conformément à la stratégie de vote symétrique du corollaire 1, si le type forme: 2043131n.jpg transmet le vecteur de score individuel σi = (1, y, 0), alors le type forme: 2043132n.jpg le fera également. Cela signifie que tous les types ti ∈ [0, 1]3 possédant le même « type normalisé » forme: 2043133n.jpgsoumettront le même vecteur de score σi que forme: 2043134n.jpg.

Il est important de souligner que l’hypothèse formulée dans notre modèle selon laquelle l’espérance de l’utilité est dépendante de l’état rend impossible de remplacer, sans perte de généralité, les types initiaux ti des électeurs avec leurs types normalisés (seule l’utilité de Bernoulli ti3 à l’égard de l’option la moins souhaitée peut être normalisée à zéro sans perte de généralité pour chaque type ti ∈ [0, 1]3). Toutefois, la caractérisation standard des DVR compatibles avec les incitations (voir par exemple Rochet, 1987) implique que si une DVR incite les électeurs à révéler sincèrement leurs types, alors le mécanisme peut seulement prendre en compte les types normalisés des électeurs. En d’autres mots, une DVR qui est compatible avec les incitations doit traiter le type forme: 2043135n.jpg de la même manière que le type forme: 2043136n.jpg. C’est ce qu’on appelle le « regroupement des types proportionnels » dans Hortala-Vallve (2009). Si ce n’était pas le cas et que l’électeur pouvait s’attendre à une distribution plus favorable sur les options simplement en exagérant toutes les composantes de son vecteur de types par le même facteur, alors il serait dans son intérêt de le faire. Bien que les exigences d’incitation d’une DVR peuvent nécessiter des contraintes en sus des regroupements des types proportionnels, de toute évidence, aucune DVR possédant la propriété de compatibilité d’incitation ne peut générer un bien-être espéré ex ante plus élevé que ne peut le faire un mécanisme satisfaisant seulement à l’exigence des regroupements. Par conséquent, pour calculer l’efficacité des règles de sélection (xy), ce dernier mécanisme offre une base plus réaliste que les règles de décision qui sont des optima de premier rang.

Nous proposons maintenant une DVR particulière 𝑓* qui traite de la même manière tous les électeurs possédant le même type normalisé. Considérons un électeur i qui déclare un type forme: 2043137n.jpg, avec le classement ordinal associé ≻i. En fonction de sa déclaration, l’électeur i se voit attribuer le « type secondaire » suivant τi : forme: 2043138n.jpg

forme: 2043139n.jpg et forme: 2043140n.jpg est l’espérance de uik, celle-ci étant conditionnelle au classement ordinal associé au type forme: 2043142n.jpg déclaré par l’électeur i[40]. Compte tenu des types secondaires τi de tous les électeurs, laissons 𝑓* choisir la distribution de probabilité sur K qui constitue un optimum de premier rang au sens de la définition 5, mais relativement au profil des types secondaires τ ≡ (τ1,…,τn + 1) plutôt qu’au profil des types déclarés. Il est aisé de démontrer que 𝑓* incite les électeurs à révéler leurs vrais classements ordinaux quand tous les autres électeurs le font également[41].

Nous aimerions faire valoir que la DVR 𝑓* constitue un jalon plus réaliste pour évaluer l’efficacité des règles de score à deux paramètres, parce que la DVR 𝑓*et le FSE des règles de score (xy) regroupent tous les deux des types proportionnels. Nous avons simulé numériquement l’espérance de bien-être ex ante de 𝑓* pour toutes les 25 distributions bêta et avons utilisé les résultats pour calculer l’efficacité moyenne des règles de score (xy) relativement à 𝑓*, au lieu de 𝑓FB[42]. Les résultats sont reproduits dans la deuxième colonne du tableau 1 et révèlent que la règle la plus efficace est désormais très proche de la pleine efficacité (la classe d’équivalence II dans le graphique 4 est également la plus efficace; en effet, le classement des niveaux d’efficacité n’est pas influencé par l’utilisation du jalon 𝑓* plutôt que de 𝑓FB). Cela laisse entendre que l’efficacité moins élevée de la classe II relativement à l’optimum de premier rang peut être attribuée presqu’entièrement à la nécessité de regrouper les types proportionnels[43]. Même si la classe II n’est peut-être pas une DVR qui constitue un optimum de second rang, sa très faible perte d’efficacité par rapport à 𝑓* laisse supposer qu’elle est très proche.

Conclusion

Dans cet article, nous avons caractérisé les équilibres symétriques des règles de score à deux paramètres. Avec 3 électeurs, ces équilibres symétriques sont uniques pour les 25 distributions bêta considérées ici. Nous pouvons donc comparer avec confiance les performances de différentes règles de score pour ces distributions. À titre de mesure de performance, nous avons repris la notion d’efficacité proposée dans Weber (1978). Nos résultats montrent que la règle de pluralité et le vote négatif sont les moins efficaces pour représenter les préférences de l’électorat. Alors que le vote par assentiment surpasse de beaucoup ces deux règles, il n’est pas aussi performant que les règles de score optimales (xy), qui comportent une valeur x relativement petite et une valeur y relativement grande. Nos simulations numériques suggèrent que les règles de vote qui permettent aux électeurs d’exprimer l’intensité de leurs préférences donnent de meilleurs résultats que celles qui ne le font pas. Dans nos travaux futurs, nous avons l’intention d’étudier davantage les caractéristiques des mécanismes de vote optimaux de la classe des mécanismes intégrant les contraintes d’incitation (c’est-à-dire les règles de décision d’ « optimum de second rang »). Cependant, de tels travaux devront résoudre des difficultés mathématiques considérables posées par une approche analytique de la conception des mécanismes dans ce contexte.