Corps de l’article

L’origine d’un problème

La question de l’origine de l’État ne s’est pas toujours posée ou, du moins, pas toujours de la même manière. Depuis longtemps, les hommes sont conscients de la complexité de l’espace géopolitique dans lequel ils s’inscrivent et de la diversité des formes que peuvent prendre leurs sociétés. La typologie des régimes établie par Aristote témoigne de manière exemplaire de cet intérêt précoce pour l’ordonnancement des formes politiques. La monarchie, l’aristocratie et la politeia composaient, de pair avec leurs formes corrompues, la classe naturelle des régimes politiques. Il allait de soi pour Aristote qu’une cité était nécessairement dirigée par un seul, par le petit nombre ou par le grand nombre, et qu’il n’y avait pas de régime politique possible en dehors de cette classification.

Bien sûr, les régimes « politiques » ne concernaient que les polis, c’est-à-dire les cités où le pouvoir était déjà constitué et où un ordre avait été établi entre gouvernants et gouvernés. Or, Aristote était conscient que ces régimes ne concernaient pas tous les humains et que plusieurs d’entre eux, notamment des barbares, vivaient en dehors de tout lien politique[1]. C’est pourquoi la cité n’était pour Aristote qu’une des formes de l’organisation sociale, à laquelle s’ajoutaient la famille et le village. Le philosophe s’intéressait à l’essence de la cité, mais ne questionnait pas son origine historique. Quoi de plus normal, puisqu’elle était naturelle et précédait même les autres formes d’organisation sociale. La cité était en effet antérieure aux villages et à la famille, de la même manière que le tout est antérieur à ses parties. Ce n’est donc pas par ignorance qu’Aristote n’a pas développé de théorie de l’origine de l’État[2], mais bien parce que la vision architectonique qu’il endossait aurait rendu absurde une explication de la cité à partir de formes sociales antérieures.

Il faudra un long cheminement pour que la question de l’origine de l’État acquière le sens qui nous intéresse aujourd’hui. L’accumulation des récits ethnographiques, portés par les missionnaires et explorateurs, de même qu’une meilleure connaissance de l’histoire ancienne, a sans doute contribué à ramener la question à l’avant-scène chez les penseurs modernes. Aristote pouvait peut-être expliquer le mode de vie des « barbares sans chefs » à partir d’une architectonique centrée sur la perfection de la cité grecque, mais pouvait-on dire la même chose des sauvages américains? Visiblement, ceux-ci n’appartenaient pas à la périphérie de notre humanité. Ayant vécu dans l’isolement et l’autarcie depuis toujours, il fallait bien conclure qu’ils appartenaient à une autre humanité. Or, si c’était bien le cas, la différence entre les sociétés de sauvages et les sociétés civiles ne pouvait plus simplement s’expliquer à partir d’un ordonnancement naturel des sociétés humaines. Elle devait désormais s’expliquer sur un mode conventionnel.

C’est du moins cette lecture charitable qu’a adopté un auteur comme Montaigne[3]. On ne s’étonne pas dès lors de l’intérêt qu’a éveillé en lui la lecture de La Boétie qui, dans son Discours de la servitude volontaire[4], dépeignait précisément le caractère conventionnel de la domination politique. La tyrannie et les hiérarchies sociales pouvaient d’autant plus apparaître comme conventionnelles qu’une nouvelle humanité semblait en être totalement dépourvue[5]. Quoiqu’il en soit, c’est avec les penseurs du contrat social que la question de l’origine de l’État s’installera au centre de la philosophie politique. Elle y restera pendant deux siècles. Pour Hobbes, Locke ou Spinoza, l’objectif principal n’était plus de déterminer quel était le meilleur régime, mais bien d’où la société civile tirait son origine. Il ne s’agissait plus simplement de classifier les formes de gouvernement, mais bien d’expliquer ce qui en général justifiait la soumission de l’homme à des hiérarchies sociales dont la nature était nécessairement conventionnelle.

Cette constitution de la société civile était bien sûr pensée à partir d’un état originel, l’état de nature, que les auteurs contractualistes, par prudence sans doute, se sont bien gardés de poser comme historique. La bible reste elle-même laconique sur l’organisation sociale des premiers humains. Les villes et les royaumes apparaissent très tôt après le déluge, mais rien n’empêchait de penser qu’ils avaient été précédés d’un état général de sauvagerie. Il était donc possible de voir dans les sauvages américains l’image des premiers habitants du monde, ce que John Locke proposa d’ailleurs explicitement[6]. Quoiqu’il en soit, pour les penseurs du contrat social, déterminer l’origine de la société civile, c’était d’abord et avant tout en élucider les fondements rationnels. En ce sens, les spéculations sur l’origine réelle des États avaient d’abord une fonction pédagogique, à laquelle les considérations historiques sont demeurées subordonnées.

La chose change peut-être avec Rousseau qui, tout en reconnaissant prudemment le caractère fictif de l’état de nature, n’hésite pas à multiplier les comparaisons avec les sauvages. Au coeur des Lumières, alors que la science est totalement imprégnée de l’histoire naturelle naissante, poser l’origine de la société civile n’équivaut déjà plus à s’engager simplement dans une reconstruction des conditions rationnelles de celle-ci. Cela implique également de questionner la place que les sociétés sauvages et civilisées occupent les unes par rapport aux autres dans l’histoire de l’espèce humaine. Condorcet, dans son oeuvre posthume sur les progrès de l’esprit humain, l’illustre bien, puisqu’il aborde clairement la question de l’origine de l’État comme un problème historique :

« Le besoin d’un chef, afin de pouvoir agir en commun, soit pour se défendre, soit pour se procurer avec moins de peine une subsistance plus assurée et plus abondante, introduisit dans ces sociétés [les peuplades] les premières idées d’une autorité politique. »[7]

De telles synthèses ne sont pas surprenantes, puisque l’histoire est de plus en plus habitée par l’idée que la nature forme un ensemble dynamique tourné vers le progrès. Ces considérations s’ajoutent nécessairement à celles des philosophes contractualistes: il ne s’agit plus simplement de reconstruire les conditions de possibilité des sociétés civiles, mais bien d’imaginer comment celles-ci peuvent prendre place dans le déploiement général de l’humanité. Cette question sera à la source de la philosophie de l’histoire de Hegel, pour qui il ne s’agit plus simplement de penser les différents états de l’humanité, mais bien d’envisager ceux-ci dans le cadre d’un même déploiement de l’esprit. Pour Hegel, les sauvages africains, auxquels il consacre de longs passages tout en admettant en savoir peu de choses,

« ne sont pas encore parvenus à cette reconnaissance de l’universel. Leur nature est le repliement en soi. Ce que nous appelons religion, État, réalité existant en soi et pour soi, valable absolument, tout cela n’existe pas encore pour eux. »[8]

Ethnocentrisme, dirait-on aujourd’hui. Sans aucun doute. L’important est que Hegel n’hésite pas à considérer le sauvage africain comme participant à la même dynamique évolutive, l’histoire universelle.

À l’aube du XIXe siècle, il ne manquait donc plus qu’un ingrédient pour que la question de l’origine de l’État puisse prendre pleinement le sens que nous lui attribuons aujourd’hui. Cet ingrédient est la conviction nouvelle selon laquelle l’histoire générale des sociétés humaines est susceptible d’être saisie par une science positive de l’homme. À cette idée, nous pouvons bien entendu associer Auguste Comte et sa loi des trois états, mais aussi Marx et Engels, dans L’idéologie allemande, puis, plus tardivement, Engels, dans son traitement détaillé[9] du livre de Lewis H. Morgan, Ancient Societies[10].

La surprise de Engels devant l’ampleur du travail de Morgan témoigne d’un changement de dynamique : les philosophes avaient définitivement perdu le monopole du questionnement sur l’origine de l’État. Celui-ci était devenu l’objet de nouvelles disciplines : l’anthropologie et la sociologie. Ce sont elles qui élaboreront désormais les principaux schémas et les principales méthodes à partir desquels se penseront l’origine de l’État et l’évolution des sociétés. Dans ce domaine, Morgan avait eu un noble prédécesseur. Herbert Spencer avait en effet proposé d’importer la pensée évolutionniste de Darwin dans l’étude des sociétés humaines. Il avait également tracé le chemin qui menait des sociétés simples aux sociétés complexes. L’approche de Morgan n’en était cependant pas moins révolutionnaire, car, pour la première fois, la question de l’origine de l’État était abordée par un auteur ayant une connaissance intime des sociétés primitives. L’auteur avait en effet consacré de nombreuses études de terrain à l’organisation sociale et politique des Iroquois.

La question des sociétés primitives devenait d’autant plus importante que les milieux scientifiques commençaient à la même époque à se convertir à l’idée de l’ancienneté du genre humain. L’utilisation de la stratigraphie en France avait en effet permis à Boucher de Perthes de démontrer, malgré la résistance de l’Académie, l’existence de l’homme antédiluvien[11]. La découverte de ce qui allait devenir le Paléolithique venait en quelque sorte renverser les rapports de force entre la civilisation et la société primitive. Cette dernière n’était plus à la marge de celle-ci, mais avait représenté l’état commun de l’humanité pour une durée qui avait pu s’étendre sur plusieurs milliers d’années. Dans ce contexte, la question de l’origine de l’État prenait tout son sens. Comment une espèce qui avait parcouru la terre en petites bandes égalitaires pendant des millénaires avait-elle soudainement commencé à former de grandes sociétés inégalitaires, prenant la forme d’États ou d’empires?

Les débuts de l’anthropologie professionnelle se sont néanmoins montrés hostiles à l’idée d’une évolution des sociétés. Franz Boas, père de l’anthropologie moderne aux États-Unis, a consacré une grande partie de son oeuvre à la critique de l’évolutionnisme social et culturel de Spencer, Morgan et Tylor[12]. L’idée de progrès, inhérente à ces théories, et l’idée que les sociétés humaines se développaient selon des stades et des séquences précises, n’avaient selon lui aucun sens et étaient farouchement contredites par les données ethnographiques (sans oublier les accusations de racisme et d’ethnocentrisme adressées aux penseurs évolutionnistes). Le combat de Boas contre l’évolutionnisme social et culturel fut par la suite porté par ses nombreux étudiants. Parmi ceux-ci, se trouvaient des auteurs comme Ruth Benedict, Robert Lowie, Margaret Mead et Alfred Kroeber, qui ont marqué l’anthropologie d’une manière définitive[13].

La méfiance des anthropologues face aux questionnements évolutionnistes sur l’origine de l’État ne les a cependant pas empêché de multiplier les considérations précisément politiques sur les sociétés primitives. L’ouvrage le plus important à cet égard est sans doute celui sur les Systèmes politiques africains, édité par Meyer Fortes et E. E. Evans-Pritchard en 1940[14]. Rompant définitivement avec l’idée selon laquelle il n’y avait pas de politique en dehors de la polis, les auteurs n’hésitent plus à analyser la dynamique des sociétés africaines en termes de pouvoir, de contrôle et d’ordre social. Comme le remarque Marc Abélès :

« L’un des apports essentiels des anthropologues qui ont étudié les sociétés ‘primitives’ consiste à mettre en lumière le fait que l’absence d’État n’est nullement synonyme d’une absence de dispositifs politiques. En affirmant l’universalité du lien politique, l’anthropologie pose simultanément l’exigence d’analyses appropriées qui ne se contentent pas d’isoler artificiellement des ‘systèmes’. »[15]

Le rejet explicite des grandes synthèses évolutives par les premiers anthropologues professionnels a conduit à une multiplication des connaissances sur l’organisation « politique » des sociétés sans État. Ironiquement, cette meilleure connaissance ethnographique, en révélant ou en précisant certaines régularités, préparait le terrain pour une réapparition des grandes synthèses évolutives.

Le refus de l’évolutionnisme avait néanmoins permis d’épurer le débat sur l’origine de l’État de plusieurs des questions qui avaient été centrales à sa formulation au XIXe siècle. D’abord, il fallait abandonner l’idée d’une évolution lamarckienne des sociétés humaines, c’est-à-dire d’un développement qui serait naturellement tourné vers le progrès. Ensuite, il fallait ancrer plus solidement les thèses évolutives sur les connaissances ethnographiques et archéologiques disponibles. Finalement, il fallait préciser les mécanismes grâce auxquels les sociétés humaines évoluaient. Dans ces conditions, les théories sur l’origine de l’État et l’évolution des sociétés pourraient peut-être redevenir fréquentables. Après tout, les faits étaient là: pendant des millénaires, l’humain avait vécu en petites bandes égalitaires, puis, soudainement, des villages et des villes étaient apparues, ce qui s’était accompagné d’une plus grande différenciation sociale et d’une centralisation du pouvoir politique.

Le développement de la sociologie fut peut-être pour quelque chose dans la réconciliation de l’anthropologie avec l’évolutionnisme. Depuis ses débuts, celle-ci s’était intéressée aux changements sociaux et à la modernisation des sociétés. Dans ce cadre, le passage de la société traditionnelle à la société moderne était bien entendu un questionnement privilégié. Ce fut du moins le cas chez Durkheim, ce le sera également chez Tönnies, puis chez Weber. Le développement de la théorie fonctionnaliste de Talcott Parsons aux États-Unis posa toutefois les bases sur lesquelles la question de l’évolution des sociétés et de l’origine de l’État était susceptible de renaître. Si la question avait été maintenue en vie par des auteurs comme Julien Steward ou le très combatif Leslie A. White[16], c’est véritablement l’approche fonctionnaliste de la modernisation des sociétés qui a posé le cadre théorique à partir duquel a été de nouveau envisagée l’origine de l’État[17]. Pour des anthropologues comme Marshall Sahlins, mais aussi et surtout Morton H. Fried et Elman Service, l’évolution des sociétés se pense d’abord comme une succession de stades, chacun caractérisé par une forme d’« intégration sociale », à savoir par la manière dont y est maintenu l’ordre social. Dès lors, penser l’origine de l’État équivaut à se questionner sur l’apparition d’une hiérarchie sociale spécialisée dans le maintien de l’ordre social.

Les explications de l’origine de l’État

Dans quelle mesure les théories fonctionnalistes sont-elles capables de rendre compte de l’origine de l’État? Depuis les années 1960, elles sont en effet critiquées pour leur incapacité à rendre compte des changements sociaux. Les théories fonctionnalistes accorderaient trop d’importance à l’ordre politique, proposant une vision statique et consensuelle des rapports sociaux[18]. Une fois décrit l’aspect fonctionnel des différents stades de l’évolution des sociétés, comment expliquer le passage de l’un à l’autre? On peut bel et bien se demander avec Alain Testart dans quelle mesure les théories évolutionnistes de Morton H. Fried ou d’Elman Service ne sont pas plutôt de simples « classifications des sociétés »[19]? Si l’on admet qu’il existe différents modes d’intégration sociale, caractéristiques de différents types de sociétés, comment expliquer le passage d’un type à l’autre? Quels sont les facteurs ou les mécanismes qui alimentent l’apparition de l’État? Les possibilités sont nombreuses.

La première explication fait intervenir une forme de volontarisme. Elle se trouve notamment chez les auteurs du contrat social, qui voient dans l’apparition de l’État le résultat d’un acte de volonté. Cette idée se trouvait déjà sans doute en partie chez La Boétie qui, malgré son analyse fine des mécanismes qui menaient à la domination, n’a pas hésité à affirmer de manière emphatique qu’il suffisait d’être résolu à ne plus servir pour être libre[20]. C’est également le volontarisme qui est au coeur de la pensée de Condorcet, lorsque celui-ci souligne que c’est le désir d’agir en commun qui donna aux hommes l’idée de se donner des chefs[21]. Une conception volontariste plus récente fut associée au sinologue Karl A. Wittfogel. Il s’agit de la célèbre « hypothèse hydraulique » de l’origine de l’État[22]. Selon cette hypothèse, la centralisation du pouvoir tire son origine de la volonté de villages autonomes de s’associer pour lancer de grands travaux d’irrigation. Encore une fois, c’est la volonté des gens de produire une action collective plus efficace qui est à l’origine de l’État. L’hypothèse hydraulique a cependant été malmenée au cours des années, lorsque l’archéologie a démontré qu’au Mexique, en Chine et en Mésopotamie, trois des régions données en exemple par Wittfogel, l’irrigation a plutôt suivi l’apparition de la centralisation étatique[23].

Sans nier qu’il puisse exister quelque chose de volontaire dans l’apparition de l’État, il n’en reste pas moins que le volontarisme explique bien peu de choses. Comment se fait-il que l’État soit apparue ici et non là? Comment expliquer que ce soit précisément les sauvages qui aient refusé l’État, alors que les civilisés s’en sont accommodés si facilement? Comment les gens ont-ils soudainement cessé de vouloir ce qu’ils avaient si longtemps voulu? C’est peut-être l’incapacité de répondre à ces questions qui a motivé une explication davantage matérielle de l’évolution des sociétés humaines. Celle-ci a pris corps chez Marx et Engels, sous la forme d’une dialectique alimentée par les rapports de production :

« Il s’ensuit qu’un mode de production ou un stade industriel déterminés sont constamment liés à un mode de coopération ou à un stade social déterminés, et que ce mode de coopération est lui-même une « force productive »; il s’ensuit également que la masse des forces productives accessibles aux hommes détermine l’état social, et que l’on doit par conséquent étudier et élaborer sans cesse l’« histoire des hommes » en liaison avec l’histoire de l’industrie et des échanges. »[24]

Le matérialisme de Marx et Engels a certainement soulevé autant d’enthousiasme que de critiques et ce, dès le départ. Il a néanmoins fallu attendre de nombreuses années avant de démontrer les limites de l’hypothèse matérialiste et de prouver que les rapports de production ne déterminaient pas à eux seuls l’évolution des sociétés humaines.

On peut dire sans hésiter que ce sont les travaux de l’anthropologue évolutionniste Marshall Sahlins sur les peuples des Îles Fidji et d’Hawaï qui ont donné le coup de grâce au matérialisme. En étudiant en détail l’économie des sociétés primitives, ce dernier s’est rapidement rendu compte que celles-ci fonctionnaient largement au-dessous de leur potentiel de production. Contrairement à l’affirmation de Engels, ces sociétés pouvaient facilement s’élever au-dessus du seuil de subsistance. En un sens, les sociétés primitives n’étaient pas des sociétés de subsistance, mais bien d’abondance[25]. La même démonstration a été faite du côté français dans les travaux de l’anthropologue Jacques Lizot sur les Yanomami[26]. Comme chez les peuples du Pacifique, la production de ces chasseurs-cueilleurs-horticulteurs amazoniens demeurait largement en dessous de son potentiel, démontrant encore une fois la fausseté de l’hypothèse matérialiste.

Il n’y aucun doute possible sur le fait que la critique du marxisme a mené à une meilleure appréciation du fonctionnement des sociétés primitives. Dans celles-ci, l’économie n’était pas toute puissante et n’était pas en mesure de déterminer à elle seule le changement social. Comme le martèleront Pierre Clastres et plusieurs autres par la suite, la société primitive n’était pas une société sans État, comme le proposait l’anthropologie marxiste[27], mais bien une société contre l’État. Les primitifs n’étaient pas soumis à un état passif de privation, mais participaient à une lutte active contre la division sociale. Quoique ceux-ci ne se représentaient pas explicitement l’apparition possible de l’État, leurs pratiques sociales témoignaient d’une reconnaissance tacite de la possibilité de la division du corps social[28].

La critique du matérialisme soulève cependant de nouvelles questions. L’absence de l’État chez les primitifs est due au combat de ceux-ci contre la division sociale. Or, cela n’explique pas pourquoi la division apparaît ici plutôt que là. Nous voici de nouveau devant le problème d’indétermination qui menace les approches volontaristes. Pierre Birnbaum a justement critiqué l’absence chez Clastres d’explication sociologique de l’origine de l’État. En ce sens, le volontarisme de Clastres serait encore moins élaboré que celui de La Boétie qui, de son côté, identifiait au moins deux mécanismes à l’origine de la servitude volontaire : les coutumes et l’intérêt[29]. La critique de Birnbaum, si elle a soulevé l’ire de Clastres, lui a néanmoins permis de clarifier sa position :

« Quant à savoir si je puis ou non articuler une réponse à la question de l’origine de l’État, je n’en sais encore trop rien, et Birnbaum encore moins. Attendons, travaillons, rien ne presse. »[30]

Mais est-ce bien vrai? Clastres n’en savait-il vraiment rien? Au moment de sa mort, ce dernier préparait un ouvrage sur la guerre dans les sociétés primitives. Les deux premiers chapitres en ont été publiés, mais Clastres a disparu avant d’avoir abordé la question capitale: celle du passage à la société étatique[31]. Qu’en aurait-il dit? Le mystère est certainement aussi grand que celui de l’origine de l’État. Quoiqu’il en soit, l’idée selon laquelle la guerre a joué un rôle important dans l’origine de l’État est séduisante et contient certainement une part de vérité. Partout où il est apparu, l’État a été associé à l’art de la guerre. Même l’État maya classique, dont on a longtemps cru qu’il s’était développé de manière pacifique, a finalement révélé à l’archéologie les traces de son antique militarisation[32]. Or, est-il possible de dire que la guerre cause l’apparition de l’État? Si elle en est une condition nécessaire, elle ne semble pas en être une condition suffisante, ce que la fréquence de la guerre dans les sociétés primitives prouve amplement.

Nous ne sommes donc pas plus avancés. Si ce n’est ni l’économie ni la guerre ni le simple volontarisme qui est à l’origine de l’État, de quoi s’agit-il? La Boétie mettait l’accent sur les « coutusmes » et sur leur importance dans le maintien de la servitude. Comment néanmoins expliquer l’abandon aussi soudain des coutumes égalitaires de la société primitive? Suffit-il d’être conquis une seule fois pour s’accommoder définitivement de l’injustice et de l’exploitation? Qu’est-ce qui justifie le maintien et l’abandon des coutumes? Pour expliquer la stabilité de la domination, La Boétie y ajoutait un autre facteur: l’intérêt.

« Il en a toujours été ainsi : cinq ou six ont eu l’oreille du tyran [...] Ces six en ont sous eux six cents, qu’ils corrompent autant qu’ils ont corrompu le tyran. Ces six cents en tiennent sous leur dépendance six mille, qu’ils élèvent en dignité. [...] Grande est la série de ceux qui les suivent. Et qui voudra en dévider le fil verra que, non pas six mille, mais cent mille et des millions tiennent au tyran par cette chaîne ininterrompue qui les soude et les attache à lui [...]. »[33]

Mais alors, il existe bien un point à partir duquel les coûts de la servitude en dépassent les bénéfices, pourquoi la chaîne ne se brise-t-elle pas en ce point? Qu’y a-t-il de si spécifique à l’esprit humain qui l’empêche de simplement se soustraire à l’exploitation? La chose devrait pourtant être simple, dans la mesure où le nombre des dominés excède toujours celui des dominants. Bien sûr, La Boétie a raison: ce sont la coutume et l’intérêt qui sont à la base de la société étatique. Or, cela ne nous avance guère, puisqu’ils sont également à la base de la société sans État. Comment alors expliquer le passage de l’une à l’autre?

Il ne faut pas désespérer de trouver une solution à notre problème. Peut-être est-il absurde d’envisager une réponse unique, comme si, chez l’humain, l’économie, la guerre, les coutumes et l’intérêt évoluaient indépendamment les uns des d’autres. S’il est impossible de trouver un déterminant simple, il est peut-être possible d’établir des corrélations entre plusieurs facteurs qui s’accumulent pour déterminer le changement social. C’est certainement cette approche qui guide les meilleurs travaux de synthèse sur la question, puisque les spécialistes des civilisations anciennes savent que le développement de l’État et de la centralisation a nécessairement plusieurs facettes. Les théoriciens évolutionnistes, si on les a accusés de ne pas rendre compte du changement social et de se limiter à établir des classifications, n’en mentionnaient pas moins plusieurs facteurs susceptibles de se trouver à l’origine de l’État. À la base de la grande transformation se trouvait incontestablement le réchauffement général du climat au cours du Holocène, ayant rendu possible l’apparition et la diffusion de l’agriculture[34]. Une fois apparu, ce mode de production intensif basé sur l’accumulation et le stockage avait conduit à l’augmentation de la densité de la population et, dans le contexte d’un environnement riche mais limitant la dispersion, au développement d’une dynamique guerrière alimentant la formation d’unités plus puissantes et l’apparition de corporations guerrières ou religieuses. Pour le dire avec Marcel Gauchet d’une manière sans doute trop sommaire :

« Que croissent le nombre des hommes, le niveau de leurs ressources, la complexité et l’efficacité de leurs techniques, et la fonction organisatrice et coercitive croîtra avec elles. A un certain moment, elle aura suffisamment pris de poids pour qu’on l’appelle l’État. »[35]

De manière certainement plus précise, l’anthropologue Robert L. Carneiro a décrit le processus récurrent à travers lequel les premiers États sont apparus là où ils sont apparus[36]. Au centre de sa démonstration, le contexte écologique : la plupart des premiers États sont apparus dans des vallées fertiles, elles mêmes cernées par des milieux hostiles. Que ce soit la vallée de l’Indus, du Nil, de l’Euphrate et du Tigre, de Mexico, la vallée côtière du Pérou ou les vallées fertiles des Andes, partout l’État est apparu dans un environnement fertile enclavé. Dans un contexte ouvert comme l’Amazonie, la croissance démographique mène typiquement à une dispersion des populations. À l’inverse, dans un contexte plus fermé, elle tend plutôt à déboucher sur une diminution des terres agricoles disponibles. Cela conduit à l’apparition de nouvelles technologies agricoles permettant une intensification de l’agriculture. La rareté de la terre crée un processus de compétition, qui modifie les incitatifs à la base des pratiques guerrières. Si la guerre, dans la société primitive, est essentiellement tournée vers l’acquisition de prestige[37], elle acquiert dans le contexte décrit par Carneiro un aspect économique prépondérant.

C’est dans ce contexte de tension qu’apparaissent les premiers signes de la centralisation politique. Ceux-ci témoignent à la fois de la subordination des vaincus aux vainqueurs et de la volonté de créer des unités politiques plus performantes. Si les données archéologiques appuient ce scénario pour les exemples donnés plus haut, Carneiro souligne qu’un scénario semblable peut également avoir mené à l’apparition de l’État dans la Vallée de fleuve Jaune en Chine ou dans les basses terres mayas au Mexique. Bien que ces régions ne soient pas à proprement parler enclavées, l’adaptation des populations à ces environnements fertiles peut avoir conduit à un processus de compétition semblable à celui observé dans les autres cas. Ici comme ailleurs, l’État trouve son origine dans l’intérêt d’une population à demeurer dans une région déjà densément peuplée et à s’engager dans une compétition pour une ressource limitée. En ce sens, ce serait bien la reconfiguration des intérêts causée par l’évolution du contexte géopolitique qui mènerait à la création d’unités politiques plus grandes, puis, naturellement, à l’apparition de hiérarchies sociales. Naturellement? C’est bien là la question. Pourquoi la création d’unités politiques plus grandes devrait-elle naturellement mener à l’apparition de hiérarchies sociales?

Malgré la diversité des cheminements historiques, les scénarios permettant d’établir l’origine de l’État font tous intervenir à un point ou à un autre des considérations sur le nombre et la démographie. Clastres, par exemple, soulignait que la société primitive, pour se maintenir, devait demeurer de faible taille[38]. De même, Elman Service et Morton H. Fried établissent un rapport direct entre la taille des sociétés et les stades évolutifs. Les bandes chez Service, tout comme les sociétés égalitaires chez Fried, sont naturellement des sociétés de faible taille, où le groupe local comprend entre 30 et 100 individus. L’évolution politique, faisant intervenir une plus grande hiérarchie sociale, se traduit ainsi par la création de groupes locaux plus nombreux. C’est ainsi que le passage aux sociétés à rangs, puis aux sociétés stratifiées chez Fried, accompagne l’apparition de structures villageoises. De même, l’apparition des tribus et des chefferies chez Service correspond à la formation d’ensembles comprenant plusieurs milliers d’individus. L’apparition de l’État, finalement, entraîne le développement de sociétés pouvant en comprendre des millions. D’où vient cette étrange corrélation entre le nombre et l’organisation sociale? Pourquoi des unités plus grandes doivent-elles nécessairement prendre une forme hiérarchique?

Pour ces auteurs, qui s’inscrivent dans une tradition fonctionnaliste, il s’agit d’abord de différents stades d’« intégration sociale ». Mais que signifie au juste ce concept? Alain Testart a certainement raison de railler le caractère impressionniste de l’intégration sociale chez les auteurs évolutionnistes. Celui-ci, en effet, ne repose sur aucune définition précise, au-delà de

« l’impression globale et vague que ces ‘niveaux sociaux d’intégration’ correspondraient à des tailles différentes de groupements sociaux: ce serait la plus ou moins grande quantité de gens (de population) ‘encapsulés’ dans une formation sociale. Et l’on pourrait donc ordonner ces niveaux assez simplement selon cette grandeur: les petits, les moins petits, les gros, etc. »[39]

L’évolution des sociétés ne se résume évidemment pas à un passage du plus petit au plus grand. Elle ne peut pas être comprise comme un processus dont le moteur premier serait la croissance démographique. Après tout, elle survient dans un contexte politique, écologique, culturel et économique dont elle dépend, et il n’y a pas de sens à faire de la croissance démographique le critère qui, indépendamment des autres, est susceptible de rendre compte de l’origine de l’État[40]. Or, ce n’est pas cela qu’il faut expliquer.

Le problème se trouve dans la corrélation entre la taille des groupes et leur organisation hiérarchique. Pourquoi cette corrélation existe-t-elle? Pourquoi les petites bandes nomades de chasseurs-cueilleurs sont-elles tournées vers l’égalitarisme? Pourquoi l’apparition de sociétés villageoises s’accompagne-t-elle systématiquement d’une multiplication des rangs et des statuts? Pourquoi toutes les sociétés qui ont rassemblé des millions d’individus ont-elles fait intervenir une forme ou une autre de centralisation politique? C’est à cette question que nous tenterons maintenant de répondre, afin d’expliciter le rapport souvent implicite que les auteurs évolutionnistes ont tracé entre la croissance de la taille des groupes et l’origine de l’État et des hiérarchies sociales.

La nature de la coopération

Commençons donc par le début. Comment les humains parviennent-ils à coopérer avec des milliers d’individus non apparentés et comment cette capacité a-t-elle pu s’imposer à travers l’évolution des hominidés? Ce problème prend toute sa signification lorsqu’on le considère du point de vue du paradoxe de la coopération animale. La coopération à l’intérieur du règne animal est toujours un fait surprenant pour les biologistes. En effet, du point de vue de la sélection naturelle, il est toujours étonnant qu’un organisme prenne le risque de nuire à ses chances de survie et de reproduction dans le but d’augmenter celles des autres.

Les biologistes identifient généralement deux mécanismes permettant de penser l’évolution d’une disposition à la coopération chez une espèce animale[41]. Le premier s’appelle la sélection de parentèle et le second l’altruisme réciproque. La sélection de parentèle est sans aucun doute le mécanisme le plus fréquent. Il repose sur une idée simple, à savoir que la sélection naturelle opère sur les gènes et non pas sur les individus. Un comportement qui est susceptible de contribuer à la transmission des gènes sera sélectionné, même s’il risque de nuire à la survie de l’individu[42]. C’est ce qui explique le sacrifice de plusieurs organismes pour leur progéniture et la solidarité qui peut exister à l’intérieur d’une fratrie. Comme ces individus possèdent de nombreux gènes en commun, en contribuant à la survie et à la reproduction de leurs proches parents, ils contribuent également à la transmission de leurs propres gènes. Dans certains cas, celui des insectes ultrasociaux comme les termites ou les fourmis, la sélection de parentèle peut mener à l’apparition de sociétés comprenant des milliers individus, tous apparentés à une même reine et prêts à se sacrifier pour la survie de la colonie. La sélection de parentèle, bien que contribuant indubitablement à l’apparition de l’altruisme chez l’humain (qu’il s’agisse de l’amour maternel ou du népotisme), fait cependant face à une limite évidente: elle ne parvient pas à expliquer la coopération entre des individus non apparentés, comme c’est le cas chez les humains, mais également chez de nombreux primates.

Pour rendre compte de ce phénomène, les biologistes et les théoriciens des jeux ont inventé un autre mécanisme: l’altruisme réciproque ou le « donnant-donnant », théorisé en biologie par Robert Trivers[43] et en science sociale par Robert Axelrod[44]. L’idée est simple et bien connue, la coopération peut s’établir entre des individus non apparentés dans la mesure où ceux-ci sont impliqués dans une suite d’interaction, plutôt que dans des interactions ponctuelles. Si les individus sont capables de se reconnaître entre eux et s’ils interagissent fréquemment, alors la coopération peut émerger. Il suffit pour cela que les individus soient capables de coopérer de manière conditionnelle, c’est-à-dire de cesser de coopérer lorsque leur partenaire se montre non coopératif. Ce mécanisme mène chez les primates à la formation de coalitions et à la mise en place de relations de confiance entretenues à travers la pratique du toilettage[45]. À l’inverse de la sélection de parentèle, l’altruisme réciproque a l’avantage d’expliquer la coopération entre des individus non apparentés. Par contre, il fait face à une autre limite. Puisque les individus ont une mémoire et un budget de temps limités, ils ne peuvent pas nouer des relations de confiance avec un grand nombre de congénères. On le voit clairement chez les primates, dont le budget de temps est largement entamé par le maintien et le développement de relations sociales. Le toilettage sociale peut en effet accaparer jusqu’à 15-20% de leur budget de temps total[46]. L’incapacité à nouer des relations de confiance à large échelle est principalement responsable du plafonnement de la taille des groupes chez les primates, qui atteignent rarement plus de quelques dizaines d’individus.

Pour contourner les limites de l’altruisme de parentèle et de l’altruisme réciproque, les théoriciens ont inventé un nouveau mécanisme, qui nous intéresse de manière plus spécifique. Il s’agit de « l’altruisme réciproque fort ». Comme l’altruisme réciproque faible de Axelrod, l’altruisme réciproque fort cherche à expliquer l’émergence de la coopération entre des individus non apparentés. Contrairement à lui, cependant, il prétend pouvoir expliquer la coopération entre un nombre infiniment grand d’acteurs. En quoi consiste-t-il? L’altruisme réciproque fort implique non seulement une disposition à coopérer de manière conditionnelle, mais également une motivation à punir les comportements non coopératifs, même lorsque ceci implique des coûts pour l’individu et aucun gain futur. Selon l’argument de Samuel Bowles et Herbert Gintis, l’altruisme réciproque fort est davantage susceptible que l’altruisme réciproque faible à expliquer la coopération dans les groupes de grande taille[47]. En effet, du moment où des individus, à l’intérieur d’un groupe, développent une motivation pour sanctionner de manière violente les comportements non coopératifs, et cela sans égard à un gain futur, l’intérêt des autres membres à adopter un comportement opportuniste réduit sensiblement. Ainsi, plus la proportion d’altruistes réciproques forts à l’intérieur d’un groupe augmente, plus les opportunistes ont intérêt à faire preuve de prudence. De même, comme l’ont montré Boyd et Richerson, si l’espèce évolue dans un contexte de compétition entre les groupes pour une même niche écologique, comme c’est souvent le cas chez les hominidés, alors les groupes comprenant une proportion plus élevée d’altruistes réciproques forts peuvent prospérer davantage et s’imposer dans la population à travers un processus de sélection des groupes[48].

L’altruisme réciproque fort a plusieurs arguments en sa faveur. Les plus importants proviennent de la théorie des jeux expérimentale. Depuis plusieurs années déjà, les chercheurs dans ce domaine savent que la définition classique de la rationalité instrumentale peine à expliquer les comportements réels des acteurs économiques. Les expériences classiques de Güth et ses collègues avec le jeu d’ultimatum ont démontré que les individus avaient non seulement une disposition à coopérer de manière conditionnelle, mais également à punir les comportements non coopératifs, même si cela se traduisait pour eux par une perte nette[49]. Les recherches récentes, nous mentionnerons seulement celles de l’économiste Ernst Fehr, confirment ce résultat et permettent de préciser largement les circonstances et la mesure dans laquelle les humains développent une préférence pour la punition altruiste[50]. De nombreuses recherches, que nous n’aborderons pas ici, cherchent également à mettre en relation l’altruisme réciproque fort avec les émotions sociales et à identifier son fonctionnement au niveau neurologique.

L’altruisme réciproque fort, aujourd’hui largement accepté dans la littérature sur la nature de la coopération, laisse cependant inexpliqués deux problèmes politico-anthropologiques classiques. D’une part, s’il ouvre la voie à la coopération entre un nombre indéfiniment grand d’acteurs, pourquoi les humains ont-ils continué pendant si longtemps de vivre en bandes de quelques dizaines d’individus? D’autre part, pourquoi la formation de sociétés de grande taille, avec des établissements de la taille de villages ou de villes, s’est-elle nécessairement accompagnée d’une plus grande différenciation sociale et, éventuellement, d’une centralisation politique? L’argument que nous soutiendrons est que ces deux problèmes peuvent s’expliquer si l’on considère que l’altruisme réciproque fort, tout comme l’altruisme réciproque faible, est sensible à la taille des groupes.

Rappelons d’abord le problème. L’altruisme réciproque décrit par Axelrod peut fonctionner dans la mesure où les individus interagissent de manière suivie, c’est-à-dire dans la mesure où ils gardent en mémoire l’identité de leurs partenaires, de même que l’attitude coopérative ou non coopérative qu’ils ont adoptée au cours de leurs interactions passées. Ainsi, la capacité de coopérer avec un grand nombre d’individus dépend de la capacité à garder en mémoire des informations sur « qui est qui » et « qui a fait quoi à qui ». L’auteur qui a traité le plus en détail l’effet de la mémoire limitée des primates sur la taille des groupes est sans doute le psychologue Robin Dunbar. Selon sa thèse bien connue, la taille moyenne des groupes chez les primates est proportionnelle à la taille relative du néocortex[51]. La taille de celui-ci se serait accrue au cours de l’évolution spécifiquement parce qu’elle favorisait l’intelligence sociale[52]. Dunbar en tire même une thèse sur l’origine du langage selon laquelle le toilettage social serait devenu une manière inefficace de maintenir les relations sociales au sein du groupe, parce que trop coûteuse en temps. Les humains auraient donc développé le langage comme une forme de « toilettage à distance », une manière économique de rester au courant de « qui fait quoi à qui »[53].

Nous ne discuterons pas plus en profondeur la thèse (discutable) de Dunbar sur l’évolution du langage. Nous nous concentrerons plutôt sur la relation entre la mémoire et la taille des groupes. Selon Dunbar, la taille du néocortex chez l’humain, lorsqu’on la compare à celle des autres primates, indique que nous devrions former des groupes d’environ 150 membres. Bien entendu, il nous arrive de former des groupes beaucoup plus grand, mais Dunbar insiste néanmoins sur l’importance des établissements de cette taille dans l’histoire humaine. Que ce soit les clans dans les sociétés de chasseurs-cueilleurs, les communautés huttérites, les compagnies à l’intérieur des armées, ou encore les plus grandes firmes organisées selon des critères de communication informels, toutes ces institutions comprennent entre 100 et 200 individus[54]. De même, les expériences sur les réseaux sociaux pointent vers le même résultat. Une expérience menée par Peter Killworth et ses collègues a montré que le nombre d’individus à qui une personne était à l’aise de demander une faveur s’élevait à 134[55]. Dunbar et son collègue Russell Hill ont aussi mené une étude sur l’envoi de cartes de Noël au Royaume-Uni et ils ont découvert que le nombre de personnes contactées s’élevait en moyenne à 154[56].

Il semble donc possible d’affirmer, sans risquer d’être accusé de pratiquer la numérologie, que la mémoire sociale limitée détermine en partie chez l’humain, comme les autres primates, la forme des organisations sociales. Mais comment exactement? Rappelons que l’altruisme réciproque fort représente lui-aussi une forme de coopération conditionnelle. Les altruistes réciproques forts ont en principe une disposition à punir les comportements déviants, mais cela ne signifie cependant pas qu’en pratique, cette disposition ne sera pas mise en échec par des motivations concurrentes. Au contraire, on sait que l’augmentation du coût de la punition est susceptible de réduire la disposition à sanctionner effectivement les comportements non coopératifs[57]. Ainsi, si la taille des groupes influence de manière importante les coûts associés à la punition des comportements non coopératifs, l’altruisme réciproque fort ne mènera pas nécessairement à l’apparition de groupes de grande taille.

Les études empiriques qui cherchent à évaluer l’impact de la taille des groupes sur la coopération demeurent relativement peu nombreuses. Si nous devions dès maintenant établir une hypothèse cependant, la plus crédible serait la suivante. D’un côté, un groupe de plus grande taille est davantage susceptible de générer de la coopération qu’un groupe de très petite taille, parce qu’on y compte davantage d’altruistes réciproques forts et que ceux-ci ont une disposition à punir indépendante du fait que les autres puniront ou non[58]. D’autre part, on peut penser que le gain marginal qui vient avec la croissance de la taille des groupes devient insignifiant au-delà d’une certaine limite. À ce point, ce sont d’autres considérations qui entrent en ligne de compte: une motivation réduite à sanctionner, une sensibilité réduite aux sanctions, tout cela découlant d’une difficulté croissante à garder en mémoire les actions passées de chacun des membres du groupe[59]. Il est donc vraisemblable que les groupes humains atteignent une taille optimale, poussée vers le haut par les bénéfices liés à une pression sociale accrue, mais tendant à plafonner à cause de la difficulté des humains à assurer le suivi des actions de leur pairs dans les groupes trop grands.

L’idée mérite d’être étayée par des recherches supplémentaires en économie comportementale, mais elle demeure relativement intuitive. Après tout, nous sommes tous parfois confrontés dans des endroits publics à des gestes d’incivilité qui font naître en nous un fort désir de punir des individus déviants. Or, dans le plupart des cas, nous ne faisons rien et nous restons muets. Lorsque nous nous retrouvons dans une telle situation, nous sommes généralement mécontents de nous et nous nous trouvons lâches. Au fond, notre comportement est tout à fait rationnel si l’on considère le danger qu’il peut y avoir à punir de purs étrangers. Même si le risque est minimal, il y a toujours une possibilité que l’individu soit un psychopathe ou un criminel dangereux.

Les contraintes cognitives à l’évolution des sociétés

Comment ces considérations nous permettent-elles de résoudre le problème politico-anthropologique que nous avons formulé plus tôt? Comment nous aident-elles à comprendre la relation entre la démographie et l’apparition des hiérarchies sociales? La réponse que nous proposons est que la taille des groupes chez l’humain est sujette à un effet de plafonnement, à cause de la croissance des coûts associés à la sanction sociale. Ainsi, l’émergence d’établissements de la taille des villes ou des villages n’a été possible chez l’humain que parce qu’il a créé des institutions qui ont permis un contrôle étroit des coûts reliés à la punition des comportements déviants.

Cette idée a l’avantage d’être compatible avec les grandes théories que les anthropologues culturels ont formulées sur l’évolution des sociétés. Ces théories, bien qu’elles aient souvent été critiquées quant à l’exactitude des typologies sur lesquelles elles reposaient, ont néanmoins mis en lumière certaines constantes dans l’organisation des sociétés humaines. Par exemple, le fait que les sociétés humaines de chasseurs-cueilleurs étaient toutes composées de bandes à tendance égalitaire comprenant entre 30 et 100 individus[60]. De même, le fait que les sociétés qui reposaient sur des structures villageoises, comprenant quelques centaines d’individus, en venaient toutes à créer des structures de parenté complexes (souvent hiérarchiques), à l’intérieur desquelles apparaissait une division du travail de sanction. Ainsi, à l’intérieur d’un lignage, par exemple, ou d’un clan, l’on attribue des devoirs particuliers de sanctionner les proches, souvent pour répondre à une norme supérieure qui consiste à préserver l’honneur du lignage[61]. Les crimes d’honneur témoignent encore aujourd’hui d’une telle logique.

Une dernière constante identifiée par les anthropologues et les sociologues est que l’apparition de sociétés comprenant des centaines de milliers d’individus impliquait universellement la différenciation entre un centre politique et une périphérie. Cette différenciation s’accompagnait de l’apparition de chaînes de commandement à l’intérieur desquelles le coût de la punition était contrôlé par une distribution hiérarchique, où un dirigeant avait l’autorité de maintenir le contrôle sur un nombre limité d’individu, tout en devant rendre des comptes à un supérieur hiérarchique. Il s’agit bien entendu de la dynamique de bureaucratisation, de militarisation, bref, de monopolisation du pouvoir politique qui a accompagné partout, que ce soit en Mésopotamie, en Égypte, en Chine, en Inde, au Pérou ou au Mexique, l’apparition de la civilisation.

Nous avons vu que plusieurs auteurs ont critiqué le fonctionnalisme sur lequel reposaient les théories évolutionnistes de l’origine de l’État[62]. Selon l’analyse classique de Jon Elster, le fonctionnalisme est incapable d’expliquer la dynamique qui mène à l’apparition des institutions[63]. En anthropologie, les théories évolutionnistes de Service, Fried ou Sahlins proposent, selon plusieurs auteurs, une suite de totalités sociales se succédant sous la pression de changements climatiques ou démographiques[64]. Cela ne signifie pas pour autant qu’il soit impossible de défendre un fonctionnalisme sain en sciences sociales. Comme le soutient Philip Pettit, il est possible que le fonctionnalisme échoue à expliquer l’apparition des institutions, mais parvienne néanmoins à expliquer leur résistance au changement[65]. C’est exactement ce que fait l’hypothèse que nous avons formulée. La mémoire limitée des humains ne détermine pas directement le changement social en faveur d’une plus grande hiérarchie et d’une centralisation du pouvoir politique. En revanche, elle explique la résistance de certaines institutions à la révision. Dans les groupes dont la taille dépasse celle des bandes de chasseurs-cueilleurs, les gens se connaissent de moins en moins et il devient de plus en plus risqué de punir les comportements déviants. Cela crée un incitatif en faveur de la fission du groupe ou de l’apparition d’institutions permettant la division du travail de sanction. Les structures de parenté, les classes d’âge, les sociétés secrètes, les hiérarchies militaires ou religieuses peuvent toutes jouer ce rôle en attribuant aux individus des obligations spécifiques de sanction. Les contraintes cognitives n’expliquent donc pas les raisons historiques de l’apparition de ces institutions, mais elles expliquent pourquoi l’on observe, au niveau des populations humaines, une relation entre la démographie et l’organisation sociale.

Nous n’en dirons pas plus et nous nous contenterons de terminer en demandant pourquoi, s’il suffit d’établir une division du travail de sanction pour constituer des groupes plus grands, les espèces humaines antérieures à Homo sapiens n’ont pas songé à le faire au cours des deux millions d’années qu’a duré leur présence sur terre? La réponse que nous proposons est que, si l’on croît comme Searle que le langage est la première des institutions sociales[66], alors il est possible de penser que les espèces humaines antérieures à Homo sapiens n’avaient tout simplement pas un langage suffisamment complexe pour créer des institutions qui auraient permis une telle division du travail[67]. Nous résisterons cependant à l’envie de raconter ici l’histoire naturelle des hiérarchies sociales chez les hominidés et nous réservons ce récit pour une autre occasion.