Corps de l’article

Dès l’apparition du t’chat dans les années 1970, les utilisateurs commencent à ajouter à leurs énoncés écrits de petits signes iconiques[1] destinés à exprimer un affect (Dear, 2002). Depuis, cette tendance n’a fait que croître si bien qu’aujourd’hui, notre communication en ligne à l’écrit est très souvent constituée d’énoncés hybrides comprenant du texte et tout un panel de signes iconiques ressemblant à des mimiques faciales, à des gestes, à des objets ou à des parties du corps humain. On y trouve des pictogrammes dessinés (comme les emojis : 😊, 🙁, 😉, etc.) ou constitués de signes issus de la banque de caractères ASCII[2] (à lire en penchant la tête vers la gauche, pour la version « occidentale », par exemple :-), :-(, :-D, ou de face, pour la version « orientale », par exemple ^^, O_o, ^-_-^, etc.). Il s’agit d’une grande nouveauté dans l’histoire de la communication humaine. Si l’écriture pictographique n’a rien de nouveau, puisqu’elle est la première forme d’écriture connue, il est inédit que des pictogrammes soient employés pour indiquer les affects du locuteur, en interaction avec la partie écrite des énoncés.

Cette nouvelle pratique langagière correspond à l’apparition de la communication numérique en ligne via t’chat, où, pour la première fois, les êtres humains peuvent communiquer, à l’écrit, de façon synchrone, grâce à une interface informatique. La temporalité des échanges ressemble donc fortement à celle de l’oral, mais pas leur spatialité. Puisque les utilisateurs ne sont pas en face à face, les gestes, les mimiques et les autres « outils » physiques servant habituellement de support au calcul du sens dans les interactions ne sont pas disponibles. Il est tout naturel, dans ces conditions, qu’apparaissent des signes iconiques représentant cette communication paraverbale pour remplir, à l’écrit, sa fonction. Ces signes ont été décrits d’un point de vue sémiotique/sémiologique (Danesi, 2016), sémio-pragmatique et énonciatif (Halté, 2018), et aussi selon l’expression des affects en contexte numérique (Allard, 2014). Il apparaît, en effet, que cette fonction d’indication d’un affect du locuteur a des effets à plusieurs niveaux discursifs.

À un niveau profond, sémantique, ces pictogrammes, parce qu’ils expriment les affects du locuteur, entrent dans le calcul de la modalité. Ils portent sur des propositions[3] énoncées et en modifient l’interprétation littérale, permettant au locuteur de montrer comment il se positionne par rapport à ce qu’il dit (Halté, 2018). Ils contribuent donc à construire un cadre modal évoluant au fil de la conversation. Les différents participants peuvent modifier ce cadre modal sous certaines conditions, en partie grâce aux emojis et aux émoticônes, et ils doivent sans cesse s’y positionner. Ainsi, si j’énonce une proposition en l’accompagnant d’un pictogramme ressemblant à une mimique de tristesse, j’indique quelque chose quant à mon rapport à ce que je dis : il va être difficile pour mon interlocuteur de remettre en cause la vérité de la proposition que j’énonce, ce qui conditionne fortement la suite de l’échange. L’usage de ces pictogrammes permet aux participants, sur le même modèle que dans l’exemple ci-dessus, de mettre en place des stratégies conversationnelles diverses.

Le propos de cet article est de décrire le rôle des pictogrammes dans la constitution et la modification du cadre modal d’une conversation et dans l’établissement de stratégies conversationnelles en son sein. Nous avons trois objectifs. D’abord, nous définirons notre objet d’étude et nous décrirons sa structure sémiotique et son lien avec les affects et les modalités. La notion de modalité est envisagée ici d’un point de vue linguistique. Dans cette perspective, elle constitue une prise de position subjective, manifestée dans les énoncés par diverses marques, par rapport à ce qui est dit. Nous lierons ensuite la notion de modalité à celle de « prise en charge énonciative » afin de montrer comment les modalités signifiées par ces pictogrammes permettent de mettre en place un cadre conversationnel, soit un ensemble de règles implicites fondées sur les modalités exprimées par les interlocuteurs[4]. Enfin, nous analyserons plusieurs stratégies conversationnelles liées aux fonctions énonciatives de notre objet d’étude.

Les exemples que nous allons étudier sont issus de corpus divers. Nous débutons avec un corpus de tweets (nous le nommerons « corpus SoSweet ») issu du travail de récolte (ayant eu lieu de 2014 à 2017) au sein de l’ANR SoSweet pilotée par Jean-Philippe Magué. Ce corpus comporte 3 444 075 tweets correspondant à 44 107 210 tokens (mots, signes de ponctuation, émojis, émoticônes, etc.) recueillis en décembre 2016 grâce à une base de données automatisée. Ensuite, nous explorons un corpus d’enseignement en ligne, donné dans le cadre du master FIL de l’université de Cergy Pontoise en 2017 (nous le nommerons « corpus Cergy Pontoise). Comportant 14 809 mots, récoltés sur la plateforme numérique de l’université, ce corpus est constitué d’interactions entre un enseignant et plusieurs étudiants au sein d’un salon de t’chat mis en place pour assurer des cours en lignes. Enfin, notre corpus de thèse (nous le nommerons « corpus de thèse ») composé de 16 570 mots, lui tiré d’un salon de t’chat IRC[5] et récolté en 2009, est constitué de conversations courantes entre des utilisateurs anonymes ayant eu lieu sur une période de 24 heures. Tous les pictogrammes que nous étudierons ici se trouvent être dans les quinze pictogrammes les plus réitérés dans notre corpus de tweets; en fait, ce sont les pictogrammes les plus couramment utilisés sur Twitter. Par ailleurs, les emplois de pictogrammes dont nous rendons compte ici ne présentent pas de caractère particulier ou exceptionnel : il s’agit d’emplois tout à fait courants de ces signes. Néanmoins, par souci de clarté, nous n’utilisons pas d’exemple dans lesquels apparaissent des séquences de pictogrammes. Ces exemples sont fréquents et leur analyse ne diffère que peu de celle qui est proposée ici.

Émoticônes, affects et modalités

Définitions et caractérisation sémiotique générale

Les éléments auxquels nous nous intéresserons dans cet article sont des pictogrammes au sens de Vaillant (1999)[6] : des signes relevant à la fois de l’image (pictus) et de l’écrit (gramma). Ces signes ont pour caractéristique d’être interprétés grâce à leur ressemblance visuelle avec un objet et, dans le même temps, de s’intégrer à ce qui pourrait s’apparenter à un système d’écriture (organisé selon des axes syntagmatique et paradigmatique – ce qui implique, notamment, des contraintes de taille et plus généralement de spatialisation). Ces signes peuvent prendre deux formes : ils peuvent être « dessinés », comme 😊, ou constitués de caractères de la banque ASCII, comme :-). Par souci de clarté, nous observerons quasi exclusivement des exemples présentant des pictogrammes dessinés, autrement appelés « emojis[7] » par le grand public – néanmoins leur statut sémiotique est tout à fait similaire aux signes composés de caractères de la banque ASCII.

Les pictogrammes s’intégrant aux énoncés dans les communications en ligne à l’écrit sont de plusieurs types. On peut ainsi distinguer deux grandes familles de pictogrammes selon leurs caractéristiques sémiotiques. D’une part, ceux dont la seule fonction est de représenter un objet et qui, à ce titre, peuvent remplacer un lexème, par exemple 🚗; d’autre part, les pictogrammes qui non seulement ressemblent à un objet mais qui, en plus, servent à indiquer les émotions du locuteur, comme 😊.

On distingue généralement trois relations à l’œuvre entre le signe et l’objet dans les modèles sémiotiques inspirés des travaux de Peirce (ici, nous utilisons celui d’Everaert-Desmedt, 1995) :

  • Iconique : une icône est un signe qui ressemble, formellement, à un objet (exemple : une photographie, une onomatopée, un pictogramme comme 😊).

  • Indexicale : un index est un signe qui, dans la situation d’énonciation, rend perceptible hic et nunc un objet qui ne le serait pas sans l’index (exemple : un geste de pointage, une empreinte dans le sable, une interjection).

  • Symbolique : un symbole est un signe qui renvoie à un objet en vertu d’une loi, d’une convention partagée par une communauté interprétative (exemple : un nom commun, le drapeau d’un pays).

Ces trois relations doivent à notre avis être conçues comme entrant dans un processus dynamique dont le résultat est l’interprétation du signe, c’est-à-dire qu’à des niveaux plus ou moins saillants, s’organisant sur trois continuums respectifs (orientés de l’absence de la relation à sa forte actualisation), ces trois potentialités relationnelles peuvent être activées en même temps lors de l’interprétation d’un signe.

Revenons à nos tentatives de catégorisation des pictogrammes.

Premier cas de figure : l’interprétation repose uniquement sur une relation d’iconicité. Ainsi, 🚗 ressemble formellement à une voiture. Observons un exemple authentique (corpus SoSweet) :

(1) « Le test de @Steep_FR est enfin disponible sur notre site ! ❄ ⛷ 🏂 ».

Il s’agit de faire la promotion du test du jeu vidéo Steep, qui est une simulation de sports d’hiver. Ici, les trois pictogrammes représentent de façon iconique un flocon de neige, un skieur et un snowboardeur pour faire référence à l’univers du jeu vidéo dont il est question dans la partie écrite de l’énoncé. L’interprétation de ces pictogrammes repose uniquement sur leur saisie visuelle et leur ressemblance avec des objets. La potentialité indexicale de ces signes est faible (elle existe dans la mesure où, pour les interpréter complètement, il faut les relier à la partie écrite de l’énoncé), leur potentialité symbolique est nulle (il ne s’agit pas de référer à autre chose que ce à quoi ils ressemblent en vertu d’une convention).

Second cas de figure : l’interprétation repose sur une relation d’iconicité et une relation d’indexicalité. Ainsi, 😊 représente, de façon iconique, un visage souriant, mais ce n’est pas tout : 😊 porte, en plus, une signification indexicale révélant l’état d’esprit du locuteur. Voici un exemple authentique (corpus SoSweet) :

(2) « Rolala, moi aussi je veux tout les cadeaux 😊 ! Avec un PC dedans svp. »

Ici, l’interprétation repose non seulement sur la reconnaissance de la ressemblance entre 😊 et un visage souriant, mais aussi sur l’établissement d’un lien indexical entre ce visage souriant et l’affect du locuteur. C’est une relation indexicale, car elle renvoie directement à la situation d’énonciation et, plus particulièrement, au locuteur. En d’autres termes, 😊 rend perceptible l’affect du locuteur qui porte sur la partie écrite de l’énoncé. Le processus interprétatif d’un tel pictogramme est donc plus complexe que dans le cas précédent. C’est parce que l’émoticône est une icône de visage souriant, et que ce visage souriant est habituellement l’index d’un affect positif, que le pictogramme est directement interprété comme l’index d’un affect positif. Il n’est toujours pas question d’interprétation reposant sur une relation symbolique ici, puisque 😊 ne renvoie pas à autre chose qu’à l’objet auquel il ressemble.

Troisième cas de figure : l’interprétation repose sur les trois potentialités de relation entre le signe et l’objet. C’est le cas, par exemple, de ❤️. En voici un exemple authentique (corpus SoSweet) :

(3) « @X j’ai reçu ta petite carte thanks ❤️ ».

L’interprétation d’un tel pictogramme repose sur les trois potentialités de relation entre les signe et l’objet. Le signe ❤️ est, premièrement, une icône. Ce signe ressemble en effet formellement à un objet, en l’occurrence un organe du corps humain. Cet organe est, lui, par une relation symbolique, associé à un affect : l’amour ou, plus généralement, l’affection. De par cette association symbolique, il est utilisé dans les messages comme un index, c’est-à-dire qu’il révèle l’émotion du locuteur dans la situation d’énonciation. L’interprétation du pictogramme ❤️ repose donc sur un processus sémiotique complexe faisant appel aux trois potentialités de relation entre le signe et l’objet.

Il ne sera nullement question, dans le présent article, des pictogrammes de la première catégorie, dont l’interprétation est uniquement iconique, comme 🚗. Parmi ces trois grandes catégories de pictogrammes, nous réserverons le terme émoticône à ceux des deux dernières catégories, car leur interprétation repose sur une relation indexicale à un ou plusieurs affects du locuteur. Ce terme, émoticône, sera employé pour désigner n’importe quel pictogramme qui indique un affect du locuteur, qu’il soit dessiné, comme 😊, ou constitué de caractères issus de la banque ASCII, comme :-)[8].

Enfin, ce classement repose sur une vision dynamique du processus sémiotique. Il est ainsi tout à fait envisageable que des pictogrammes de la première catégorie se chargent, dans tel ou tel contexte, d’indexicalité, ou même deviennent des symboles, passant alors dans la seconde ou la troisième catégorie décrite ci-dessus (c’est arrivé, déjà, à plusieurs reprises dans certaines communautés liées à plusieurs réseaux sociaux – voir, par exemple, le fameux cas du pictogramme d’aubergine sur Instagram[9]).

Récapitulons : les pictogrammes que nous étudions sont donc des icônes (de mimiques faciales, de gestes ou d’objets) qui servent d’index d’affect. Cette fonction d’indication des affects en fait des porteurs privilégiés de ce que l’on appelle, en linguistique, une « modalité ». Cette notion repose sur une conception bidimensionnelle du sens linguistique (voir, à ce sujet, les travaux fondateurs de Bally (1944) et ceux, abordés plus loin, de Gosselin (2010)). D’un côté, le locuteur dit quelque chose, de l’autre, il montre son positionnement subjectif concernant ce qu’il dit. Ce jugement du locuteur peut être marqué dans l’énoncé. Ainsi, dans (corpus SoSweet)

(4) « ouais mais jsuis pas sûre du tout de valider mon semestre ☹ »,

le pictogramme, indiquant l’affect du locuteur (en l’occurrence la tristesse), fait porter une modalité appréciative, négative, sur ce qui est dit (en l’occurrence qu’elle n’est « pas sûre de valider son semestre »). En produisant le pictogramme, le locuteur indique son affect, cet affect portant sur ce qui est dit. On peut dire que le locuteur modalise ce qu’il dit. Les pictogrammes qui indiquent des affects sont donc aussi des pictogrammes « modaux ». Ils servent à modaliser des contenus sémantiques.

Reste à savoir ce qui, dans la structure sémiotique de ces pictogrammes, est responsable de la signification indexicale des affects et par conséquent de leur caractère modal.

Iconicité, iconèmes et émoticônes

Les émoticônes sont donc fondamentalement des icônes, c’est-à-dire des signes qui ressemblent à des objets. Dans la perspective que nous avons choisie, c’est par la reconnaissance de cette iconicité fondamentale que le lecteur peut ensuite en faire un signe indexical, qui indique l’affect du locuteur. Si nous voulons comprendre comment les émoticônes indiquent des affects, il faut d’abord nous interroger sur le fonctionnement de l’iconicité. La question est la suivante : à quelles conditions peut-on reconnaître qu’un signe ressemble à un objet du monde? Sur cette question, de nombreux débats ont eu lieu, s’orientant sur un continuum allant du « tout conventionnel » (Greimas et Courtès, 1979) au « tout perceptif » (ce qui serait certainement la position de Peirce). Nous ne reviendrons pas sur ces débats. Nous adopterons ici une position intermédiaire, défendue par Vaillant (1999) et s’appuyant sur Eco (1978) (Figure 1). Produire ou interpréter un signe qui ressemble à un objet est un processus qui se déroule en trois étapes :

  1. abstraire des traits perceptifs bien précis de notre perception visuelle du monde;

  2. les organiser dans un modèle sémantique spatialisé;

  3. et les restituer sur une surface donnée.

Figure  1

Formation du modèle iconique (Eco, 1978, p. 312)

Formation du modèle iconique (Eco, 1978, p. 312)

-> Voir la liste des figures

Ainsi, si je veux reproduire un visage souriant, je dois, d’abord, sélectionner les traits qui me paraissent pertinents parmi l’ensemble des stimuli visuels – par exemple, lorsqu’il s’agit de reproduire une mimique faciale, les Occidentaux sélectionnent, parmi certains autres traits, la forme de la bouche (ceci constitue un premier niveau de convention puisque ma sélection est nécessairement culturellement déterminée). Ensuite, je dois positionner ces traits les uns par rapport aux autres dans un modèle sémantique spatialisé (la bouche doit être en dessous des yeux, le nez doit être au-dessus de la bouche, etc.). Enfin, je dois dessiner le résultat sur une surface (c’est un second niveau de convention puisque, là aussi, les normes de reproduction sont culturellement déterminées).

Cette conception a l’avantage de ne nier ni le rôle de la perception dans l’iconicité (pour sélectionner des traits perceptifs, encore faut-il percevoir les choses) ni celui de la convention (qui se situe à deux niveaux : celui de la sélection des traits perceptifs à reproduire et celui de la reproduction elle-même, par exemple sur une feuille de papier).

Dans cette perspective, un trait perceptif est conçu comme une véritable unité signifiante. Une émoticône est constituée d’unités iconiques minimales, correspondant à autant de traits perceptifs signifiants, sélectionnés conventionnellement. Nous appellerons ces unités iconiques minimales des « iconèmes ». Plusieurs iconèmes se combinent pour former un signe iconique. Ainsi, sur le même modèle que les phonèmes, morphèmes et autres sémèmes, l’iconème est la plus petite unité iconique qui, lorsqu’on la fait varier (par commutation, par exemple), fait varier le sens global du signe iconique[10]. Une émoticône, qu’elle soit dessinée, comme 😊, ou composée de signes issus de la banque ASCII, comme :-), peut être constituée d’un seul iconème, comme ❤️, ou de plusieurs iconèmes combinés : forme des yeux, forme du nez, forme de la bouche, couleur des joues, etc.

Iconèmes et signification modale de l’émoticône

Partant de là, nous pouvons donc tenter de caractériser plus précisément les iconèmes qui constituent les émoticônes. Nous en avons distingué trois types.

  • Les iconèmes positionnels : ces iconèmes ont pour fonction d’assurer la stabilité spatiale du signe iconique. Par exemple, l’iconème « forme du nez », dans une émoticône occidentale comme :-), a pour seul rôle d’assurer la cohésion du signe dans sa globalité. En effet, si on place l’iconème « forme du nez » ailleurs, l’émoticône devient difficilement interprétable. Un signe comme -):, par exemple, ne permet plus une saisie iconique pertinente, car sa spatialisation interne est rompue. Tous les iconèmes ont une fonction positionnelle, puisqu’ils s’interprètent en fonction de leur position par rapport aux autres iconèmes. Dans le cas de certains iconèmes, c’est leur fonction spécifique, comme c’est le cas pour « forme du nez ».

  • Les iconèmes « intensificateurs » : ces iconèmes ont pour seule fonction d’intensifier[11] l’affect signifié par l’émoticône. Par exemple, les larmes et les sourcils, représentés dans 😂, ont pour seule fonction d’intensifier l’affect signifié par l’émoticône. Leur suppression, comme dans 😄, n’entraîne aucun changement de signification : on reconnaît toujours une mimique faciale de rire. Seule l’intensité de l’affect exprimé par ce rire varie.

  • Les iconèmes « modaux » : ces iconèmes signifient directement l’affect du locuteur et sont, par là même, porteur de ce que l’on appelle en linguistique une « modalité », soit un jugement subjectif du locuteur sur ce qui est dit (nous détaillerons cette définition par la suite).

Quelques tests de substitutions suffisent pour mettre au jour cette signification modale liée à un ou plusieurs iconèmes. Comparons par exemple ces deux tweets (corpus SoSweet) :

(5) « ouais mais jsuis pas sûre du tout de valider mon semestre 🙁 »

(6) « ouais mais jsuis pas sûre du tout de valider mon semestre 😀 »

Un seul iconème est modifié entre (5) et (6) : « forme de la bouche ». Or la modalité diffère complètement : dans (5), le locuteur est triste de son incertitude, dans (6), le locuteur en est amusé. Aucun élément verbal ni aucun autre iconème ne varie. La fonction spécifique de ces iconèmes représentant la forme de la bouche est donc, dans le cas de ces émoticônes occidentales, de signifier une modalité. Ce sont des iconèmes « modaux ».

Les émoticônes relèvent soit d’un seul iconème modal, comme c’est le cas pour ❤️, soit de la combinaison de trois types d’iconèmes : positionnel, intensificateur et modal. Il est aussi possible qu’une émoticône comporte plusieurs iconèmes modaux, comme dans 😅, où la forme de la bouche et la goutte de sueur indiquent un affect complexe, à savoir de la joie mêlée de gêne. En tout cas, les modalités signifiées par les iconèmes modaux peuvent être de différents types, qui ont des effets conversationnels spécifiques. C’est ce que nous allons maintenant explorer.

Des modalités aux différents types de prise en charge énonciative

Iconèmes modaux et modalités

Précisons avant tout un peu plus ce que nous entendons ici par « modalité ». Nous nous plaçons dans le cadre théorique proposé par Gosselin (2010), s’inscrivant lui-même dans une tradition sémantico-pragmatique à l’origine des théories de l’énonciation, initiée par Bally (1944), et qui recoupe en partie les travaux de Ducrot (1980, 1985, 1993) et de ses successeurs (Rabatel, Perrin, Vion, etc.) :

L’esprit manipule des représentations (ces concepts étant pris dans leur sens usuel en sciences cognitives). Certaines de ces représentations mentales sont attachées à des signes linguistiques (en particulier aux lexèmes). Dans l’énoncé, ces représentations sont prédiquées, c’est-à-dire qu’elles sont attribuées à des entités (correspondant aux arguments des prédicats). […] Et c’est cette représentation prédiquée qui est validée (présentée comme valide) d’une certaine façon par l’énoncé : validation positive avec prise en charge énonciative […], ou refus de prise en charge […], invalidation […], validation subjective […], appréciative […], etc. (Gosselin, 2010, p. 53.)

En d’autres termes, la modalité a donc trait à l’expression de la subjectivité dans notre langage, qui comporterait deux parties interdépendantes : une partie « représentationnelle », ou encore « propositionnelle », correspondant à « ce qui est dit », et une partie « modale » indiquant la façon dont le sujet parlant (Ducrot, 1985) se positionne par rapport à cette représentation, correspondant à « ce qui est montré ». Ainsi, comme nous l’avons vu plus haut lors de la comparaison entre (5) et (6), je peux, à propos d’une même proposition, me positionner différemment. La proposition ne varie pas, mais l’attitude subjective que je fais porter dessus varie. C’est cette dernière variable que l’on appelle « modalité ».

Il existe différents types de modalités, traditionnellement organisés (depuis Bally) en trois grandes familles. D’abord, les modalités épistémiques ont trait à la croyance du sujet parlant quant à la vérité de la proposition énoncée; ensuite, les modalités appréciatives concernent les affects du sujet parlant; enfin, les modalités déontiques permettent au sujet parlant d’indiquer ce qu’il considère comme étant obligatoire ou interdit.

La plupart des émoticônes signifient une modalité appréciative en faisant varier l’iconème modal « forme de bouche » (et éventuellement « forme des yeux » pour ce qui concerne les emojis), dont les coins peuvent être relevés ou, au contraire, baissés. Par exemple 😊, 🙁 (ou les équivalents :) et :( ) signifient une modalité appréciative, la première indiquant que le sujet parlant trouve désirable ou apprécie l’état de fait que représente la proposition sur laquelle porte l’émoticône, la seconde, qu’il le trouve indésirable. Exemple :

(7) « je sèche et en plus ça me donne mal à la tête mdr :( »

Certaines émoticônes signifient une modalité épistémique, en indiquant notamment la surprise du locuteur portant sur une proposition énoncée dans le cotexte gauche :

(8) « Donc ça fait 14ans que le Cameroun n’a plus gagné de titre en football ? 😲😲 »

Dans (8), le locuteur indique grâce aux émoticônes qu’il ne peut pas croire que la proposition qu’il vient d’énoncer est vraie. Il s’agit bien ici d’une modalité épistémique.

Certaines émoticônes peuvent même signifier une modalité déontique, grâce à leur iconicité avec certains gestes : 🙅‍♂️, par exemple, est l’icône d’un homme produisant un « non » gestuel et peut être employée pour indiquer qu’une proposition est jugée « interdite ».

Modalité et prise en charge énonciative

L’expression des modalités a directement à voir avec le degré de prise en charge des énoncés par l’instance énonciative[12] qui les produit. Le terme de « prise en charge » désigne la responsabilité qu’engage le sujet parlant vis-à-vis de la véracité de ce qu’il dit :

Tout énoncé présuppose une instance qui prend en charge ce qui est appelé, suivant les cadres de référence, le dictum, la lexie, le contenu propositionnel, la prédication, selon le schème minimal d’énonciation « JE DIS (“ce qui est dit”) ». Au-delà des différences de dénomination, l’instance qui prend en charge un énoncé monologique est celle qui est à la source du processus de production de l’énoncé. Dans un énoncé tel que « je n’aime pas ces questions de prise en charge énonciative », je est la source et le valideur, c’est-à-dire celui qui entérine la vérité du contenu propositionnel. (Rabatel, 2009, p. 72.)

Tout le système modal, qui relève, comme nous l’avons vu précédemment, d’un jugement subjectif portant sur « ce qui est dit » (ce que Rabatel appelle, dans la citation ci-dessus, « dictum », « lexie » ou encore « contenu propositionnel ») par le sujet parlant, joue donc un rôle important dans la prise en charge énonciative. Ce système permet notamment au récepteur (lecteur/interlocuteur) de comprendre à quel point le locuteur d’un énoncé est engagé par rapport à la véracité de ce qu’il dit. Cette forme de prise en charge, liée à l’expression d’une modalité, peut relever d’un processus inférentiel plus ou moins implicite. S’il est évident que le producteur d’une assertion comme « Le chien est dans le jardin » prend en charge la vérité de la proposition assertée, c’est-à-dire qu’en énonçant cette assertion toute simple, il s’engage par rapport à la vérité de ce qu’il dit (ce qui est explicitement indiqué par le présent de l’indicatif en français), notre hypothèse est que l’expression des modalités peut moduler le degré de cet engagement. Ainsi, les verbes modaux, la tournure interrogative, l’emploi de certains modalisateurs sont susceptibles de modifier le degré de prise en charge d’une proposition énoncée. Comparons par exemple ce que nous comprenons des valeurs de vérité attribuées à la proposition énoncée dans les exemples suivants :

  • « Le chien est dans le jardin »;

  • « Je crois que le chien est dans le jardin » (modalité épistémique);

  • « Super! Le chien est dans le jardin » (modalité affective);

  • « J’interdis la sortie du chien dans le jardin » (modalité déontique).

Il est évident que la modalité épistémique, qui concerne directement le degré de « savoir » que possède le locuteur à propos de ce qu’il dit, a une influence sur son degré de prise en charge. Il nous semble qu’il est possible d’aller plus loin. La modalité affective peut aussi servir de support pour inférer un degré de prise en charge. Il s’agirait ici cependant d’une prise en charge calculée pragmatiquement et de façon implicite. Imaginons que quelqu’un prononce l’énoncé « Le chien est dans le jardin » avec une intonation de tristesse ou, au contraire, de joie, modalisant par là cette assertion. Cette modalité affective ne rendrait-elle pas l’engagement du locuteur, concernant la vérité de ce qu’il dit, beaucoup plus fort? En d’autres termes, exprimer une modalité affective portant sur une proposition énoncée, c’est s’engager fortement par rapport à la vérité de cette proposition, ou être le pire des manipulateurs. On considère intuitivement que si l’état de fait représenté par la proposition énoncée provoque, chez le sujet parlant, l’affect exprimé, c’est nécessairement, pour le récepteur, que cette proposition a plus de chances d’être vraie que fausse. Pour reprendre notre exemple, pleurer en disant que le chien est dans le jardin, alors que c’est faux, n’est pas socialement acceptable et serait considéré comme de la manipulation. Le rôle du pathos dans la rhétorique classique est fondé sur cette évidence : la confiance en ce qui est dit est plus forte si celui qui le dit exprime un affect à ce propos – peu importe qu’aujourd’hui, ce ressort soit tellement usé dans les discours publics que l’affect exprimé provoque méfiance plutôt qu’adhésion. L’expression d’une modalité affective pousse donc l’interlocuteur à considérer que le locuteur prend en charge la proposition énoncée.

Il en va de même, enfin, pour la modalité déontique. En effet, pourquoi interdire ou autoriser quelque chose dont le locuteur ne croit pas à la vérité, ou au moins à la possibilité de vérité? Vais-je interdire à mon fils de laisser sortir le chien dans le jardin si je ne crois pas fermement que j’ai un chien et un jardin dans lequel il puisse aller? L’expression des modalités a donc à voir avec la prise en charge énonciative. Elle modifie l’interprétation que l’on peut faire de l’engagement du locuteur concernant la vérité de ce qu’il dit.

Il est donc possible de concevoir – comme le propose Laurendeau (2009) en couplant les notions de prise en charge et de prise en compte – la prise en charge énonciative comme orientée sur un continuum, allant de la non prise en charge à la prise en charge forte. Les modalisateurs, dont les émoticônes font partie, jouent un rôle prépondérant dans l’organisation de ce continuum.

Différentes formes de prise en charge énonciative signifiées par les émoticônes

Nous avons identifié trois cas de figure dans lesquels les émoticônes permettent de moduler le degré de prise en charge d’une proposition énoncée. Nous les orientons sur un continuum polarisé, allant d’un pôle « non prise en charge » à un pôle « forte prise en charge ». En voici quelques exemples :

  • Non prise en charge (corpus SoSweet)

(9) « Donc ça fait 14ans que le Cameroun n’a plus gagné de titre en football ?😳😳 »

Les émoticônes présentes en (9) ainsi que le point d’interrogation expriment la surprise du locuteur. Cette surprise porte sur la proposition « ça fait 14 ans que le Cameroun n’a plus gagné de titre en football ». L’affect exprimé relève en fait d’une modalité épistémique. Il s’agit pour le locuteur de montrer qu’il est dans l’incapacité de s’engager quant à la vérité de la proposition qu’il énonce. Les modalisateurs indiquent donc à l’interlocuteur que le locuteur refuse de prendre en charge la proposition, qu’il est incapable de se positionner par rapport à sa vérité potentielle. Le rôle du point d’interrogation est justement, entre autres, de signifier à l’interlocuteur que le locuteur a besoin d’un positionnement extérieur (confirmation ou infirmation) concernant cette vérité.

  • Prise en charge jouée (corpus SoSweet)

(10) « En vrai quand je vais sur snapchat aux WC, à chaque fois je flippe, j’ai l’impression que qqn à pirater ma caméra frontale et me surveille 😂 »

L’émoticône fait ici porter une modalité affective sur le contenu propositionnel qui précède. Le locuteur indique que la proposition qu’il énonce le fait rire et déclenche un affect de joie. L’interlocuteur comprend donc que la prise en charge de la proposition énoncée par le locuteur n’est pas réelle, mais relève d’un jeu. Certes, le locuteur affirme bien qu’il a l’impression que quelqu’un le surveille à partir de la caméra de son téléphone, mais la vérité de cette affirmation doit être mise en question, car il s’agit manifestement d’une plaisanterie, ce qu’indique l’émoticône. Le locuteur fournit ici des indices d’une prise en charge (l’assertion au présent de l’indicatif en étant une marque forte), mais d’autres indices permettent de comprendre que cette prise en charge n’est que « jouée ». Le locuteur ne croit pas vraiment que la proposition « j’ai l’impression que qqn à pirater ma caméra frontale et me surveille » soit vraie.

  • Prise en charge forte (corpus SoSweet)

(11) « ouais mais jsuis pas sûre du tout de valider mon semestre 😧 »

L’émoticône porte ici une modalité affective, calculée à partir des iconèmes modaux constituant une représentation iconique d’un visage apeuré. Elle vient appuyer la prise en charge de la proposition énoncée dans « jsuis pas sûre du tout de valider mon semestre ». Si l’état de fait représenté par cette proposition déclenche un affect négatif, manifesté par l’émoticône, c’est nécessairement, pour l’interlocuteur, que le locuteur croit fermement que cette proposition est vraie. Son degré de prise en charge est donc renforcé par l’émoticône. Les émoticônes, puisqu’elles permettent au locuteur de se positionner par rapport à ce qui est dit et de le prendre en charge à des degrés divers, sont des outils importants sur le plan conversationnel. Elles permettent de mettre en place de véritables stratégies de cadrage modal qui influencent grandement les échanges.

De la prise en charge énonciative aux stratégies conversationnelles

Visée monologique/visée dialogique

La plupart des théories de la prise en charge énonciative traitent ce phénomène comme étant fondamentalement monologique (Coltier, Dendale et De Brabenter, 2009). Nous pensons qu’il est tout à fait possible de parler de prise en charge dialogique. Nous distinguons bien, ici, l’opposition monologal/dialogal, qui ne concerne que le nombre de tours de paroles et l’alternance de leurs producteurs, de l’opposition monologique/dialogique, qui concerne la modalisation d’une proposition énoncée par le locuteur (monologique) ou la modalisation d’une proposition énoncée par l’interlocuteur (dialogique). Cette dichotomie reprend la typologie bakhtinienne telle qu’elle est employée, par exemple, par Bres (1999) et Bres et Nowakowska (2006) :

(a) J’appellerai dialogique un énoncé (ou fragment d’énoncé) dans lequel la modalisation de E1 s’applique à un dictum présenté comme ayant déjà statut d’énoncé (soit e), c’est-à-dire ayant fait l’objet d’une modalisation par un autre énonciateur, que je désigne par e1 (Bres, 1999, p. 72).

(b) Nous posons que l’énoncé dialogique se distingue de l’énoncé monologique de la façon suivante : dans l’énoncé monologique l’actualisation déictique et modale porte sur un dictum : dans l’énoncé dialogique, cette opération s’effectue non sur un dictum, mais sur (ce qui est présenté comme) un énoncé déjà actualisé (Bres et Nowakowska, 2006, p. 29).

Dans les exemples que nous avons vus jusqu’alors, les émoticônes sont employées de façon monologique. Elles modalisent des énoncés produits par le locuteur et jouent donc un rôle dans une prise en charge monologique. Or dans les conversations, sur Twitter ou dans les t’chats, on trouve très fréquemment des émoticônes employées de façon dialogique, qui servent à indiquer une prise en charge d’une proposition énoncée par l’interlocuteur. Exemple d’une conversation tenue sur un salon de t’chat (les utilisateurs parlent d’une partie de poker) (corpus de thèse) :

(12) [14:54] <%ondes-virtuelles> alors t as gagné ?

[14:54] <%ondes-virtuelles> :p

[14:55] <%Spinelli> pfff m’en parles pas

[14:58] <%ondes-virtuelles> :o

[14:58] <%ondes-virtuelles> t’as perdu combien ?

[14:59] <%ondes-virtuelles> épanche-toi mon petit

L’émoticône :o, représentant iconiquement un visage dont la bouche est arrondie par la surprise, porte ici sur l’énoncé produit par l’utilisateur « Spinelli », et non sur celui du locuteur « ondes-virtuelles ». La modalité épistémique portée par cette émoticône s’applique donc à une proposition qui n’est pas celle qu’énonce le locuteur, mais bien l’interlocuteur. C’est donc une émoticône dialogique. Elle modalise un contenu déjà modalisé par l’interlocuteur. Cette caractéristique des émoticônes est fondamentale dans l’établissement d’une stratégie de prise en charge énonciative qui permet, sur le plan de la conversation, d’orienter les échanges selon trois grands types de stratégies conversationnelles que nous allons maintenant aborder.

Demande d’explicitation

Nous entendons par « stratégie conversationnelle » la visée d’un locuteur quant au résultat d’une de ses interventions au sein d’un échange. Ainsi, un locuteur peut orienter son intervention dans le but d’obtenir une explicitation par rapport à ce qu’il n’a pas compris. Nous parlons alors d’une stratégie conversationnelle de demande d’explicitation. Les émoticônes de surprise dialogiques, signifiant une modalité épistémique portant sur une proposition énoncée par l’interlocuteur, indiquent que le locuteur ne peut pas prendre en charge l’énoncé produit par l’interlocuteur. Ceci débouche le plus souvent sur une explicitation. Voici la suite de l’exemple (11) (corpus de thèse) :

(12) [14:54] <%ondes-virtuelles> alors t as gagné ?

[14:54] <%ondes-virtuelles> :p

[14:55] <%Spinelli> pfff m’en parles pas

[14:58] <%ondes-virtuelles> :o

[14:58] <%ondes-virtuelles> t’as perdu combien ?

[14:59] <%ondes-virtuelles> épanche-toi mon petit

[14:59] <%Spinelli> bah je dois en être à -100$

[14:59] <%ondes-virtuelles> ah ça va encore

[14:59] <%ondes-virtuelles> je pensais que ça se chiffrait en milliers

[14:59] <%Spinelli> mais bon c’est que des gains que j’ai perdu :)

Ici, l’utilisateur « ondes-virtuelles » fait suivre son émoticône de surprise d’une demande explicite d’explicitation, ce à quoi « Spinelli » répond en indiquant les données qui manquaient à « ondes-virtuelles » pour comprendre la production de « pff m’en parles pas ». En voici un autre exemple, dans lequel l’émoticône de surprise est là aussi suivie d’une demande d’explicitation verbalisée (corpus de thèse) :

(13) [15:14] <MeeYung> ondes-virtuelles : ce qu’il me reste à faire : faire des analyses plus poussées ...

[15:14] <%ondes-virtuelles> MeeYung oui

[15:14] <%ondes-virtuelles> echographie ?

[15:14] <MeeYung> Oo

[15:14] <MeeYung> comment ça ?

[15:14] <%ondes-virtuelles> bin echographie hépatique

[15:15] <MeeYung> ah

L’émoticône de surprise Oo, représentant deux yeux, dont l’un est agrandi par la surprise (il s’agit ici d’une émoticône « orientale » se lisant de face (Halté, 2018)), indique là encore que l’utilisateur « MeeYung » ne peut pas prendre en charge ce qu’énonce « ondes-virtuelles ». Cette émoticône est employée dans le cadre d’une stratégie de demande d’explicitation (tout à fait explicite grâce notamment au « comment ça ? ») qui aboutit, puisque « ondes-virtuelles » finit par expliciter ce qu’il entendait par « échographie ».

Sympathie/antipathie et accord/désaccord

Les émoticônes portant une modalité affective sont souvent employées de façon dialogique pour montrer son empathie ou sa sympathie à l’interlocuteur. Ce faisant, le locuteur prend en charge l’énoncé produit par l’interlocuteur. La manifestation d’empathie ou de sympathie a donc un effet conversationnel direct, qui est de manifester à l’interlocuteur l’adhésion à la vérité de ce qu’il dit. Ce processus est le fondement d’une stratégie conversationnelle d’accord entre les utilisateurs. En voici un exemple tiré d’un corpus de formation en ligne par t’chat (corpus Cergy-Pontoise) :

(14) [19:10:39] FORMATEUR : Un autre point qu ej evaux évoquer rapidement pour commencer

[19:10:51] FORMATEUR : Notre rituel de communication en tchat 

[19:11:14] FORMATEUR : Jevois que vous avez l’habitude d’envoyer u nretour à chaque demande

[19:11:19] FORMATEUR : je vous en remercie 

[19:11:25] FORMATEUR : même un simple ok :)

[19:11:26] E1 : :)

[19:11:34] E2 : ok ;)

[19:11:35] E3 : ok :)

Ici, l’émoticône :) produite par E1 indique l’empathie du locuteur : il s’agit de modaliser l’énoncé produit par l’interlocuteur de la même façon que ce dernier (modalité appréciative). Ce faisant, en utilisant uniquement une émoticône, E1 indique directement son accord avec le formateur.

À l’inverse, les manifestations d’antipathie (au sens strict du terme, c’est-à-dire d’une dysphorie entre l’affect du locuteur et celui de l’interlocuteur) peuvent naturellement servir une stratégie conversationnelle de désaccord (corpus SoSweet) :

(15) <Utilisateur 1> : Ducoup j’me sens mal d’avoir lâché un like :( Promis c’est juste parce que ça te va bien.

<Utilisateur 2> :D mais non faut pas t’inquiète c’était pour deconner xx

Ici, « Utilisateur 1 » modalise son énoncé grâce à l’émoticône :(. Elle signifie une modalité affective négative qui s’applique à la proposition qui précède. « Utilisateur 2 » modalise cette même proposition, mais dans le sens inverse. S’il s’agit toujours, avec :D, d’indiquer une modalité affective, elle repose cette fois sur un affect positif. Le fait d’exprimer des affects dysphoriques au sujet de la même proposition, énoncée par « Utilisateur 1 », sert de support à la stratégie de désaccord verbalisée ensuite par « Utilisateur 2 » par l’emploi de la formule « mais non ». On peut gloser cette réaction par : « la proposition que tu as modalisée négativement est fausse, il s’agissait en fait d’une plaisanterie ». L’emploi d’une émoticône dialogique signifiant une modalité opposée à celle de l’interlocuteur est ici un outil pour établir une stratégie conversationnelle de désaccord.

Conclusion

Les pictogrammes faisant partie des énoncés écrits dans les communications numériques peuvent être divisés en deux grandes catégories sémiotiques : ceux qui servent de pure icône, et qui représentent simplement des objets, et ceux qui, en plus de cette fonction, servent à indiquer l’affect du locuteur. La reconnaissance d’un affect est possible grâce à un système de composition iconique mettant en jeu des unités iconiques de signification minimale, que nous avons nommées « iconèmes ». Parmi eux, ceux qui nous intéressent particulièrement sont les iconèmes modaux. Ceux-ci permettent de signifier, à partir de leur reconnaissance comme indice d’affect, une modalité qui peut être affective, épistémique, ou encore déontique. Les émoticônes rentrent donc dans le calcul de la modalité et contribuent à paramétrer un système modal conversationnel. En effet, elles permettent aux utilisateurs de prendre en charge, plus ou moins implicitement et plus ou moins fortement, les propositions qu’ils énoncent. Cette caractéristique des émoticônes ouvre sur des stratégies conversationnelles diverses : accord, désaccord, demande d’explicitation, etc. Nous n’avons pas décrit toutes les stratégies possibles ni toutes les émoticônes susceptibles de les déclencher. Ce travail reste à faire. Ces premières observations peuvent aussi conduire à des études concernant les interactions entre les modalités véhiculées par les émoticônes et celles véhiculées par les composantes verbales des énoncés, afin de caractériser très précisément les cadres modaux qui structurent les conversations en ligne.