Corps de l’article

Le présent article fait état d’un ensemble des propriétés transformationnelles unaires que nous avons choisi de prendre en compte pour le codage des prédicats dans un dictionnaire électronique conçu principalement pour la traduction automatique espagnol-français (Blanco 2001). Afin de ne pas alourdir notre présentation, nous illustrerons les propriétés retenues tantôt avec des exemples en français, tantôt en espagnol, en signalant les éventuelles divergences entre les deux langues.

Ce travail a un caractère éminemment métalexicographique et appliqué. Il ne contient pas de nouveautés théoriques puisque toutes les transformations présentées sont bien connues. Son but est de fournir à un linguiste informaticien travaillant en contexte multilingue une première vue d’ensemble de ce pan de la description linguistique.

Nos observations et nos exemples s’inspirent, d’une part, des travaux de Harris (1964/1981, 1965/1981) et du lexique-grammaire (Boons, Guillet et al. 1976 ; Gross 1975 ; Guillet et Leclère 1992 ; Leclère 1990, entre autres) et, d’autre part, de la théorie Sens-Texte (Mel’čuk 1992 ; 1993). Soulignons que les recherches et l’enseignement de Gaston Gross ont eu une influence décisive sur notre façon de comprendre la linguistique et d’intégrer les apports de différents courants de pensée. Cet article lui doit donc beaucoup. Bien entendu, nous rendons hommage également à l’enseignement et à la personnalité d’André Clas, auquel cet article est dédié.

Notons que cette présentation, nécessairement très schématique, exclut d’emblée des questions importantes comme l’application successive de plusieurs transformations et, en conséquence, l’ordre et les contraintes qui existent dans leur combinatoire. Il va sans dire que, pour tenir compte de ces questions, il faut se doter au préalable d’une liste opérationnelle de transformations. Nous espérons que cet article puisse contribuer en partie à cela.

1. Concepts de base

La discussion sur les propriétés transformationnelles que nous allons entamer exige le recours systématique à quelques concepts-définitions de base[1] (que nous présentons en italique) :

  1. Les propriétés transformationnelles sont formulées par rapport à des prédicats. Les transformations unaires ne concernent qu’un prédicat. Les transformations binaires concernent deux prédicats (et, par extension, plus de deux) ;

  2. Un prédicat a des actants sémantiques, des actants syntaxiques profonds et des actants syntaxiques de surface ;

  3. Un actant sémantique d’un prédicat est un argument, au sens logique, dudit prédicat[2]. Il correspond à une variable dans la représentation sémantique du prédicat. Il est représenté par les symboles I, II, III, IV… La représentation correspondant aux actants sémantiques d’un prédicat est le schéma d’arguments, par exemple, apprivoiser (Nhumain, Nanimal), planter (Nhumain, Nvégétal)… Les actants représentés dans un schéma d’arguments sont étiquetés moyennant des traits syntactico-sémantiques (par exemple, humain, abstrait…) et des classes d’objets (par exemple, <vêtements>, <crimes>…) (Gross 1994 ; Le Pesant et Mathieu-Colas 1998) ;

  4. Un actant syntaxique profond d’un prédicat est un syntagme qui exprime au niveau syntaxique profond un des actants sémantiques du prédicat. Il est représenté par les symboles N0, N1, N2, N3… Ces actants présentent les propriétés classiques que l’on reconnaît au sujet, à l’objet direct, à l’objet indirect… Ainsi, le N0 régit l’accord verbal, le N1 devient le sujet de la voix passive, etc. La représentation non marquée correspondant aux actants syntaxiques profonds est la structure de base, par exemple, N0 V / N0 V N1 / N0 V Prép N1… ;

  5. Un actant syntaxique de surface est un syntagme représenté par des mots-formes effectivement produits dans une phrase donnée et soumis à linéarisation (donc avec un ordre fixé dans la phrase), par exemple, N1 Vpassif Prép N0 (La lettre a été écrite par Luc) ;

  6. Une phrase canonique est une phrase où il y a une symétrie parfaite entre actants sémantiques, actants syntaxiques profonds et actants syntaxiques de surface, par exemple, Luc donne une pomme à Max ;

  7. Une phrase transformée est une phrase où cette symétrie n’est pas respectée, que ce soit au niveau des actants syntaxiques profonds (Une pomme a été donnée à Max par Luc) ou au niveau syntaxique de surface (à Max, Luc a donné une pomme ; Luc, il donne une pomme à Max) ;

  8. La non-symétrie d’une phrase transformée par rapport à une phrase canonique est due principalement à :

    • Un changement d’ordre dans la linéarisation de la phrase (permutation d’actants) ;

    • La modification de la forme d’un actant (par exemple, par pronominalisation, par effacement…) ;

    • La modification de la forme d’un prédicat (par exemple, par coordination, par ajout de modalité) ;

    • L’insertion d’un nouvel actant ou d’un élément qui prend la place, en surface, d’un actant.

  9. Une entrée de dictionnaire électronique comporte des informations sur la structure de base associée à un prédicat. À partir de cette structure de base, il est possible de générer une phrase canonique en appliquant des règles générales. Par contre, la génération des phrases transformées ne peut pas être prise en charge par de telles règles. Des champs spécifiques du dictionnaire doivent être prévus afin de rendre compte de la possibilité / impossibilité, pour un prédicat donné, d’apparaître dans tel type de phrase transformée. Une discussion sur les propriétés transformationnelles est, dans ce sens, une discussion sur des catégories de microstructure d’un dictionnaire électronique et sur leurs valeurs.

Comme il a été signalé ci-dessus, nous partons de la base que l’on dispose de dictionnaires électroniques qui contiennent une grande quantité de prédicats accompagnés de leurs schémas d’arguments caractéristiques. Les schémas d’arguments représentent les actants sémantiques d’un prédicat. Ces schémas sont généralisés, c’est-à-dire que les arguments sont étiquetés moyennant des outils de représentation distributionnelle comme les traits syntactico-sémantiques (humain, inanimé, concret, abstrait…) et les classes d’objets et de prédicats (<vêtements>, <nourritures>, <délits>, <étendues d’eau>…).

Nous avons donc, d’une part, un schéma d’arguments généralisé correspondant à une phrase élémentaire et représentant les actants sémantiques, par exemple :

et, d’autre part, une structure de base pour ledit schéma représentant les actants syntaxiques profonds du prédicat décrit :

Si nous maintenons la symétrie entre ces actants syntaxiques profonds et les actants syntaxiques de surface, qui en donnent la linéarisation, nous pouvons considérer que le système est capable de générer un ensemble de suites grammaticales possibles en base à des consultations de dictionnaires. Cela implique encore l’instantiation de Nhum et de Ninc <nourritures> à des unités lexicales et l’actualisation du schéma moyennant la conjugaison, la flexion et la détermination :

On dispose ainsi d’une série de phrases canoniques. Or, il est clair que l’ensemble ainsi généré est loin de couvrir la totalité des phrases grammaticales observables[3] (par exemple, C’est du riz que Luc mange).

Le problème est double. D’une part, il existe un ensemble de suites observables qui ne correspondent pas aux structures de base et dont il faut faire l’inventaire (par exemple, À cette question correspond cette réponse). D’autre part, bien que ces structures soient formalisables (N0 V Prép N1 = Prép N1 V N0) elles ne sont pas pour autant généralisables. Ainsi, nous avons N0 V Prép N1 (Luc pense à Max), mais *À Max pense Luc. Cette deuxième question est cruciale en traitement automatique des langues où bien évidemment, il ne suffit pas de décrire formellement une propriété, il faut aussi en donner l’extension exacte.

Notre but pourrait être alors reformulé comme suit : quelles sont les propriétés linguistiques d’un prédicat donné qu’il faut coder dans un dictionnaire électronique pour prévoir des linéarisations autres que celle qui est considérée comme canonique pour ce prédicat ? Nous appellerons ces propriétés des propriétés transformationnelles, dans la mesure où il s’agit de propriétés combinatoires de l’unité lexicale qui ne peuvent pas être codées dans la zone strictement distributionnelle de l’article lexicographique[4].

Étant donné que nous nous occupons de l’élaboration de dictionnaires, nous souhaiterions formuler ces questions sous forme d’un cahier de charges ou d’un mode d’emploi pour le codage de propriétés transformationnelles dans un dictionnaire électronique. Cet article se veut une première ébauche d’un tel travail.

2. En amont des propriétés transformationnelles

La structure de base associée à un prédicat donné peut présenter des alternances. Dans la mesure où deux structures de base ne sont pas possibles simultanément, on est en présence de plus d’une chaîne graphique et, en conséquence, d’une relation entre des chaînes, sans qu’il semble pour autant justifié de parler de transformation.

2.1. Alternances de traits syntactico-sémantiques pour une position argumentale

Certains prédicats admettent de modifier, par métonymie, le trait syntactico-sémantique de certains arguments. Ainsi, on a un changement de locatif à humain collectif dans :

Ces cas sont, pour l’instant, marqués par disjonction de traits dans les schémas d’arguments des prédicats concernés. Des généralisations intéressantes pourraient éventuellement en faciliter le codage (Le Pesant 2000).

2.2. Alternances de prépositions

La préposition marqueur d’argument peut avoir des variantes possibles ou être optionnelle :

Il suffit, pour ces cas, de marquer la disjonction de préposition au sein de la structure de base. Il va sans dire que cette alternance ne doit être confondue ni avec les cas de prépositions différentes pour des verbes homonymes,

ni avec l’alternance d’une préposition introduisant un complément locatif, qui correspond à l’application de la fonction lexicale Loc (Mel’čuk 1996) :

2.3. Interprétations non agentives

Certains prédicats admettent une double interprétation agentive/non agentive du N0[5] :

L’adverbe est, en fait, pléonastique par rapport à une des interprétations, mais il la sélectionne de façon non ambiguë. Il est possible que l’existence d’un N2 permette de sélectionner une des interprétations : Luc asusta a Max con esos gritos est, en géneral, interprété comme non agentif. Notons, en plus, que la passive Max fue asustado por Luc, qui tend à sélectionner l’interprétation agentive, n’accepte pas le N2 : *Max fue asustado por Luc con esos gritos.

2.4. Diathèses spéciales

Dans la plupart des cas, il existe une symétrie possible entre les actants sémantiques et les actants syntaxiques profonds du prédicat. Notons, cependant, des cas comme plaire, où nous avons le schéma d’arguments plaire (Nhum, Nnr) et des phrases canoniques comme Ce film plaît à Luc, où N0 = II (deuxième actant sémantique) et N1 = I (premier actant sémantique). C’est le cas aussi de l’espagnol gustar[6]. Ces prédicats présentent une sorte de non-canonicité foncière. Ainsi, Luc pense à Max est une phrase canonique alors que Ce film plaît à Luc n’en est pas une, car la symétrie entre actants sémantiques et syntaxiques est écartée d’emblée.

Certains auteurs parlent aussi de diathèse spéciale pour faire référence à des phénomènes comme la présence obligatoire d’un adverbe :

ou la négation obligatoire :

Dans ce cas, il n’y a qu’une suite canonique possible. Dans d’autres cas, comme les adverbes à polarité, on peut en avoir deux :

Nous ne pensons pas que ces derniers cas concernent la diathèse, étant donné que celle-ci ne touche que la relation entre actants sémantiques et actants syntaxiques profonds. Nous préférons donc traiter ces cas comme des verbes composés. Ainsi, par exemple, encontrarse bien (se porter bien) est dans le dictionnaire des verbes composés de la classe CADV (complément adverbial obligatoire) et no caber duda de Qu- dans la classe à négation obligatoire (Gross 1982). Évidemment, il reste à rendre compte des variations paradigmatiques (Luc se porte comme un charme). Nous pensons qu’il s’agit là de la présence obligatoire de la fonction lexicale Bon appliquée au prédicat. Pour sentir, nous aurions obligatoirement soit Bon, soit AntiBon, avec effacement approprié possible pour AntiBon, mais pas pour Bon.

3. Transformations unaires

Rappelons que les transformations unaires sont celles qui s’appliquent à un seul prédicat.

3.1. Insertion de déterminants nominaux

L’actualisation peut comporter l’insertion de déterminants nominaux. Du point de vue du traitement automatique, il est important que ces noms soient analysés comme déterminants et aucunement comme têtes sémantiques du syntagme, sous peine de ne pas reconnaître le schéma d’arguments existant dans la phrase. En tant que déterminants, ces noms concernent la quantification, la notion d’ensemble et d’élément et aussi, quand ils sont associés à des noms prédicatifs, l’intensité et certaines données aspectuelles (fréquentatif, itératif…) :

À notre avis, nous avons le même phénomène dans :

même si dans ce cas on pourrait penser que engraisser s’applique en fait à un locatif. En tout cas, le fait d’élargir à ces cas l’approche par déterminants nominaux permet de simplifier beaucoup la description lexicographique (Blanco 2002).

3.2. Insertion de partie appropriée

L’insertion d’un N dans une position argumentale donnée peut correspondre aussi à une relation méronymique / holonymique :

La partie appropriée peut aussi être insérée comme N2 :

Au sens large, on pourrait classer sous cette rubrique des relations comme :

La notion de partie appropriée peut concerner aussi des ensembles fonctionnels, surtout en position de N0 :

Dans la pratique, nous avons traité provisoirement ce dernier problème en déclarant des sous-classes de noms humains correspondant à des moyens de transport, des institutions, etc.

Notons que les parties inaliénables sont appropriées mais que les parties appropriées ne sont pas nécessairement inaliénables. Ainsi les bras de Luc sont nécessairement Luc, mais le conducteur de la voiture n’est pas la voiture. Celle-ci a, par ailleurs, une syntaxe d’inanimé concret comme Banque de France a une syntaxe de locatif (Max a nettoyé le bras de Luc = Max a nettoyé Luc ; Max a nettoyé la voiture de Luc ≠ Max a nettoyé Luc).

Il existe toutefois des prédicats dont les contraintes de sélection exigent une partie du corps et excluent un humain (par exemple, amputer). Ainsi, la relation :

est, à notre avis, une fausse relation. Il y a deux unités lexicales sous couper : l’une est synonyme de amputer, l’autre non. Ainsi, Luc s’est coupé à un bras (Luc s’est coupé, par effacement de Prép N1pc) s’oppose sémantiquement à Luc s’est coupé un bras. Observons que, une fois que Luc s’est coupé un bras, il ne peut plus se couper au bras. En tout cas, il peut couper ce bras. Autrement dit, cet inanimé concret n’est plus une partie du corps et n’a donc plus une syntaxe de partie inaliénable. Remarquons aussi que l’ajout du N1 = Npc n’implique pas la disparition du se coréférent au N0 : Luc s’est coupé lui-même au bras. Mais si le bras n’est pas à lui : *Luc s’est coupé Max au bras ; Luc a coupé Max au bras.

3.3. Insertion d’un argument

Dans le dictionnaire, nous suivons le principe d’extension maximale des schémas d’arguments. Tout prédicat est décrit avec le nombre maximal de ses actants sémantiques, indépendamment de leur concrétion syntaxique et bien évidemment, du fait qu’il est effaçable ou pas. Après tout, le fait de marquer un argument donné comme effaçable implique de l’avoir reconnu préalablement comme tel (voir la section 3.5).

Cependant, il y a des arguments tellement pléonastiques qu’il semble plus raisonnable de les considérer comme des insertions possibles. Il s’agit notamment des objets internes :

Les objets internes peuvent être aussi des N2 :

Nous trouvons aussi des réflexifs pléonastiques par rapport au N0 :

et par rapport au N1 :

3.4. Pronominalisations

Nous donnons différents types de pronominalisations sans commentaires, dans la mesure où elles sont bien connues et relativement faciles à représenter :

Notons aussi la pronominalisation contrastive (avec intonation intensive) :

3.5. Effacement d’un argument

Un argument peut être effacé si le contexte le fait redondant (par exemple, en parlant d’un gâteau dans une recette) :

Un argument peut être effacé en motivant une lecture du verbe comme propriété caractéristique du N0 (emploi absolu) :

Remarquons que, si l’on applique la négation, la lecture de propriété caractéristique est accentuée. Ainsi, ce chien ne mord pas ne veut pas dire qu’il soit incapable de mordre (des aliments, par exemple), mais qu’il n’agresse pas. Ce couteau ne coupe pas n’implique pas qu’on ne soit pas en train de couper quelque chose avec le couteau en question, mais qu’il n’est pas suffisamment aiguisé. Nous sommes plutôt partisans de traiter ces emplois des formes mordre et couper comme des unités lexicales à part dans la mesure où elles sont sémantiquement proches des adjectifs.

Évidemment, nous avons des cas douteux comme :

Le fait qu’on ait :

fait qu’on hésite à traiter N0choquer comme un effacement de N0 choquer Nhum ou comme une autre unité lexicale (bien qu’intimement liée à la précédente). Pour l’instant, nous penchons pour la première option à cause du nombre élevé de verbes ayant un tel comportement.

Un argument peut aussi être tout simplement effacé avec perte de l’information correspondante :

À ce moment-là, une des interprétations possibles est l’interprétation d’argument généralisé (Luc mange des aliments). Mais d’autres possibilités sont à considérer : Luc mange beaucoup, Luc mange bien, Luc a un bon coup de fourchette, Luc est en train de prendre son repas (par exemple, Luc est allé manger sera en général interprété comme Luc prend son repas, et difficilement comme Luc est allé manger un chocolat).

En conséquence, le fait d’indiquer le caractère sous-spécifiable d’un argument devrait s’accompagner de l’interprétation possible de cette sous-spécification, par exemple, Luc conduit = Luc est en train de conduire (une voiture) ou Luc a son permis. En effet, on peut avoir Luc n’a pas son permis mais il conduit tandis que ?Luc n’a pas son permis et il conduit, ce qui est une preuve a contrario que l’interprétation ‘avoir son permis’ est parfaitement possible. Cette précision est indispensable pour qu’un système ait la capacité de reconstruire un schéma d’arguments pertinent. Une piste possible pour optimiser la notation de cette propriété serait de la mettre en rapport avec les noms d’agent possibles (Luc conduit = Luc est un conducteur)[11].

Les N2 et N3 (de distance, d’instrument, d’origine, de destination…) peuvent aussi être effacés :

On a certains N4 (de somme d’argent, de lieu de passage…) qui seraient aussi effaçables (et même facilement effaçables) :

3.6. Permutations d’arguments

Certaines transformations préservent le nombre d’arguments mais en changent la linéarisation. Ces transformations se différencient des changements de diathèse (voir section 3.7.) en ce qu’elles ne concernent que les actants syntaxiques de surface.

3.6.1. Permutations proprement dites

Nous avons ainsi, des permutations N1 – N2 :

Cette permutation s’explique souvent par des raisons stylistiques, par exemple quand le N1 est nettement plus long que le N2 :

La permutation peut aussi concerner l’attribut, une relation dite équative[12] :

ou le N0 V dans certaines complétives :

Nous avons ensuite les permutations de Prép N1 ou de Prép N2 par rapport au N0 :

3.6.2. Détachements

Les détachements (appelés parfois aussi dislocations) du N0 ou du N1 impliquent une pronominalisation, une prosodie particulière (pause ou accent d’intensité) ou une permutation V N0 :

3.6.3. Extrapositions

Nous trouvons aussi des extrapositions en il ou il y a. Les extrapositions impliquent l’apparition d’un argument supplémentaire, quoique sémantiquement vide :

3.6.4. Extractions

Les extractions en c’est qui/que sont possibles pour n’importe quel argument (N0, N1, Prép N1…) et semblent accentuer le caractère contrastif de la permutation. On dirait que l’argument supplémentaire hésite à apparaître comme actant syntaxique profond (l’accord avec le V est hésitant).

3.7. Changements de diathèse

Les différents types de permutations supposent des changements d’ordre des actants syntaxiques de surface par rapport à des actants syntaxiques profonds. Cet alinéa, par contre, concerne les changements de diathèse, c’est-à-dire le changement d’ordre des actants syntaxiques profonds par rapport aux actants sémantiques d’un prédicat donné.

3.7.1. Les passifs

3.7.1.1. La passive pleine

Le deuxième actant sémantique peut occuper la position de premier actant syntaxique profond :

3.7.1.2. La passive indirecte

En anglais, nous avons la passive indirecte où le N2 passe à N0. Dans le dictionnaire espagnol-français, nous n’avons codé aucun cas.

3.7.1.3. Le réfléchi

L’identification des premier et deuxième actants syntaxiques profonds constitue aussi un changement de diathèse :

3.7.1.4. La passive impersonnelle

Dans la passive impersonnelle, le premier actant syntaxique profond est supprimé. L’accord se fait alors avec le deuxième actant :

Cette construction est parfois appelée (à notre avis improprement) ergative. Le déplacement du N1 vers la gauche donne la suite (appelée parfois semoyen[13]) :

Notons aussi :

En français, nous avons les pronoms on, il.

La pronominalisation par il s’applique parfois aussi à la structure de base N0 V Prép N1 :

3.7.2. Les restructurations

Nous avons tendance à voir, dans les restructurations, une homonymie de deux unités lexicales à diathèses converses (comme acheter et vendre). En effet, d’abord, il n’y a pas ici de paradigme verbal passif ou moyen. Ensuite, les prépositions marqueurs d’arguments peuvent changer de façon imprévisible (surtout dans les restructurations de type N1 – Prép N2). Finalement, ce phénomène est clairement moins important, du point de vue quantitatif, que les passifs. Tout cela fait qu’il est beaucoup plus commode d’avoir tout simplement une autre entrée de dictionnaire pour chaque forme restructurée, avec la linéarisation correspondante et l’indication de l’unité lexicale converse dans la zone de combinatoire lexicale restreinte (fonction lexicale Conv).

3.7.2.1. Restructurations N0 – (Prép) N1

Nous avons, d’abord, des restructurations avec permutation des premier et deuxième actants syntaxiques profonds (et des changements de Prép) :

3.7.2.2. Restructurations N0 – Prép N2

Nous trouvons aussi des cas où c’est le troisième actant sémantique qui passe à premier actant syntaxique profond (avec suppression du premier actant sémantique) :

3.7.2.3. Restructurations (Prép) N1 – Prép N2

Nous avons aussi une permutation des deuxième et troisième actants syntaxiques profonds, accompagnée de changements de Prép :

3.8. Les variantes syntaxiques des verbes support[16]

Nous nous sommes centré jusqu’à présent sur les propriétés des phrases axées sur un prédicat verbal. Il ne faut cependant pas oublier les prédicats adjectivaux et nominaux. Par exemple, l’extraposition est possible pour les adjectifs :

Quand le nom est le noyau prédicatif d’une phrase, il est accompagné d’un verbe support. Dans la structure moins marquée, le nom prédicatif occupe la position de N1 et ses actants sémantiques les positions de N0 et N2 (par exemple, la première phrase de l’exemple 67). Mais le verbe support peut avoir des variantes à diathèse différente[17] (comme la deuxième phrase de l’exemple 67) :

Cela nous met devant tout un système de paraphrases. En adoptant le système de fonctions lexicales proposé par Igor Mel’čuk (1992), nous aurons, entre autres relations possibles :

Bien évidemment, nous ne présentons que les paraphrases les plus fréquentes pour les langues considérées. D’autres paraphrases, bien que plus rares, sont théoriquement possibles.

4. Conclusion

Nous avons présenté un inventaire de propriétés transformationnelles unaires organisé de telle façon qu’il puisse être mis à profit pour l’élaboration de dictionnaires électroniques espagnol-français. Toutefois, d’autres propriétés seraient encore à envisager. Parmi les propriétés que nous souhaiterions replacer à l’intérieur du panorama ci-dessus, nous pourrions citer entre autres des relations comme Luc agrippe la branche vs Luc s’agrippe à la branche ou celle qui est mise en relief par l’exemple allemand über sein Benehmen urteilen vs sein Benehmen (accusatif) beurteilen. Par ailleurs, un deuxième article, organisé d’après les mêmes principes que celui-ci, sera consacré aux propriétés transformationnelles binaires.