Polysémie logique

De Sémanticlopédie
Aller à : navigation, rechercher


par Evelyne Jacquey


Données et propriétés

Les lexèmes pris en compte sont notamment des noms relevant de différentes classes d'ambiguïtés lexicales sémantiques selon les auteurs. Ils relèvent de la polysémie logique selon (Pustejovsky, 1995, 1996), de la classe des mots à facettes sémantiques selon (Cruse 1986, 1995), (Copestake et Briscoe 1995) et (Kleiber 1999) et de la classe des noms multitypés selon (Godard et Jayez 1996). Quelle que soit l'étiquette qu'on leur associe, les lexèmes étudiés, représentés par des noms comme livre, ville, reproduction ou description, ont tous la propriété d'avoir plusieurs sens lexicaux, c'est-à-dire des sens répertoriés dans les dictionnaires et accessibles sans la nécessité d'un contexte particulier d'énonciation.


Le nom livre est considéré comme ambigu entre deux sens au moins. Ce nom désigne un objet physique "Pierre a volé mon livre[phys]" ou un objet informationnel "Pierre a compris mon livre[info]". Le nom ville est considéré comme ambigu entre un premier sens sous lequel il désigne un lieu géographique "La ville de Nancy[lieu] est située au nord-est de la France", un second sous lequel il désigne une administration "La ville de Nancy[inst] gère des contrats éducatifs" et un troisième sous lequel il désigne les habitants de la ville "La ville de Nancy[coll-hum] a élu M. Rossinot malgré les déboires du tramway".

Les noms reproduction et description sont ambigus entre un sens, dit processif, sous lequel ils désignent le même processus que le verbe auquel ils sont apparentés morphologiquement "La reproduction[proc] de ce livre a duré une heure" et "La description[proc] du suspect a été longue", et un sens, dit résultatif, sous lequel ils désignent le résultat de ce processus, résultat qui correspond ici à un ou plusieurs objet(s) résultant du déroulement du processus, "Marie cherche une reproduction[rés] de ce livre" et "Une description[rés] du suspect a été rangée dans les archives".


Les recherches sur cette classe particulière de lexèmes mettent en lumière deux propriétés qui s'avèrent distinctives lorsque l'on cherche à la positionner parmi les variations sémantiques lexicales : la propriété de la coprédication et celle des interprétations particulières de la quantification dont ces lexèmes sont responsables dans des coprédications quantifiées.

La coprédication peut être vue comme l'association, dans une même phrase ou sur un même syntagme au travers de plusieurs phrases, de contextes différents reposant sur des prédicats qui sélectionnent chacun un sens particulier dans l'ensemble des sens possibles des lexèmes ambigus. Le degré d'acceptabilité varie d'un niveau quasiment nul avec plateau "(??) Ce plateau[ustensile-ménager] est lourd. Il[paysage] est couvert de forêts" jusqu'à une acceptabilité quasi systématique avec le nom livre "Malgré son état déplorable, ce livre reste intéressant". Entre les deux, des noms comme ville, reproduction ou description admettent cette propriété à des degrés divers et dans des configurations diverses. Dans leur article, Godard et Jayez ont notamment identifié trois configurations possibles : la coordination (Ce livre est très lourd mais passionnant), la reprise anaphorique (Ce livre est très lourd mais il est passionnant) et l'insertion d'une proposition relative (Ce livre, qui est très lourd, est néanmoins passionnant). A cet ensemble, nous pourrions ajouter la modification par un adjectif qualificatif (Ce livre très lourd est passionnant).

La seconde propriété concerne l'interprétation variable de la quantification dans des phrases comportant ces noms particuliers sous le champ d'une quantification. On s'aperçoit principalement de deux choses : (1) la quantification ne sélectionne pas toujours le même sens, et (2), le nombre d'entités désignées peut différer selon le sens qui est sous le champ de la quantification. Dans les énoncés (a) "Marie a déjà emballé tous les livres de cette étagère", (b) "Marie a déjà traduit tous les livres de cette étagère" et (c) "Marie a déjà lu tous les livres de cette étagère", le groupe nominal tous les livres de cette étagère devrait normalement référer à l'ensemble des livres figurant sur l'étagère, chaque livre étant pris comme un objet matériel. Or, selon le type d'entités attendues par le verbe principal, cette interprétation varie. La phrase (a) sera considérée comme vraie si plus aucun objet ressemblant physiquement à un livre ne se trouve sur l'étagère. A l'inverse, le nombre d'entités ressemblant physiquement à un livre n'est pas déterminant dans l'interprétation de la phrase (b). Ce qui conditionne sa valeur de vérité, c'est le fait que tous les livres, pris sous l'angle informationnel, aient été traduits, c'est-à-dire que toutes les oeuvres dont un exemplaire se trouvait sur l'étagère aient été traduites au moment de l'énonciation. Enfin, l'interprétation de la phrase (c) est conditionnée par les deux aspects simultanément. Des exemples similaires sont commentés dans (Pinkal et Kohlhase 2000) et (Asher et Pustejovsky 2000). Outre le nom livre, la plupart des noms considérés comme des polysèmes logiques chez Pustejovsky admettent cette propriété.


Ces deux propriétés imposent trois axes de réflexion. Premièrement, elles mettent en jeu la classification au sein des grands types de relations identifiées et utilisées pour classer les différentes sortes de variabilité sémantique. La sorte d'ambiguïté lexicale qui nous intéresse ici se situe, selon (Kleiber 1999) par exemple, à l'intersection entre l'imprécision et la polysémie. Deuxièmement, elles imposent des contraintes telles qu'il est nécessaire d'imaginer une modélisation nouvelle de leur contenu lexical. Une telle modélisation doit notamment permettre de rendre compte des deux niveaux auxquels agit le contexte : sur la sorte d'entité désignée, la sorte ou le type étant vu ici comme une partie du contenu lexical du mot lexicalement ambigu, et, au niveau des extensions de cette sorte, extensions, ou entités du monde réel ou imaginaire, dont le nombre peut différer selon la sorte sélectionnée sous l'influence du contexte. Troisièmement, le cadre du TAL impose de plus une contrainte d'opérationalité et de compositionalité si l'on désire rester au plus près des phénomènes d'influence mutuelle entre les contenus lexicaux mis en présence au sein d'une phrase. Cette dernière contrainte impose la construction de modélisations non redondantes, confluentes, mais qui restent valides linguistiquement, c'est-à-dire prédictives, conformes aux faits linguistiques constatés, et cohérentes avec les hypothèses linguistiques adoptées.

Positionnement de la polysémie logique dans l'ambiguïté sémantique

Selon (Kleiber 1999), la polysémie logique semble se trouver à l'intersection entre la polysémie et l'imprécision bien que ces deux notions soient difficiles à différencier. Selon (Geeraerts 1993, 1994), un terme imprécis peut être considéré comme un terme ayant un seul sens et qui se spécialise de différentes manières selon le contexte. Par exemple, l'adjectif petit n'est pas interprété de la même manière s'il qualifie un éléphant ou une souris. Cette différence d'interprétation n'est pas due au fait que l'adjectif petit change de sens selon qu'il porte sur un éléphant ou sur une souris. La différence constatée dans les interprétations repose, d'une part, sur le sens de petit - de taille inférieure à la taille moyenne de la classe qualifiée - et d'autre part, sur les connaissances encyclopédiques associées aux entités désignées par les noms éléphant et souris.


Cette instabilité du sens d'un terme imprécis se manifeste par des reprises anaphoriques qui ne préservent pas l'interprétation de leur antécédent. Dans la phrase "Cet éléphant est petit et cette souris l'est aussi", l'interprétation du pronom anaphorique l' n'est pas la même que celle de son antécédent, la construction attributive être petit. Autrement dit, les différentes manifestations du sens d'un terme imprécis coopèrent.

D'un point de vue pratique, un terme imprécis pourrait être vu comme ayant un certain nombre "n" de manifestations. A la première occurrence, une manifestation "k" (k étant compris entre 1 et n) est choisie en fonction du contexte de cette occurrence. Face à une reprise anaphorique sur cette occurrence, toutes les manifestations possibles sont disponibles. C'est le contexte de la reprise qui opère une sélection1.

Selon Geeraerts toujours, un terme polysémique, c'est-à-dire un terme lexicalement ambigu, fonctionne différemment. D'une part, il peut être considéré comme ayant plusieurs sens distincts. D'autre part, les sens d'un terme polysémique sont concurrents, c'est-à-dire qu'ils ne coopèrent pas (on rappelle l'exemple avec le nom plateau). Ce type de restriction expliquerait l'impossibilité pour les sens des termes lexicalement ambigus et polysémiques d'apparaître simultanément à partir d'une même occurrence. Ainsi, à la différence des termes imprécis, lors de l'interprétation d'un pronom anaphorique, tous les sens du terme lexicalement ambigu ne sont pas disponibles. Seul, celui de la dernière occurrence l'est.


Qu'en est-il des polysèmes logiques tels qu'ils sont désignés par Pustejovsky ? La question du positionnement de ces termes entre l'imprécision et la polysémie revient donc à savoir si leurs interprétations différentes relèvent de sens différents ou de manifestations différentes d'un même sens. Il est difficile de répondre à cette question de manière définitive. Nous ferons donc seulement quelques remarques.

De même que les manifestations de sens des termes imprécis, les différentes interprétations possibles des polysèmes logiques coopèrent dans une même phrase ou sur la même occurrence d'un syntagme. Cette première remarque rapprocherait donc les polysèmes logiques de l'imprécision.

Les interprétations possibles des polysèmes logiques et les manifestations du sens des termes imprécis se différencient cependant sur un point. Le sens de petit a autant de manifestations qu'il y a de classes d'individus auxquelles il peut être appliqué. Ce nombre, même s'il est fini, est énorme. Les sens de livre ou de ville sont en nombre limité. De plus, ces sens ne correspondent pas à la spécification d'un même sens en fonction de contextes différents, mais en fonction de classes distinctes de contextes. Chaque sens de livre, ou de ville, semble avoir une représentation propre.

Enfin, les termes imprécis, à l'inverse des polysèmes logiques, n'ont pas un comportement particulier face à la quantification selon la manifestion de sens qui est sélectionnée. Ainsi, tous les petits éléphants a une interprétation similaire à tous les petits chats du point de vue de la quantification, et cela bien que la manisfestation de sens sélectionnée pour petit ne soit pas la même dans chacun de ces deux syntagmes quantifiés.

Bien que la question reste mal définie, les propriétés des polysèmes logiques semblent montrer qu'il s'agit d'une classe particulière d'ambiguïté sémantique, classe qui n'est parfaitement comparable ni à l'imprécision, ni à la polysémie de noms comme plateau ou position. A ce titre, il n'est pas surprenant que les polysèmes logiques donnent lieu à des modélisations propres, tant du point de vue de leur contenu lexical, que du point de vue des interactions entre ce contenu et les contextes qui le sélectionnent.

Modélisations existantes

Les modélisations définies pour la polysémie logique2 s'inscrivent dans une approche compositionnelle du sens et visent à satisfaire trois contraintes : (1) un traitement au niveau lexical, (2) un traitement excluant la disjonction entre entrées lexicales ou bien entre sens à l'intérieur d'une même entrée lexicale et (3) un traitement permettant l'accessibilité et l'indépendance de chaque sens dénoté par un polysème logique.


Ces modélisations partagent l'utilisation d'un même outil conceptuel, la notion de type pointé, définie notamment dans (Pustejovsky 1995). Dans (Pustejovsky 1988, 1991, 1995, 1996), un type pointé est associé à un mot ambigu lorsque celui-ci appartient à la catégorie des polysèmes logiques. Ses sens sont toujours accessibles cognitivement et admettent la coprédication. Grossièrement, un type pointé réfère à un paradigme d'entités comportant autant de sortes qu'il y a de sens possibles pour le polysème logique. Ainsi, le nom livre est associé à un type pointé p· i, type qui est censé résumer le fait que par ce nom, on peut désigner un objet physique p, un objet informationnel i ou bien un objet ayant ces deux facettes à la fois et étant alors de type p· i, avec le verbe lire par exemple.


Ces modélisations se différencient cependant les unes des autres tout d'abord en fonction des formalismes sur lesquels elles s'appuient : le lexique génératif avec (Pustejovsky 1995), les structures de traits typées avec (Copestake et Briscoe 1995) et (Jayez et Godard 1995), et trois derniers travaux qui se fondent sur le λ-calcul étendu avec la quantification. Ces travaux se caractérisent respectivement par l'adjonction de règles particulières d'élaboration (Asher et Pustejovsky 2000), l'adjonction de règles d'accommodation définie dans une logique de traits notée F (Pinkal et Kohlhase 2000), et enfin par l'adjonction de règles particulières d'accommodation qui se veulent une synthèse et une articulation des deux dernières propositions (Jacquey 2001, 2004).


La difficulté de la modélisation de la polysémie logique est d'abord de permettre l'accès à tous les sens du polysème dans certains contextes, comme dans "J'ai traduit[info] un livre[phys] rouge" par exemple. Pour modéliser ce phénomène, tous les travaux sauf ceux de (Asher et Pustejovsky 2000) proposent d'accumuler les contraintes apportées par les contextes ou restrictions de sélection. On obtient donc une modélisation signifiant, aux différences formelles près, "il existe X, de type pointé p· i, X est un livre, la facette physique de X est rouge et sa facette informationnelle est traduite".


Cependant, pour modéliser ensuite la variation des interprétations de la quantification dans les coprédications quantifiées, le problème est d'avoir accès aux différents sens de livre indépendamment les uns des autres puisque la quantification ne porte pas forcément sur tous ces sens en même temps. Ainsi, seule la modélisation de (Asher et Pustejovsky 2000) fournit les outils formels permettant de représenter la phrase "J'ai traduit[info] tous les livres [phys] rouges" en rendant compte de l'interprétation particulière du quantificateur tous les. La représentation formelle obtenue peut alors être glosée par "il existe X de type p· i, il existe Y de type i, pour tout Z de type p, X est un livre, Z est rouge, il existe une relation R1 entre X et Y et une relation R2 entre X et Z implique Y est traduit", c'est-à-dire que si, pour tout objet physique rouge, celui-ci est en relation R2 avec X un livre, ce même livre est en relation R1 avec Y son contenu, alors cette phrase est vraie si ce contenu Y est traduit.

A la suite d'une analyse des modélisations existantes, (Jacquey 2001, 2004) propose une modélisation réunissant les avantages des deux grandes approches développées jusque là tout en les articulant l'une par rapport à l'autre : accummulation de restrictions de sélection et accès indépendant à chaque sens.

Perspectives

A l'issue de ce bref exposé, trois points semblent mériter une étude approfondie. Le premier concerne la prise en compte d'autres propriétés, plus difficile à analyser, supposées caractériser la polysémie logique. Nous pensons notamment à la notion d'enveloppe conceptuelle selon Cruse, propriété qui est supposée selon lui différencier les noms polysémiques des noms à facettes sémantiques, c'est-à-dire des polysèmes logiques. Outre l'examen des entrées de dictionnaires, il serait certainement intéressant de mener des expériences destinées à mesurer si d'autres concepts complexes comme celui des objets imprimés sont lexicalisés en français et si cette lexicalisation se fait par le biais de lexèmes ayant les propriétés des polysèmes logiques (coprédication et quantification variable). Le second point concerne l'état actuel des modélisations existantes. Le cas de polysèmes logiques ayant plus de deux sens simples n'est pas traité. Or, avec des noms comme journal ou ville, trois sens simples au moins peuvent être identifiés. Le nom journal peut être interprété comme une organisation financière, comme un exemplaire papier ou comme l'information accessible sur cet exemplaire et sur l'ensemble des exemplaires identiques. Le nom ville peut désigner un lieu géographique, l'ensemble de ses habitants, sa mairie ou l'un de ses services municipaux. S'il s'avère que ces sens peuvent être vus comme les sens de polysèmes logiques, alors il est nécessaire de prévoir des types pointés, et leur modélisation, comportant plus de deux types élémentaires et d'envisager leurs combinaisons deux à deux possibles. De plus, il faut tenir compte de certaines coprédications impossibles ou très difficiles comme celles entre le sens d'entreprise financière et d'exemplaire papier pour le nom journal (Copestake et Briscoe 1995). Enfin, le troisième et dernier point concerne une étude approfondie du phénomène en français : quelle est la couverture réelle de ce phénomène dans la langue française (la plupart des travaux ayant traités de cette question étant en anglais et sur l'anglais), quelles méthodologies utiliser pour mesurer le phénomène à l'échelle d'une langue?

Notes

1 Un autre point de vue possible est celui de la sous-spécification du sens du terme imprécis (Copestake et Briscoe 1995). Mis en contexte, l'aspect sous-spécifié du terme imprécis se trouve spécifié par un élément du contexte, par exemple le nom modifié dans le cas de l'adjectif petit.

2 Ces modélisations constituent un aspect important du doctorat de Jacquey (Jacquey 2001) dont on trouvera un résumé dans (Jacquey 2004).

Références

  • (Copestake et Briscoe 1995) Copestake, A. et Briscoe, T. Semi-productive polysemy and sense extension, dans Journal of Semantics, 12 : 15,67, 1995
  • (Cruse 1986) Cruse, D.A. Lexical Semantics. Cambridge : Cambridge University Press, 1986
  • (Cruse 1995) Cruse, D.A. Polysemy and related phenomena from a cognitive linguistic point of view, dans Computational Lexical Semantics (eds. Saint-Dizier, P. et Viegas, E.), 1995.
  • (Geeraerts 1993) Geeraerts, D. Vagueness's puzzles, polysemy's vagaries, dans Cognitive Linguistics, 4-3 : 223-72, 1993.
  • (Geeraerts 1994) Geeraerts, D. Polysemy, dans The Encyclopedia of Language and Linguistics (eds. Asher, R.E. et Simpson, J.M.Y.), Pergamon, Oxford, 1994
  • (Godard et Jayez 1996) Godard, D. et Jayez, J. Types nominaux et anaphores ; le cas des objets et des événements, dans Anaphores temporelles et (in-)cohérences, Cahiers Chronos, 1996.
  • (Jacquey 2001) Ambiguïtés lexicales et traitement automatique des langues : Modélisation de la polysémie logique et application aux déverbaux d'action ambigus en français. Doctorat de 3ème cyle de l'université de Nancy2 (spécialités informatique et linguistique). Décembre 2001.
  • (Jacquey 2004) Ambiguïté lexicale et quantification : une modélisation de la polysémie logique, dans Interpréter en contexte, F. Corblin et C. Gardent (eds.), Hermès, Paris, p. 107-141, 2004.
  • (Jayez et Godard 1995) Jayez, J. et Godard, D. Principles as lexical methods, dans Proceedings of the AAAI workshop on representation and acquisition of lexical knowledge, 1995.
  • (Kleiber 1999) Kleiber, G. Problèmes de sémantique : la polysémie en questions, Sens et structures, Villeneuve d'Ascq : Presses universitaires du Spetentrion, 1999.
  • (Lascarides et al. 1996) Lascarides, A., Copestake, A. et Briscoe, T., 1996. Ambiguity and Coherence, dans Journal of Semantics, 13 : 41-65.
  • (Pinkal et Kohlhase 2000) Pinkal, M. et Kohlhase M. Feature logic for dotted types : A formalism for complex words meanings, dans ACL, 2000.
  • (Pustejovsky 1988) Pustejovsky, J. et Anick, P. On the semantic interpretation of nominals, dans Proceedings of COLING, Budapest, 1988.
  • (Pustejovsky 1991) Pustejovsky, J. The generative lexicon, dans Computational Semantics 17(4) : 409-41, 1991.
  • (Pustejovsky 1995) Pustejovsky, J. The generative lexicon, MIT Press, 1995
  • (Pustejovsky 1996) Pustejovsky, J. The semantics of complex types, dans Langue française, 1996.