Polysémie logique

De Sémanticlopédie
Aller à : navigation, rechercher


par Evelyne Jacquey

DONNÉES ET PROPRIÉTÉS

Les lexèmes pris en compte sont notamment des noms relevant de différentes classes d'ambiguïtés lexicales sémantiques selon les auteurs. Ils relèvent de la polysémie logique selon (Pustejovsky, 1995, 1996), de la classe des mots à facettes sémantiques selon (Cruse 1986, 1995), (Copestake et Briscoe 1995) et (Kleiber 1999) et de la classe des noms multitypés selon (Godard et Jayez 1996). Quelle que soit l'étiquette qu'on leur associe, les lexèmes étudiés, représentés par des noms comme livre, ville, reproduction ou description, ont tous la propriété d'avoir plusieurs sens lexicaux, c'est-à-dire des sens répertoriés dans les dictionnaires et accessibles sans la nécessité d'un contexte particulier d'énonciation.


Le nom livre est considéré comme ambigu entre deux sens au moins. Ce nom désigne un objet physique "Pierre a volé mon livre[phys]" ou un objet informationnel "Pierre a compris mon livre[info]". Le nom ville est considéré comme ambigu entre un premier sens sous lequel il désigne un lieu géographique "La ville de Nancy[lieu] est située au nord-est de la France", un second sous lequel il désigne une administration "La ville de Nancy[inst] gère des contrats éducatifs" et un troisième sous lequel il désigne les habitants de la ville "La ville de Nancy[coll-hum] a élu M. Rossinot malgré les déboires du tramway".

Les noms reproduction et description sont ambigus entre un sens, dit processif, sous lequel ils désignent le même processus que le verbe auquel ils sont apparentés morphologiquement "La reproduction[proc] de ce livre a duré une heure" et "La description[proc] du suspect a été longue", et un sens, dit résultatif, sous lequel ils désignent le résultat de ce processus, résultat qui correspond ici à un ou plusieurs objet(s) résultant du déroulement du processus, "Marie cherche une reproduction[rés] de ce livre" et "Une description[rés] du suspect a été rangée dans les archives".


Les recherches sur cette classe particulière de lexèmes mettent en lumière deux propriétés qui s'avèrent distinctives lorsque l'on cherche à la positionner parmi les variations sémantiques lexicales : la propriété de la coprédication et celle des interprétations particulières de la quantification dont ces lexèmes sont responsables dans des coprédications quantifiées.

La coprédication peut être vue comme l'association, dans une même phrase ou sur un même syntagme au travers de plusieurs phrases, de contextes différents reposant sur des prédicats qui sélectionnent chacun un sens particulier dans l'ensemble des sens possibles des lexèmes ambigus. Le degré d'acceptabilité varie d'un niveau quasiment nul avec plateau "(??) Ce plateau[ustensile-ménager] est lourd. Il[paysage] est couvert de forêts" jusqu'à une acceptabilité quasi systématique avec le nom livre "Malgré son état déplorable, ce livre reste intéressant". Entre les deux, des noms comme ville, reproduction ou description admettent cette propriété à des degrés divers et dans des configurations diverses. Dans leur article, Godard et Jayez ont notamment identifié trois configurations possibles : la coordination (Ce livre est très lourd mais passionnant), la reprise anaphorique (Ce livre est très lourd mais il est passionnant) et l'insertion d'une proposition relative (Ce livre, qui est très lourd, est néanmoins passionnant). A cet ensemble, nous pourrions ajouter la modification par un adjectif qualificatif (Ce livre très lourd est passionnant).

La seconde propriété concerne l'interprétation variable de la quantification dans des phrases comportant ces noms particuliers sous le champ d'une quantification. On s'aperçoit principalement de deux choses : (1) la quantification ne sélectionne pas toujours le même sens, et (2), le nombre d'entités désignées peut différer selon le sens qui est sous le champ de la quantification. Dans les énoncés (a) "Marie a déjà emballé tous les livres de cette étagère", (b) "Marie a déjà traduit tous les livres de cette étagère" et (c) "Marie a déjà lu tous les livres de cette étagère", le groupe nominal tous les livres de cette étagère devrait normalement référer à l'ensemble des livres figurant sur l'étagère, chaque livre étant pris comme un objet matériel. Or, selon le type d'entités attendues par le verbe principal, cette interprétation varie. La phrase (a) sera considérée comme vraie si plus aucun objet ressemblant physiquement à un livre ne se trouve sur l'étagère. A l'inverse, le nombre d'entités ressemblant physiquement à un livre n'est pas déterminant dans l'interprétation de la phrase (b). Ce qui conditionne sa valeur de vérité, c'est le fait que tous les livres, pris sous l'angle informationnel, aient été traduits, c'est-à-dire que toutes les oeuvres dont un exemplaire se trouvait sur l'étagère aient été traduites au moment de l'énonciation. Enfin, l'interprétation de la phrase (c) est conditionnée par les deux aspects simultanément. Des exemples similaires sont commentés dans (Pinkal et Kohlhase 2000) et (Asher et Pustejovsky 2000). Outre le nom livre, la plupart des noms considérés comme des polysèmes logiques chez Pustejovsky admettent cette propriété.


Ces deux propriétés imposent trois axes de réflexion. Premièrement, elles mettent en jeu la classification au sein des grands types de relations identifiées et utilisées pour classer les différentes sortes de variabilité sémantique. La sorte d'ambiguïté lexicale qui nous intéresse ici se situe, selon (Kleiber 1999) par exemple, à l'intersection entre l'imprécision et la polysémie. Deuxièmement, elles imposent des contraintes telles qu'il est nécessaire d'imaginer une modélisation nouvelle de leur contenu lexical. Une telle modélisation doit notamment permettre de rendre compte des deux niveaux auxquels agit le contexte : sur la sorte d'entité désignée, la sorte ou le type étant vu ici comme une partie du contenu lexical du mot lexicalement ambigu, et, au niveau des extensions de cette sorte, extensions, ou entités du monde réel ou imaginaire, dont le nombre peut différer selon la sorte sélectionnée sous l'influence du contexte.Troisièmement, le cadre du TAL impose de plus une contrainte d'opérationalité et de compositionalité si l'on désire rester au plus près des phénomènes d'influence mutuelle entre les contenus lexicaux mis en présence au sein d'une phrase. Cette dernière contrainte impose la construction de modélisations non redondantes, confluentes, mais qui restent valides linguistiquement, c'est-à-dire prédictives, conformes aux faits linguistiques constatés, et cohérentes avec les hypothèses linguistiques adoptées.

==

Selon (Kleiber 1999), la polysémie logique semble se trouver à l'intersection entre la polysémie et l'imprécision bien que ces deux notions soient difficiles à différencier. Selon (Geeraerts 1993, 1994), un terme imprécis peut être considéré comme un terme ayant un seul sens et qui se spécialise de différentes manières selon le contexte. Par exemple, l'adjectif petit n'est pas interprété de la même manière s'il qualifie un éléphant ou une souris. Cette différence d'interprétation n'est pas due au fait que l'adjectif petit change de sens selon qu'il porte sur un éléphant ou sur une souris. La différence constatée dans les interprétations repose, d'une part, sur le sens de petit - de taille inférieure à la taille moyenne de la classe qualifiée - et d'autre part, sur les connaissances encyclopédiques associées aux entités désignées par les noms éléphant et souris.


Cette instabilité du sens d'un terme imprécis se manifeste par des reprises anaphoriques qui ne préservent pas l'interprétation de leur antécédent. Dans la phrase "Cet éléphant est petit et cette souris l'est aussi", l'interprétation du pronom anaphorique l' n'est pas la même que celle de son antécédent, la construction attributive être petit. Autrement dit, les différentes manifestations du sens d'un terme imprécis coopèrent.

D'un point de vue pratique, un terme imprécis pourrait être vu comme ayant un certain nombre "n" de manifestations. A la première occurrence, une manifestation "k" (k étant compris entre 1 et n) est choisie en fonction du contexte de cette occurrence. Face à une reprise anaphorique sur cette occurrence, toutes les manifestations possibles sont disponibles. C'est le contexte de la reprise qui opère une sélection1.

Selon Geeraerts toujours, un terme polysémique, c'est-à-dire un terme lexicalement ambigu, fonctionne différemment. D'une part, il peut être considéré comme ayant plusieurs sens distincts. D'autre part, les sens d'un terme polysémique sont concurrents, c'est-à-dire qu'ils ne coopèrent pas (on rappelle l'exemple avec le nom plateau). Ce type de restriction expliquerait l'impossibilité pour les sens des termes lexicalement ambigus et polysémiques d'apparaître simultanément à partir d'une même occurrence. Ainsi, à la différence des termes imprécis, lors de l'interprétation d'un pronom anaphorique, tous les sens du terme lexicalement ambigu ne sont pas disponibles. Seul, celui de la dernière occurrence l'est.


Qu'en est-il des polysèmes logiques tels qu'ils sont désignés par Pustejovsky ? La question du positionnement de ces termes entre l'imprécision et la polysémie revient donc à savoir si leurs interprétations différentes relèvent de sens différents ou de manifestations différentes d'un même sens. Il est difficile de répondre à cette question de manière définitive. Nous ferons donc seulement quelques remarques.

De même que les manifestations de sens des termes imprécis, les différentes interprétations possibles des polysèmes logiques coopèrent dans une même phrase ou sur la même occurrence d'un syntagme. Cette première remarque rapprocherait donc les polysèmes logiques de l'imprécision.

Les interprétations possibles des polysèmes logiques et les manifestations du sens des termes imprécis se différencient cependant sur un point. Le sens de petit a autant de manifestations qu'il y a de classes d'individus auxquelles il peut être appliqué. Ce nombre, même s'il est fini, est énorme. Les sens de livre ou de ville sont en nombre limité. De plus, ces sens ne correspondent pas à la spécification d'un même sens en fonction de contextes différents, mais en fonction de classes distinctes de contextes. Chaque sens de livre, ou de ville, semble avoir une représentation propre.

Enfin, les termes imprécis, à l'inverse des polysèmes logiques, n'ont pas un comportement particulier face à la quantification selon la manifestion de sens qui est sélectionnée. Ainsi, tous les petits éléphants a une interprétation similaire à tous les petits chats du point de vue de la quantification, et cela bien que la manisfestation de sens sélectionnée pour petit ne soit pas la même dans chacun de ces deux syntagmes quantifiés.

Bien que la question reste mal définie, les propriétés des polysèmes logiques semblent montrer qu'il s'agit d'une classe particulière d'ambiguïté sémantique, classe qui n'est parfaitement comparable ni à l'imprécision, ni à la polysémie de noms comme plateau ou position. A ce titre, il n'est pas surprenant que les polysèmes logiques donnent lieu à des modélisations propres, tant du point de vue de leur contenu lexical, que du point de vue des interactions entre ce contenu et les contextes qui le sélectionnent.

MODÉLISATIONS EXISTANTES

Les modélisations définies pour la polysémie logique2 s'inscrivent dans une approche compositionnelle du sens et visent à satisfaire trois contraintes : (1) un traitement au niveau lexical, (2) un traitement excluant la disjonction entre entrées lexicales ou bien entre sens à l'intérieur d'une même entrée lexicale et (3) un traitement permettant l'accessibilité et l'indépendance de chaque sens dénoté par un polysème logique.


Ces modélisations partagent l'utilisation d'un même outil conceptuel, la notion de type pointé, définie notamment dans (Pustejovsky 1995). Dans (Pustejovsky 1988, 1991, 1995, 1996), un type pointé est associé à un mot ambigu lorsque celui-ci appartient à la catégorie des polysèmes logiques. Ses sens sont toujours accessibles cognitivement et admettent la coprédication. Grossièrement, un type pointé réfère à un paradigme d'entités comportant autant de sortes qu'il y a de sens possibles pour le polysème logique. Ainsi, le nom livre est associé à un type pointé p· i, type qui est censé résumer le fait que par ce nom, on peut désigner un objet physique p, un objet informationnel i ou bien un objet ayant ces deux facettes à la fois et étant alors de type p· i, avec le verbe lire par exemple.