Polysémie logique : Différence entre versions
Ligne 11 : | Ligne 11 : | ||
Les noms ''reproduction'' et ''description'' sont ambigus entre un sens, dit '''[[processif]]''', sous lequel ils désignent le même processus que le verbe auquel ils sont apparentés morphologiquement "''La reproduction<span style="font-size: 9pt"><sub>[proc]</sub></span> de ce livre a duré une heure''" et "''La description<span style="font-size: 9pt"><sub>[proc]</sub></span> du suspect a été longue''", et un sens, dit '''[[résultatif]]''', sous lequel ils désignent le résultat de ce processus, résultat qui correspond ici à un ou plusieurs objet(s) résultant du déroulement du processus, "''Marie cherche une reproduction<span style="font-size: 9pt"><sub>[rés]</sub></span> de ce livre''" et "''Une description<span style="font-size: 9pt"><sub>[rés]</sub></span> du suspect a été rangée dans les archives''". | Les noms ''reproduction'' et ''description'' sont ambigus entre un sens, dit '''[[processif]]''', sous lequel ils désignent le même processus que le verbe auquel ils sont apparentés morphologiquement "''La reproduction<span style="font-size: 9pt"><sub>[proc]</sub></span> de ce livre a duré une heure''" et "''La description<span style="font-size: 9pt"><sub>[proc]</sub></span> du suspect a été longue''", et un sens, dit '''[[résultatif]]''', sous lequel ils désignent le résultat de ce processus, résultat qui correspond ici à un ou plusieurs objet(s) résultant du déroulement du processus, "''Marie cherche une reproduction<span style="font-size: 9pt"><sub>[rés]</sub></span> de ce livre''" et "''Une description<span style="font-size: 9pt"><sub>[rés]</sub></span> du suspect a été rangée dans les archives''". | ||
+ | |||
+ | |||
+ | Les recherches sur cette classe particulière de lexèmes mettent en lumière deux propriétés qui s'avèrent distinctives lorsque l'on cherche à la positionner parmi les variations sémantiques lexicales : la propriété de la '''[[coprédication]]''' et celle des '''[[interprétations particulières de la quantification]]''' dont ces lexèmes sont responsables dans des coprédications quantifiées. | ||
+ | |||
+ | La '''[[coprédication]]''' peut être vue comme l'association, dans une même phrase ou sur un même syntagme au travers de plusieurs phrases, de contextes différents reposant sur des prédicats qui sélectionnent chacun un sens particulier dans l'ensemble des sens possibles des lexèmes ambigus. Le degré d'acceptabilité varie d'un niveau quasiment nul avec ''plateau'' "(??) ''Ce plateau<span style="font-size: 9pt"><sub>[ustensile-ménager]</sub></span> est lourd. Il<span style="font-size: 9pt"><sub>[paysage]</sub></span> est couvert de forêts''" jusqu'à une acceptabilité quasi systématique avec le nom ''livre "Malgré son état déplorable, ce livre reste intéressant".'' Entre les deux, des noms comme ''ville, reproduction'' ou ''description'' admettent cette propriété à des degrés divers et dans des configurations diverses. Dans leur article, Godard et Jayez ont notamment identifié trois configurations possibles : la coordination (''Ce livre est très lourd mais passionnant''), la reprise anaphorique (''Ce livre est très lourd mais il est passionnant'') et l'insertion d'une proposition relative (''Ce livre, qui est très lourd, est néanmoins passionnant''). A cet ensemble, nous pourrions ajouter la modification par un adjectif qualificatif (''Ce livre très lourd est passionnant''). | ||
+ | |||
+ | La seconde propriété concerne '''[[l'interprétation variable de la quantification]]''' dans des phrases comportant ces noms particuliers sous le champ d'une quantification. On s'aperçoit principalement de deux choses : (1) la quantification ne sélectionne pas toujours le même sens, et (2), le nombre d'entités désignées peut différer selon le sens qui est sous le champ de la quantification. Dans les énoncés (a) "''Marie a déjà emballé tous les livres de cette étagère''", (b) "''Marie a déjà traduit tous les livres de cette étagère''" et (c) "''Marie a déjà lu tous les livres de cette étagère''", le groupe nominal ''tous les livres de cette étagère'' devrait normalement référer à l'ensemble des livres figurant sur l'étagère, chaque livre étant pris comme un objet matériel. Or, selon le type d'entités attendues par le verbe principal, cette interprétation varie. La phrase (a) sera considérée comme vraie si plus aucun objet ressemblant physiquement à un livre ne se trouve sur l'étagère. A l'inverse, le nombre d'entités ressemblant physiquement à un livre n'est pas déterminant dans l'interprétation de la phrase (b). Ce qui conditionne sa valeur de vérité, c'est le fait que tous les livres, pris sous l'angle informationnel, aient été traduits, c'est-à-dire que toutes les oeuvres dont un exemplaire se trouvait sur l'étagère aient été traduites au moment de l'énonciation. Enfin, l'interprétation de la phrase (c) est conditionnée par les deux aspects simultanément. Des exemples similaires sont commentés dans (Pinkal et Kohlhase 2000) et (Asher et Pustejovsky 2000). Outre le nom livre, la plupart des noms considérés comme des polysèmes logiques chez Pustejovsky admettent cette propriété. | ||
+ | |||
+ | |||
+ | Ces deux propriétés imposent trois axes de réflexion. Premièrement, elles mettent en jeu la classification au sein des grands types de relations identifiées et utilisées pour classer les différentes sortes de variabilité sémantique. La sorte d'ambiguïté lexicale qui nous intéresse ici se situe, selon (Kleiber 1999) par exemple, à l''''[[intersection entre l'imprécision et la polysémie]]'''. Deuxièmement, elles imposent des contraintes telles qu'il est nécessaire d'imaginer une modélisation nouvelle de leur contenu lexical. Une telle modélisation doit notamment permettre de rendre compte des '''deux niveaux auxquels agit le contexte''' : sur la sorte d'entité désignée, la sorte ou le type étant vu ici comme une partie du contenu lexical du mot lexicalement ambigu, et, au niveau des extensions de cette sorte, extensions, ou entités du monde réel ou imaginaire, dont le nombre peut différer selon la sorte sélectionnée sous l'influence du contexte.Troisièmement, le cadre du TAL impose de plus une '''contrainte d'opérationalité et de compositionalité''' si l'on désire rester au plus près des phénomènes d'influence mutuelle entre les contenus lexicaux mis en présence au sein d'une phrase. Cette dernière contrainte impose la construction de modélisations non redondantes, confluentes, mais qui restent valides linguistiquement, c'est-à-dire prédictives, conformes aux faits linguistiques constatés, et cohérentes avec les hypothèses linguistiques adoptées. | ||
+ | |||
+ |
Version du 28 juin 2006 à 15:44
par EVELYNE JACQUEY |
DONNÉES ET PROPRIÉTÉS
Les lexèmes pris en compte sont notamment des noms relevant de différentes classes d'ambiguïtés lexicales sémantiques selon les auteurs. Ils relèvent de la polysémie logique selon (Pustejovsky, 1995, 1996), de la classe des mots à facettes sémantiques selon (Cruse 1986, 1995), (Copestake et Briscoe 1995) et (Kleiber 1999) et de la classe des noms multitypés selon (Godard et Jayez 1996). Quelle que soit l'étiquette qu'on leur associe, les lexèmes étudiés, représentés par des noms comme livre, ville, reproduction ou description, ont tous la propriété d'avoir plusieurs sens lexicaux, c'est-à-dire des sens répertoriés dans les dictionnaires et accessibles sans la nécessité d'un contexte particulier d'énonciation.
Le nom livre est considéré comme ambigu entre deux sens au moins. Ce nom désigne un objet physique "Pierre a volé mon livre[phys]" ou un objet informationnel "Pierre a compris mon livre[info]". Le nom ville est considéré comme ambigu entre un premier sens sous lequel il désigne un lieu géographique "La ville de Nancy[lieu] est située au nord-est de la France", un second sous lequel il désigne une administration "La ville de Nancy[inst] gère des contrats éducatifs" et un troisième sous lequel il désigne les habitants de la ville "La ville de Nancy[coll-hum] a élu M. Rossinot malgré les déboires du tramway".
Les noms reproduction et description sont ambigus entre un sens, dit processif, sous lequel ils désignent le même processus que le verbe auquel ils sont apparentés morphologiquement "La reproduction[proc] de ce livre a duré une heure" et "La description[proc] du suspect a été longue", et un sens, dit résultatif, sous lequel ils désignent le résultat de ce processus, résultat qui correspond ici à un ou plusieurs objet(s) résultant du déroulement du processus, "Marie cherche une reproduction[rés] de ce livre" et "Une description[rés] du suspect a été rangée dans les archives".
Les recherches sur cette classe particulière de lexèmes mettent en lumière deux propriétés qui s'avèrent distinctives lorsque l'on cherche à la positionner parmi les variations sémantiques lexicales : la propriété de la coprédication et celle des interprétations particulières de la quantification dont ces lexèmes sont responsables dans des coprédications quantifiées.
La coprédication peut être vue comme l'association, dans une même phrase ou sur un même syntagme au travers de plusieurs phrases, de contextes différents reposant sur des prédicats qui sélectionnent chacun un sens particulier dans l'ensemble des sens possibles des lexèmes ambigus. Le degré d'acceptabilité varie d'un niveau quasiment nul avec plateau "(??) Ce plateau[ustensile-ménager] est lourd. Il[paysage] est couvert de forêts" jusqu'à une acceptabilité quasi systématique avec le nom livre "Malgré son état déplorable, ce livre reste intéressant". Entre les deux, des noms comme ville, reproduction ou description admettent cette propriété à des degrés divers et dans des configurations diverses. Dans leur article, Godard et Jayez ont notamment identifié trois configurations possibles : la coordination (Ce livre est très lourd mais passionnant), la reprise anaphorique (Ce livre est très lourd mais il est passionnant) et l'insertion d'une proposition relative (Ce livre, qui est très lourd, est néanmoins passionnant). A cet ensemble, nous pourrions ajouter la modification par un adjectif qualificatif (Ce livre très lourd est passionnant).
La seconde propriété concerne l'interprétation variable de la quantification dans des phrases comportant ces noms particuliers sous le champ d'une quantification. On s'aperçoit principalement de deux choses : (1) la quantification ne sélectionne pas toujours le même sens, et (2), le nombre d'entités désignées peut différer selon le sens qui est sous le champ de la quantification. Dans les énoncés (a) "Marie a déjà emballé tous les livres de cette étagère", (b) "Marie a déjà traduit tous les livres de cette étagère" et (c) "Marie a déjà lu tous les livres de cette étagère", le groupe nominal tous les livres de cette étagère devrait normalement référer à l'ensemble des livres figurant sur l'étagère, chaque livre étant pris comme un objet matériel. Or, selon le type d'entités attendues par le verbe principal, cette interprétation varie. La phrase (a) sera considérée comme vraie si plus aucun objet ressemblant physiquement à un livre ne se trouve sur l'étagère. A l'inverse, le nombre d'entités ressemblant physiquement à un livre n'est pas déterminant dans l'interprétation de la phrase (b). Ce qui conditionne sa valeur de vérité, c'est le fait que tous les livres, pris sous l'angle informationnel, aient été traduits, c'est-à-dire que toutes les oeuvres dont un exemplaire se trouvait sur l'étagère aient été traduites au moment de l'énonciation. Enfin, l'interprétation de la phrase (c) est conditionnée par les deux aspects simultanément. Des exemples similaires sont commentés dans (Pinkal et Kohlhase 2000) et (Asher et Pustejovsky 2000). Outre le nom livre, la plupart des noms considérés comme des polysèmes logiques chez Pustejovsky admettent cette propriété.
Ces deux propriétés imposent trois axes de réflexion. Premièrement, elles mettent en jeu la classification au sein des grands types de relations identifiées et utilisées pour classer les différentes sortes de variabilité sémantique. La sorte d'ambiguïté lexicale qui nous intéresse ici se situe, selon (Kleiber 1999) par exemple, à l'intersection entre l'imprécision et la polysémie. Deuxièmement, elles imposent des contraintes telles qu'il est nécessaire d'imaginer une modélisation nouvelle de leur contenu lexical. Une telle modélisation doit notamment permettre de rendre compte des deux niveaux auxquels agit le contexte : sur la sorte d'entité désignée, la sorte ou le type étant vu ici comme une partie du contenu lexical du mot lexicalement ambigu, et, au niveau des extensions de cette sorte, extensions, ou entités du monde réel ou imaginaire, dont le nombre peut différer selon la sorte sélectionnée sous l'influence du contexte.Troisièmement, le cadre du TAL impose de plus une contrainte d'opérationalité et de compositionalité si l'on désire rester au plus près des phénomènes d'influence mutuelle entre les contenus lexicaux mis en présence au sein d'une phrase. Cette dernière contrainte impose la construction de modélisations non redondantes, confluentes, mais qui restent valides linguistiquement, c'est-à-dire prédictives, conformes aux faits linguistiques constatés, et cohérentes avec les hypothèses linguistiques adoptées.
==