Compositionalité: questions linguistiques
par Danièle Godard |
Sommaire
Définition
Ce que l'on appelle le ‘principe de compositionalité’ s'écrit généralement de la manière suivante :
- L'interprétation d'une expression complexe est une fonction de l'interprétation de ses parties et de la manière dont elles sont assemblées.
Ce principe a une vraisemblance générale. Il est vraisemblable que la syntaxe serve de carte pour la construction du sens d'une phrase à partir de celui des unités plus petites, autrement dit qu'il y ait une association entre une syntaxe donnée et une combinatoire sémantique donnée. Notons de plus que la ‘manière d'assembler les parties’ n'a pas à être assimilée à la pure combinatoire syntaxique :
- Le principe admet très bien que le mode d'assemblage soit lui-même porteur de sens. Ainsi, il ne milite pas contre l'existence de ‘constructions’ définies par la concomitance de contraintes diverses (par ex. syntaxiques et sémantiques).
- Le principe ne s'oppose pas à ce que d'autres propriétés, par ex. phonologiques, soient également impliquées dans la manière d'assembler les parties. A priori, la prosodie peut signaler par ex. une structuration de type informationnel. La question qui se pose alors est de savoir comment ce type d'information s'articule avec le découpage syntaxique.
Néanmoins, un certain nombre de données linguistiques posent problème. Nous mentionnons ici les cas les plus connus.
Interprétations non compositionnelles
Si l’expression ‘fonction de l’interprétation de ses parties’ suppose que l’interprétation des parties doit être complète au moment où elles se combinent (comme on le suppose généralement), alors il y a des cas clairs pour lesquels l’interprétation n’est pas compositionnelle. Il s'agit d'expressions syntaxiques complexes dont l'interprétation se fait globalement, ou dont la portée excède le constituant dans lequel ils apparaissent.
Les idiomes sont définis par deux propriétés : d’une part, leur syntaxe est ou peut être ordinaire, d’autre part, l’interprétation n’est pas compositionnelle, mais globale (l’interprétation des éléments n’est pas indépendante de celle de l’ensemble). Certains ont une interprétation tout à fait normale, et compositionnelle, à côté de l'interprétation idiomatique (les carottes sont cuites, casser sa pipe, tirer les marrons du feu, prendre son pied, the cat is out of the bag, kick the bucket), mais rien ne permet de passer de manière régulière d'une interprétation à l'autre (le passage est au mieux justifié métaphoriquement ou historiquement), et l'interprétation idiomatique s'obtient de manière globale. Or, les interprétations idiomatiques sont tout aussi conventionalisées que le sens lexical.
D'autres locutions, sans être des idiomes, rendent douteuse l'attribution d'un sens indépendant aux éléments, par ex. dans les cas où l'on a construction d'un prédicat sémantique unique à partir de plusieurs éléments (faire main basse, prendre soin, prêter attention).
Les affixes syntagmatiques, lorqu’ils ont une interprétation, violent la compositionalité, puisqu'ils font partie d'un mot phonologique, mais portent sur l'ensemble du syntagme : c'est le cas de l'affixe de génitif en anglais, cf. the king of England's daughter (ex. de Partee 1984). Il faut donc ‘attendre’ le syntagme the king of England pour interpréter la marque du génitif qui fait partie, morphologiquement, de England.
L'expression linguistique du temps est souvent attachée à un verbe. Or, l'opérateur temporel auquel cette expression est sémantiquement associée a portée sur l'ensemble de la phrase, et peut provoquer une ambiguité de portée avec un quantifieur.
(1) | Paul rencontrait un ami de Fac | |
a. ∃ev (Passé (∃x (ami-de-Fac (x) & (rencontrer (ev, p, x))))) | ||
b. ∃x, ev (Passé (ami-de-Fac (x) & (rencontrer (ev, p, x)))) |
L’interprétation du verbe (ici, rencontrait) n’est donc pas complète avant que la phrase dans son ensemble ne soit interprétée. De plus, l’ambiguïté pose problème pour l’hypothèse de la compositionalité comme ‘fonction’.
On parle de concordance négative lorsqu'une phrase contenant plusieurs expressions qui sont chacune, lorsqu'elles sont seules, une négation, est cependant interprétée comme ne comportant qu'une négation logique.
(2) | a. | Personne n’est venu |
b. | Paul n’a rien fait | |
c. | Personne n'a rien fait | |
¬∃x, y (faire x, y) |
L'interprétation est non compositionnelle puisqu'elle fait disparaître une négation apportée par un lexème. On peut y voir un cas particulier d'un phénomène plus général, que l'on appelle ‘multiple exponence’, où un trait sémantiquement potent est exprimé à plusieurs endroits (par ex., le pluriel dans le SN dans une langue où la morphologie marque le pluriel à la fois sur le N et sur l'adjectif épithète).
– Ambiguïtés de portée des quantifieurs.
Certains items lexicaux, quantifieurs ou adverbes, ont des propriétés de portée, et lorsqu'une phrase en contient plusieurs, en général plusieurs interprétations sont possibles.
(3) | Paul a souvent lu un livre de Balzac | |
a. Souvent-ev ( ∃x (livre-de-B (x) & lire (ev, p, x))) | ||
b. ∃x (livre-de-B (x) & Souvent-ev (lire (ev, p, x))) |
La phrase (3) est vraie si Paul lit souvent un livre de Balzac, quel qu'il soit, et elle est vraie également s'il lit souvent Grandeur et décadence de César Biroteau (par ex.). De telles phrases sont doublement problématiques, comme la phrase (1) : le quantifieur n'est pas interprété à l'intérieur du constituant syntaxique auquel il appartient, donc les ‘parties’ de l'expression n'ont pas une interprétation complète ; d'autre part, s'il y a ambiguité, l'interprétation ne peut pas être dite une ‘fonction’ des parties.
Les phrases appelées ‘donkey sentences’ mettent également en jeu une expression quantifiée, comme en (4).
(4) | Si mon voisin a un âne, il le nourrit bien | |
∀x, ev1, ev2 (((âne (x) & avoir (ev1, mon-voisin, x)) | ||
=> (nourrir-bien (ev2, mon-voisin, x))) |
La construction échappe à la compositionalité : d'une part l'indéfini ne peut acquérir une interprétation de quantifieur universel que parce qu'il est dans la portée de ‘si’, et d'autre part, le quantifieur universel doit avoir portée sur l'ensemble de la phrase.
Le recours au contexte
Dans les cas suivants, la compositionalité peut être maintenue, à condition d'autoriser le recours au contexte.
– Morphologie : lunette et baionnette.
Les morphologues ont noté que l'interprétation obtenue par la combinaison des éléments (dérivation, composition) peut être insuffisante pour donner celle de l'item lexical. Si l'on prend des noms construits avec le suffixe diminutif -ET(TE), on voit que les propriétés que les objets dénotés par le mot dérivé partagent avec celles de la base sont partielles (rondeur et absence de couleur pour lunette) ou complètement sous-spécifiées linguistiquement (le lien entre la ville de Bayonne et la baionnette est historique, non linguistique). Selon le schéma général de la combinatoire, il y a donc simplement une relation non spécifiée entre les objets dénotés par le N base et ceux dénotés par le N dérivé.
– Combinatoire du prédicat et d’un argument.
La combinatoire locale d'un prédicat et d'un argument peut demander le recours à une information non exprimée. C'est le cas pour certains verbes aspectuels lorsque leur objet est un SN dénotant un objet (commencer un livre), pour lesquels il faut suppléer une variable d'activité précisée par le contexte (lire, traduire, relier etc. dans ce cas). Pour certains adjectifs épithètes, il a été proposé que l'adjectif allait chercher l'aspect de l'objet qu'il prédique dans des informations encyclopédiques associées au N et répertoriées (les 'qualia’ de Pustejovsky) : une voiture rapide est une voiture qui se déplace rapidement. Mais, comme dans le cas précédent, le schéma général de la combinatoire suppose de la sous-spécification (et non un ensemble fini d'informations liées au N). Certes, une bonne danseuse dénotera de manière privilégiée quelqu'un qui est jugé bon en tant que danseur, mais ce n'est pas obligatoire (il peut s’agir d’une bonne personne qui se trouve pra ailleurs être danseuse), et que dire d'une bonne pierre ?
– Thétique vs catégorique ?
Les phrases thétiques et les phrases catégoriques ne sont pas toujours syntaxiquement différenciées. Ainsi, la forme SN-SV de la phrase Des étudiants sont venus te voir est susceptible des deux interprétations. Le SN sujet est associé à des informations contextuelles différentes (le SN fait partie de l'information nouvelle dans l'interprétation thétique, et pas dans l'interprétation catégorique). On verra ou non la double interprétation comme un problème pour la compositionalité suivant que l'on décide que le statut informationnel / discursif du SN fait ou non partie de l'interprétation encodée dans le SN indépendamment du SV.
Les réponses dans les formalismes grammaticaux
Les réponses dépendent en partie du formalisme grammatical dans lequel on travaille.
Syntaxe et portée
La non-coïncidence entre syntaxe et portée a donné lieu à trois types de solutions :
( i ) la Forme Logique est un niveau de syntaxe ‘invisible’ qui se conforme aux relations de portée sémantique. Cette solution n’est disponible que dans un formalisme qui admet des niveaux syntaxiques différents de celui qui est effectivement réalisé.
Une solution analogue peut être donnée pour l’affixe syntagmatique. On considère alors que l’unité syntaxique n’a pas à coïncider avec le mot, et l’affixe n’est pas syntaxiquement attaché au mot hôte. La solution n’est donc disponible que dans les formalismes qui n’adoptent pas le lexicalisme (dans lesquels un nœud peut dominer une catégorie vide, ou des traits sans matériel morpho-phonologique, ou une partie de mot).
( ii ) le ‘Cooper store’ suppose que des constituants syntaxiques sont partiellement interprétés, certains éléments étant transmis au constituant supérieur jusqu'à ce qu'ils ‘atteignent’ le constituant où ils prennent leur portée.
Cette solution est surtout utilisée dans des formalismes qui représentent les objets linguistiques comme des structures de traits. L’information non interprétée localement peut être alors « partagée » par des nœuds dominants (selon des modalités définies par des principes explicites).
( iii ) les représentations sous-spécifiées pour les portées permettent de donner une seule représentation grammaticale pour des phrases ambiguës comme (3). Cette représentation est spécifiée (résolue) par d'autres règles (‘minimal recursion semantics’).
Cette solution suppose que l’on accorde un rôle sémantique important à des règles qui n’appartiennent pas à la grammaire proprement dite. D’une manière générale, elle construit l’articulation entre syntaxe et sémantique de manière plus souple que l’on ne l’envisage dans les deux solutions précédentes.
Le recours au contexte
Dans quelle mesure la compositionalité est-elle compatible avec le recours au contexte ? Dans les exemples concernant le contexte non linguistique, la construction lexicale ou la combinatoire prédicat-argument fait apparaître une variable de propriété. Donc, la façon dont se combinent les différents éléments est prévue de manière compositionnelle, mais l'interprétation n'est pas n’est pas complète ; de plus, ce n’est pas une fonction dans la mesure où différentes relations venant du contexte peuvent se substituer à cette variable. Ainsi c'est une bonne pierre se lit (si ceci est associé à l'indice ‘i’) ‘pierre (i) & (bon (i) (R))’, où R peut se résoudre en ‘pour faire des ricochets / s'asseoir / briser la vitre / faire du feu’ etc.
Comme dans le cas de la portée, si l'on tient absolument à maintenir la compositionalité, on a la ressource de dire que la grammaire elle-même fournit une interprétation sous-spécifiée.
Références
- sur la notion de compositionalité : Partee, B. 1984. Compositionality in F. Landman et F. Veltman, Varieties of Formal Semantics, 281-311. Dordrecht: Foris (repris dans Partee 2004, Compositionality in Formal Semantics, Oxford : Blackwell) ; JoLLI 2001, P. Pagin et D. Westerstahl (eds), Compositionality, avec, en particulier l'article de Pelletier, F. J. Did Frege Believe Frege's Principle ?, 87-114.
- sur les phénomènes linguistiques problématiques (voir les fiches de renvois) : sur les idiomes : Abeillé, A. 1994. The Flexibility of French idioms, in A. Schenk et E. van der Linden, Idioms, Hillsdale : Lawrence Erlbaum ass. ; Nunberg G., I. A. Sag et T. Wasow. 1994. Idioms, Language 70 : 491-538. sur les affixes syntagmatiques : Miller, P. 1992. Clitics and Constituents in French Grammar, New-York : Garland. sur les mots en -ette : Corbin D., G. Dal et M. Temple. 1993. D'où viennent les sens a priori figurés des mots construits? Variations sur lunette(s), ébéniste et les adjectifs en -esque, Verbum 1993 1-3 : 65-100 ; Fradin, B. 2003. Le Traitement de la suffixation en -ET, Langages 152 : 51-77. sur les combinatoires lexicales : Godard, D. et J. Jayez.1993. Towards a Proper Treatment of Coercion Phenomena. 6th Conference of the ACL 168-177. OTS, Utrecht U., Holl ; Pustejovsky, J. 1995. The Generative Lexicon, Cambridge, Mass. : The MIT Press ; Szabó, Z. G. 2001. Adjectives in context, in R. Harnish et I. Kenesi (eds), Perspectives in Semantics, Pragmatics and Discourse, 119-146. Amsterdam : J. Benjamins.
- sur la prosodie et l'information : Beyssade, C., E. Delais-Roussarie, J. Doetjes, J-M. Marandin, et A. Rialland. 2004. Prosody and information in French, in F. Corblin et H. de Swart (eds), Handbook of French Semantics, 477-253. Stanford : CSLI Publ.
Renvois
- concordance négative,
- contexte,
- donkey sentence,
- métaphore,
- portée,
- structure informationnelle,
- thétique / catégorique,
- expression du temps,
- quantification,
et traitement de la quantification dans diverses théories linguistiques: