Référent de discours : Différence entre versions
m (→Formalisation(s) en sémantique dynamique : correction formules TeX) |
m (→Références bibliographiques : mise en forme biblio) |
||
Ligne 265 : | Ligne 265 : | ||
==Références bibliographiques== | ==Références bibliographiques== | ||
− | + | <div class="biblio"> | |
* Asher, N. (1993). ''Reference to Abstract Objects in Discourse''. Kluwer, Dordrecht. | * Asher, N. (1993). ''Reference to Abstract Objects in Discourse''. Kluwer, Dordrecht. | ||
Ligne 283 : | Ligne 283 : | ||
* Roberts, C. (1989). Modal subordination and pronominal anaphora in discourse. ''Linguistics & Philosophy'', 12(6):683–721. | * Roberts, C. (1989). Modal subordination and pronominal anaphora in discourse. ''Linguistics & Philosophy'', 12(6):683–721. | ||
− | + | </div> | |
==Renvois== | ==Renvois== |
Version du 29 juin 2006 à 16:25
par Laurent Roussarie |
Le terme de référents de discours (discourse referents)
apparaît initialement dans l'article homonyme de Karttunen (1976). Cette notion, dès lors qu'on la définit précisément, est souvent vue comme annonciatrice de la sémantique dynamique : Heim (1982) prend d'ailleurs soin d'établir une
comparaison et une analogie avec des éléments de sa propre analyse;
parallèlement, dès Kamp (1981), les référents de discours
constituent une part fondamentale du vocabulaire de la DRT. Le présent article se présente donc globalement comme un essai de définition de la notion de référent de discours en reprenant d'abord les observations et descriptions de Karttunen (qui sont, somme toute, principalement empiriques) puis en resituant formellement la notion dans un cadre de sémantique dynamique et, se faisant, en proposant une vision explicative plus générale du phénomène.
Relecture en cours
Les commentaires des relecteurs de cet article n'ont pas encore été intégrés. Il n'est peut-être donc pas dans sa forme définitive. |
Sommaire
Définition
Référence de discours vs référence
Karttunen insiste tout d'abord sur le fait que les référents de discours ne sont pas des référents (au sens strict et habituel du terme). En premier lieu, il importe donc fondamentalement de mettre en regard ces deux notions et ce qui les oppose en faisant un rappel sur le traitement de la référence en sémantique formelle.
Dans une acception large, la référence coïncide avec la dénotation de Frege (référence est d'ailleurs une traduction possible de Bedeutung) : le référent d'une expression est cet objet du monde que désigne l'expression, et on appellera référence la propriété de l'expression à posséder ce référent. Cependant, dans une approche montagovienne, on admet que toute expression interprétable de la langue possède, par compositionnalité, une valeur sémantique (souvent notée entre <math>[\![\; ]\!]</math>) assimilée à sa dénotation; et, avec la théorie des types, cette valeur peut être particulièrement abstraite (par exemple un quantificateur généralisé dénote un objet de type <math>\langle\langle e,t\rangle, t\rangle</math>, ie une famille d'ensembles d'individus). C'est pourquoi il devient utile de réserver une acception plus étroite à référence et référent : on parle de référents (au sens étroit donc) seulement pour les expressions dénotant un individu (un objet de type <math>e</math>) qui existe réellement. La référence est donc un lien contingent entre une expression et un objet élémentaire du modèle (ou du monde). Cela permet ainsi de tracer une distinction précise, parmi les groupes nominaux notamment, entre les expressions dites référentielles et les autres (voir à ce sujet Lyons (1977), Ch. 7, pour une discussion détaillée).
A partir de là, on peut au moins concevoir clairement ce que ne sont pas les référents de discours : ce ne sont pas des entités du monde (donc extralinguistiques), et partant, ils constituent plutôt un dispositif formel inhérent au système d'analyse sémantique. Reste maintenant à voir ce qu'ils sont positivement.
Référence de discours et coréférence
La principale propriété caractéristique que Karttunen invoque met en jeu la notion de coréférence ; c'est la motivation première de l'émergence du concept de référent de discours. En effet, si la coréférence (par exemple entre un groupe nominal et un pronom) se fonde sur une identité de référents, alors seuls les groupes nominaux référentiels (au sens strict) peuvent intervenir dans ce type de relation.
Cependant, les données linguistiques montrent que les choses sont loin d'être si simples. Notons d'abord que si l'on analyse (« à l'ancienne »1) les indéfinis au moyen d'une quantification existentielle, alors ils ne sont pas référentiels et ils ne devraient donc pas pouvoir entrer en relation de coréférence, ce qui est bien sûr contraire à la réalité (1). D'un autre côté et indépendamment de toute hypothèse sur l'analyse logique des indéfinis, on sait également que, dans certaines configurations, les indéfinis échappent à la possibilité de coréférence (2).
- (1) Bill a une voiture. Elle est noire.
- (2) Bill n'a pas vu une licorne. *Elle a une crinière dorée.
Ce genre de données a amené Karttunen à poser le critère suivant, introduisant la notion centrale de son article (je traduis) :
- Considérons que l'apparition d'un groupe nominal indéfini établit un référent de discours simplement lorsqu'il justifie l'occurrence d'un pronom ou d'un groupe nominal défini coréférentiel plus tard dans le texte. (Karttunen 1976).
Et comme le souligne Karttunen, la coréférence est bien un problème linguistique (et non extralinguistique) puisqu'elle dépend en grande partie de configurations discursives. On peut alors proposer la synthèse suivante :
- Un référent de discours est un outil (on pourrait même dire : un artifice) formel de l'analyse sémantique qui explicite et (eventuellement) valide les relations de coréférence entre groupes nominaux. Deux groupes nominaux sont coréférentiels s'ils établissent des référents de discours et que ceux-ci sont identiques (ou identifiés l'un à l'autre).
Si nous n'avons pas encore là une définition pleinement satisfaisante, nous avons une caractérisation claire. La coréférence ne détermine pas les référents de discours, mais elle est le temoin de leur présence. A ce stade de la discussion et pour compléter les observations, il convient de décrire systématiquement quelles sont les conditions « d'établissement » (pour reprendre le vocabulaire de Karttunen) des référents de discours (ce que nous allons voir dans la section suivante), puis de proposer une explication de ces conditions (ce que la sémantique dynamique accomplit comme nous le verrons infra).
Propriétés
L'essentiel de l'article de Karttunen est une exposition des différentes configurations qui permettent ou non la coréférence des groupes nominaux indéfinis, et donc l'établissement de référents de discours. Si les exemples (1) et (2) semblent illustrer des données bien connues, il met en avant un certain nombre d'autres contextes qu'il résume de la manière suivante :
- [...] en général, un GN indéfini établit un référent de discours permanent simplement lorsque le quantificateur qui lui est associé est attaché à une phrase qui est prise comme (ie assertée, impliquée ou présupposée) vraie et qu'aucun autre quantificateur n'est mis en jeu plus haut dans la structure du texte. (Karttunen 1976).
Par quantificateur associé, Karttunen entend le quantificateur existentiel qui lie le contenu de l'indéfini ; quant aux quantificateurs « plus haut » il s'agit de quantificateurs forts (tout, toujours, souvent, peu...) auxquels on peut également ajouter les opérateurs modaux.
Ainsi lorsque l'indéfini (ou l'existentiel) est sous la portée d'une négation (comme en (2)), la proposition où il figure n'est pas considérée comme assertée vraie, et donc il n'établit pas de référent de discours. Le cas des indéfinis spécifiques est traité en postulant une portée haute de l'existentiel, qui se retrouve alors « asserté » vrai.
- (3) Bill n'a pas vu une coquille dans le manuscript. Elle était pourtant énorme.
- glose: il existe une coquille dans le manuscript que Bill n'a pas vue…
De même, la seconde partie de la généralisation ci-dessus, exclut l'établissement d'un référent de discours si l'indéfini est sous la portée d'un autre quantificateur. D'où l'ambiguïté en (4):
- (4) Bill visite un musée tous les jours.
La généralisation rend également compte des cas où l'indéfini se situe dans une proposition enchâssée par un verbe d'attitude propositionnelle comme vouloir ou souhaiter, car cette proposition n'est alors pas présentée comme vraie. Et aucun référent de discours n'est alors établi (sauf, toujours, dans les cas de lectures spécifiques ou, peut-être, de re).
- (5) Bill veux attrapper un poisson. *Tu peux voir le poisson d'ici ?
Mais lorsque le verbe de la matrice est implicatif (qui implique la vérité de la complétive) comme réussir, se souvenir, etc. ou factif (qui présuppose la vérité de la complétive) comme savoir, regretter, etc., alors la généralisation prédit l'établissement d'un référent de discours :
- (6) Jean a réussi à trouver un appartement. L'appartement a un balcon.
- (7) Jean sait que Marie possède une voiture, mais il ne l'a jamais vue.
Enfin, toujours pour les mêmes raisons, lorsque l'indéfini se situe sous une force illocutoire non assertive, la coréférence n'est pas possible :
- (8) Est-ce que Jean a une voiture ? *C'est une Mustang.
- (9) Donnez-moi un hotdog, s'il vous plait. *Il a l'air délicieux.
Bien que robuste, cette généralisation admet des exceptions, comme le signale Karttunen, avec le cas des référents de discours éphémères (short-term). De tels référents persistent, provisoirement, lorsque l'expression coréférentielle se trouve elle-même sous la portée d'une quantification ou d'une modalité similaire à celle qui porte sur l'indéfini antécédent.
- (10) Harvey drague une fille à chaque convention. Et elle vient toujours au banquet avec lui.
- (11) Marie veut épouser un homme riche. Il devra être banquier.
- (12) Tu dois écrire une lettre à tes parents. Il faudra la poster avant 19h.
On sait, depuis Roberts (1989), que ces données correspondent au phénomène de subordination modale, qui trouve une analyse précise en sémantique dynamique (DRT).
Formalisation(s) en sémantique dynamique
Karttunen ne propose pas une théorie sémantique, ni même un formalisme qui intégrerait les référents de discours. Cependant les problèmes que cette notion soulève sont au cœur de certaines préoccupations de la sémantique dynamique (les donkey sentences peuvent d'ailleurs être vues comme un cas particulier de référents éphémères). Il est donc naturel que les formalismes de théories comme la DRT de Kamp ou la File Change Semantics de Heim incorpore des éléments qui d'une manière ou d'une autre implémentent la réalité sémantique qui sous-tend la notion de référent de discours.
Afin de présenter la dynamique des référents de discours sous cet angle formel, récapitulons les points vus ci-dessus. D'abord les référents de discours ne sont pas des entités du modèle. Ce ne sont pas non plus des parties de la grammaire (du moins au niveau des formes de surface de la langue). Par conséquent ils interviennent dans la théorie à un niveau d'analyse intermédiaire entre la syntaxe et le modèle, ce qui correspond justement aux niveaux de représentation sémantique que sont les DRS de Kamp ou les formes logiques ou les fichiers de Heim. Ensuite une analyse des indéfinis via une quantification existentielle sur une variable (comme dans la tradition logique montagovienne) est incompatible (ou au moins orthogonale) avec les référents de discours puisque, pour des raisons de portée, elle ne permet pas, compositionnellement, de lier et d'identifier les variables introduite par l'indéfini et l'expression coréférentielle quand elle est dans une autre phrase. Ainsi (1) s'analyserait inadéquatement en (1a) avec une variable libre pour le pronom :
- (1) Bill a une voiture. Elle est noire.
- (1a) <math>\exists x [\textrm{avoir}(b,x) \wedge \textrm{voiture}(x)] \wedge \textrm{noir}(x)</math>
L'analyse correcte attendue devrait être équivalente à (1b)
- (1b) <math>\exists x [\textrm{avoir}(b,x) \wedge \textrm{voiture}(x) \wedge \textrm{noir}(x)]</math>
C'est précisément ce que les formalismes dynamiques permettent, et nous allons voir comment (ie par quelles règles d'analyse) ils y parviennent, notamment en faisant intervenir les référents de discours2.
La DRT ne comporte pas de quantificateur (existentiel). Elle ne fait pas non plus usage à proprement parler de variables ou de constantes, qui semblent être subsumées par la catégorie d'objets formels que Kamp nomme, justement, des référents de discours3. Mais en réalité, ces référents ont un fonctionnement très proche de celui des variables en logique prédicative classique. Quant au formalisme de Heim (1982), il fait explicitement usage de variables, assorties d'indices référentiels. Et Heim propose d'assimiler les indices à la notion de référent de discours de Karttunen. Ces indices (numériques) constituent simplement le dispositif qui permet d'interpréter sémantiquement les variables (une variable non indicée n'est pas interprétable). Pour simplifier, considérons donc qu'une variable indicée <math>x_i</math> chez Heim correspond à une simple variable dynamique, en posant que l'indice sert essentiellement à identifier sémantiquement la variable. Nous pouvons donc dores et déjà anticiper la conclusion suivante :
- Les référents de discours de Karttunen sont implémentés en sémantique dynamique sous la forme de variables.
Remarquons d'ailleurs que si (1) pouvait se traduire directement en (1b), la variable <math>x</math> jouerait immédiatement un rôle de référent de discours. Mais rappelons que le passage direct et compositionnel de (1) à (1b) ne va absolument pas de soi : il n'y a priori pas de raison que le quantificateur existentiel introduit dans la première phrase puisse lier la variable de la seconde phrase.
Pour que la conclusion ci-dessus soit valide, reste à montrer en quoi les variables dynamiques vérifient les propriétés que mentionne Karttunen, c'est-à-dire à voir comment elles s'interprètent.
Pour qu'une expression qui contient une variable, ou un référent de discours, comme <math>\textrm{voiture}(x)</math>, soit interprétable, il faut que la variable <math>x</math> ait une dénotation. Comme en logique du premier ordre classique (à la Tarski), la dénotation d'une variable n'est pas donnée par le modèle, mais par une fonction d'assignation qui associe des individus du modèle aux variables. En DRT, les assignations (nommées aussi enchâssements) sont des fonctions partielles ; donc si <math>g</math> est une assignation, pour une variable <math>x</math>, <math>g(x)</math> n'est pas forcément définie. Et pour que deux référents soient proprement coréférentielles, il faut que <math>g</math> soit définie à l'endroit de ces deux occurrences et qu'elle leur assigne la même valeur. C'est ce qui se passe pour (1).
En DRT, les discours (ie suites de phrases) sont représentés sémantiquement par des DRS, qui comportent un univers (qui est un ensemble de référents de discours) et un ensemble de conditions sur des référents. Une assignation <math>g</math> est définie pour <math>x</math> à l'intérieur toute DRS chapeautée par un univers qui contient <math>x</math>. Une expression nominale, comme un indéfini ou un pronom, introduit un référent de discours dans l'univers de la DRS qui représente la phrase où l'expression apparaît. Enfin les DRS de phrases successives d'un discours sont fusionnées afin d'obtenir une structure interprétable à l'échelle du texte. C'est ce qu'illustre, avec force simplifications, l'équation (1c) pour le discours (1) (<math>\oplus</math> est l'opérateur de fusion) :
(1c) |
|
La fusion de DRS opère par union séparée des univers et des conditions. Par conséquent, dans la représentation finale de (1) en (1c), toute assignation <math>g</math> sera bien définie pour la dernière occurrence de <math>x</math> (celle donnée par la seconde phrase de (1)) puisque cette occurrence se trouve dans une DRS chapeautée par un univers qui contient <math>x</math>. L'identification de référents <math>x=y</math>, c'est-à-dire la coréférence, est donc possible. Ajoutons qu'une DRS est jugée vraie dans un modèle s'il existe au moins une assignation qui la satisfait. Donc (1c) possède la lecture existentielle attendue pour <math>x</math> (et pour <math>y</math>).
Dans (Heim 1982) les GN indéfinis introduisent des variables libres dans la forme logique de la phrase, et les pronoms introduisent des variables, libres aussi, coindicées avec l'antécédent. Ainsi (1) est traduit en (1d) :
- (1d) <math>\textrm{avoir}(b,x_1) \wedge \textrm{voiture}(x_1) \wedge \textrm{noir}(x_1)</math>
Ensuite, pour que (1d) soit interprétable, une règle de clôture existentielle est appliquée au niveau du texte entier. Cette règle consiste, entre autres, à ajouter un quantificateur existentiel à l'initiale de la représentation liant toutes les variables libres (sauf celles uniquement issues des pronoms et des traces). Ainsi (1d) « devient » (1b) qui, comme annoncé, permet bien la coréférence attendue (ici les variables s'interprète au moyen d'une fonction d'assignation de manière relativement stantard).
- (1b) <math>\exists x_1 [\textrm{avoir}(b,x_1) \wedge \textrm{voiture}(x_1) \wedge \textrm{noir}(x_1)]</math>
Ce que montrent ces deux illustrations de traitements sémantiques de (1), c'est que, en posant des règles d'interprétations idoines, la notion de référent de discours coïncide alors parfaitement avec celle de variable. Il se trouve juste que, dans ces théories, les variables sont (et doivent être) interprétées dynamiquement.
Il est important de noter une conséquence de cela : dans toutes les théories dynamiques, et ce contrairement à ce que suggérait Karttunen, toute expression nominale, quelle qu'elle soit, introduit un référent de discours. Les cas de coréférences impossibles présentées dans la section précédente s'expliquent par des phénomènes de « blocages » induit par d'autres éléments de la phrase. En DRT, les constituants qui interviennent sous la portée d'un opérateur comme la négation ou l'implication (ou une structure dite duplex) induite par une quantification, sont représentés par des DRS subordonnées à une DRS incluante (celle qui représente globalement la phrase analysée). Ces sous-DRS peuvent être interprétées normalement grâce à une assignation qui sera définie pour leurs référents locaux, mais par les règles d'interprétation des opérateurs en question, cette assignation est ensuite « oubliée » (et même « occultée ») à l'extérieur de la sous-DRS (notons qu'en ces termes, je ne fais que reformuler la classique contrainte d'accessibilité des référents de la DRT). C'est ce que montre (2a), représentation de (2) :
(2a) |
|
Ici, la dernière occurrence de <math>x</math> n'a pas de valeur définie, par aucune assignation, au niveau de la DRS globale. (2a) (qui fait l'hypothèse de la coréférence) n'est, en fait, pas interprétable. Il en va de même pour les effets bloquants des quantifications (voir l'entrée DRT pour des précisions sur la sémantique de la négation et de la quantification dans cette théorie).
Chez Heim, le principe est assez similaire. La règle de clôture existentielle a une seconde partie qui insère une quantification existentielle « sous » chaque opérateur de type quantificationnel (incluant la négation). Ainsi chaque variable libre (ie GN indéfini) apparaissant (libre) sous la portée d'un quantificateur fort se retrouve lié par un quantificateur existentiel qui lui-même covarie avec le quantificateur fort. La variable liée est alors « emprisonnée » dans la portée du quantificateur existentiel, ce qui lui interdit toute coréférence subséquente. L'analyse de (4′) (en simplifiant grossièrement le traitement temporel) illustre par étapes ce phénomène :
- (4′) Bill viste un musée chaque jour. *C'est le Louvre. (lecture non spécifique)
- (4′a) <math>\forall x_1 [\textrm{jour}(x_1) \rightarrow [\textrm{visiter}(b,y_2,x_1) \wedge \mbox{musée}(y_2)]] \wedge \textrm{Louvre}(y_2)</math> (forme logique)
- (4′b) <math>\exists \emptyset [\forall x_1 \exists y_2 [\textrm{jour}(x_1) \rightarrow [\textrm{visiter}(b,y_2,x_1) \wedge \mbox{musée}(y_2)]] \wedge \textrm{Louvre}(y_2)]</math> (clôture existentielle)
Il n'y a aucune raison ici que la dernière occurrence de <math>y_2</math> ait la même valeur que les précédentes (en fait, elle ne pourrait avoir qu'une interprétation déictique, ce qui probablement est incorrect).
Enfin les cas de référents éphémères, comme en (10-12), sont traités par le mécanisme de subordination modale élaboré par (Roberts 1989), qui exploite et généralise la règle d'interprétation des conditionnelles (ie implications) en DRT (voir DRT et donkey sentences). Ce mécanisme prévoit de fusionner la DRS qui contient l'expression coréférentielle dans une DRS qui se trouve sous la portée de l'opérateur quantificationnel introduit précédemment dans le discours. Comme l'expression (indéfinie) qui introduit le premier référent de discours est elle aussi dans cette portée, la coréférence sera possible car les référents seront valués par la même assignation. Cette subordination opère donc en se dérobant à l'effet bloquant illustré en (2a).
Conclusion
Les référents de discours sont des variables interprétées dynamiquement. Elles permettent d'établir une notion référence possiblement provisoire, et donc virtuelle (en particulier lorsqu'elle est « enfermée » dans la portée d'un quantificateur). C'est la référence de discours. La règle de clôture existentielle (qui est implicte dans l'interprétation et la fusion de la DRT et qui s'incarne dans la contrainte d'acessibilité des référents) permet de faire perdurer cette référence de phrases en phrases dans un discours, et ainsi de donner une analyse relativement satisfaisante des indéfinis.
Pour terminer, mentionnons que, si ce qui précède s'est concentré sur les GN indéfinis et les pronoms, ce ne sont pas les seuls catégories linguistiques à mettre en jeu des référents de discours dans l'analyse sémantique. Les GN définis (notamment dans l'approche de Heim (1982)) introduisent eux aussi le même genre de référents, avec seulement des contraintes sémantiques et des conditions de félicité différentes. D'autre part, il est devenu usuel, en particulier en DRT, de faire intervenir des référents de discours dans le domaine verbal et adverbial pour représenter des temps et des événements (voir entre autres (Partee 1984)). Enfin, Asher (1993) utilise de même des référents d'entités d'ordre supérieur comme, par exemple, les faits et les propositions. On peut envisager d'autres usages, du moment que l'on s'en tient à la définition rappelée ici, c'est-à-dire de considérer les référents de discours comme des variables dynamiques dont la valeur (donnée par une assignation) est ou non disponible dans la suite du texte en fonction des configurations sémantiques dans lesquelles elles apparaissent.
Notes
1 Comprendre : l'analyse russellienne des indéfinis.
2 Remarquons cependant que (1b) illustre la proposition d'analyse de (Geach 1962) citée et revisitée par (Heim 1982). De plus la Dynamic Predicate Logic (DPL) de (Groenendijk & Stokhof 1991) donne une analyse formulée comme en (1a) mais avec des règles d'interprétation sémantiques assez similaires à celles présentées ci-dessous.
3 Il faut cependant préciser que dans les écrits récents présentant la DRT, Kamp définit explicitement les référents de discours comme des variables.
Références bibliographiques
- Asher, N. (1993). Reference to Abstract Objects in Discourse. Kluwer, Dordrecht.
- Heim, I. (1982). The Semantics of Definite and Indefinite Noun Phrases in English. PhD thesis, University of Massachussetts, Amherst.
- Geach, P. T. (1962). Reference and Generality. Cornell University Press, Ithaca, NY.
- Groenendijk, J. & Stokhof, M. (1991). Dynamic predicate logic. Linguistics & Philosophy, 14(1):39-100.
- Kamp, H. (1981). A theory of truth and semantic representation. In Groenendijk, J. A. G., Janssen, T. M. V., and Stokhof, M. B. J., editors, Formal Methods in the Study of Language. Part1, pages 277–322. Mathematical Centre Tract, Amsterdam.
- Karttunen, L. (1976). Discourse referents. In McCawley, J. D., editor, Notes from the Linguistic Underground, volume 7 of Syntax and Semantics, pages 363–386. Academic Press, New York.
- Lyons, J. (1977). Semantics I. Cambridge University Press, Cambridge. Trad. fr. Eléments de sémantique, Langue et langage, Paris : Larousse, 1977.
- Partee, B. (1984). Nominal and temporal anaphora. Linguistics & Philosophy, 7(3):243-286.
- Roberts, C. (1989). Modal subordination and pronominal anaphora in discourse. Linguistics & Philosophy, 12(6):683–721.