Primitives
par Patrick Saint-Dizier |
En cours de rédaction | |
Cet article est actuellement en cours de rédaction par son auteur. Veuillez en tenir compte à la lecture. |
Sommaire
Situation
Il est particulièrement délicat de définir la notion de primitive, en dehors d'une définition vague, basée sur l'éthymologie du terme: 'ce qui est premier, ou a un tel caractère'. Cette notion a suscité de nombreux débats depuis l'antiquité, sur son existence même.
Cette notion apparaît en fait être largement relative aux connaissances d'une époque, mais aussi à un niveau de granularité de l'analyse que l'on entreprend, et probablement aussi relative à la vision théorique que l'on a du modèle que l'on veut développer. L'exemple de la physique de l'atome est assez éclairant sur ce sujet: des nombreuses particules, postulées indivisibles, des siècles passés, la physique a évolué vers l'atome, avec la triade électron-proton-neutron. A l'heure actuelle, cette vision est bien désuète, avec l'introduction, par exemple, des Quarcks et des Bosons, témoins de variations d'énergie, ainsi qu'avec les équivalences entre énérgie et matière qui sont à leur tour postulées comme phénomènes primitifs. Il en va ainsi dans de nombreux domaines, y compris en philosophie, domaines qui ont, du reste, plus ou moins emprunté cette vision à la physique.
La langue n'échappe pas à ce caractère relatif ainsi qu'aux discussions sur l'existence et le statut épistémologique des primitives. Ces dernières décennies ont vu des mouvements forts en faveur des primitives, puis des réactions aussi fortes contre, basées sur un argument facile: l'impossibilité de définir une bonne fois pour toutes et in extenso de tels objets. Il apparaît alors ici une petite confusion entre primitives et universaux, objets qui n'ont pas le même rôle.
Faute d'un meilleur modèle, suffisemment expressif, les langages à base de primitives pour décrire le sens de mots ou de constructions sont relativement bien acceptés et se sont stabilisés. Ceux-ci sont à présent considérés comme un effort de conceptualisation et d'organisation de connaissances autour d'un petit nombre d'éléments abstraits, postulés non décomposables. Les primitives peuvent toutefois être aussi considérées comme des 'macros' qui pourront être interprétées plus finement dans des domaines donnés, par exemple la géométrie Euclidienne pour les primitives spatiales. Ces primitives sont alors postulées comme telles par rapport à un objet d'étude (par exemple la linguistique) ou par rapport à un domaine particulier.
Le concept de primitive doit lui-même être contextualisé, il dépend du cadre théorique et conceptuel dans lequel l'on s'inscrit, il dépend aussi des objectifs que l'on se donne, ainsi que du niveau d'abstraction et de granularité que l'on souhaite atteindre. Un langage à base de primitives est donc une spécification à caractère formel et explicite d'une conceptualisation partagée d'un ensemble de connaissances. Tout comme une ontologie, qui a aussi un certain caractère 'primitif', mais beaucoup plus faible, un langage à base de primitives introduit plusieurs types d'éléments primitifs: des éléments/entités de base, des relations, des fonctions, des axiomes, des contraintes de divers types, etc. Dans la définition ci-dessus, le terme partagé indique le caractère consensuel du vocabulaire, des objectifs et de la précision de l'analyse. Le terme conceptualisation indique un objectif intentionnel, lié à une préoccupation opérationelle.
En linguistique, et plus particulièrement en sémantique, il existe de nombreux systèmes à base de primitives. On en retrouve certains dans d'autres fiches présentées ici: c'est par exemple le cas des rôles thématiques et des réseaux sémantiques. C'est aussi le cas de relations structurantes telles que celles de la sémantique lexicale: synonymie, antynomies, taxinomie, méronomies, etc. qui sont postulées comme relation primitive structurant des concepts. On le voit: les primitives structurent nombre de niveaux et d'activités langagières.
Dans la suite de cette fiche, nous proposons deux éclairages assez contrastés de cette notion de primitive. Nous traitons tout d'abord des primitives dans l'approche décompositionelle du sens, puis de celle rencontrée dans le langage de la structure lexicale conceptuelle (LCS). Ceci n'est bien sûr pas exclusif. On notera comment se construisent des systèmes efficaces de représentation du sens à partir d'ensembles limités de primitives.
L'approche décompositionelle du sens en primitives sémantiques
Avec l'objectif d'associer une sémantique à la syntaxe générative, Katz et Fodor (1963) ont développé une argumentation proposant que le sens des mots pouvait être représenté par un ensemble structuré de primitives sémantiques. Ainsi, femme était-il représenté par trois traits distinctifs: +humain +feminin +adulte. Le terme 'décompositionel' caractérise donc cette démarche analytique qui décompose une unité complexe en unités postulées élémentaires.
Cette approche décompose les sens en des éléments primitifs supposés être universaux et indépendants des langues. Elle conduit à la recherche de l'ensemble des primitives sémantiques nécéssaires à la description des sens des mots de la langue. Cette quête a été en particulier relayée par R. Shank. Le résultat est la définition, au moins provisoire, de 11 primitives décrivant les différentes facettes de l'action. Parmi celles-ci, citons:
PROPEL: application d'une force physique à un objet
MOVE: déplacer une partie d'un objet
ATRANS: changement dans une relation abstraite par rapport à un objet, par exemple un changement de possession
MTRANS: créer ou combiner des pensées.
etc.
Le système créé contient aussi des primitives pour les objets (HAND, MOUTH, HEALTH, etc.), les états (INGESTED, SICK), et des phénomènes généraux tels que le temps, le lieu, la causalité. G. Miller et P. Johnson-Laird ont alors tenté de donner une base psychologique à ces primitives. Ils ont établi que nombre de ces primitives pouvaient être décomposées en des notions plus élémentaires. A travers WordNet, il est apparu, par exemple, que les verbes pouvaient être classés, de façon non univoque, en différents groupes: verbes de mouvement, de transfert de possession, de communication, etc. Ce travail a aussi permis de mieux percevoir que les humains structuraient leurs concepts selon plusieurs strates, telles que le temps, l'espace, la possibilité, la causativité, l'intention, etc.
A travers cette première analyse, on voit que le champ des primitives interagit avec de nombreuses autres considérations, elles mêmes parfois préoccupées par une démarche à base de primitives: des classifications, des champs conceptuels, etc.
Outre les travaux de M. Minsky et de R. Shank avec la notion de frame, cette approche a donné lieu à la définition des réseaux sémantiques.
Cette vision de la notion de sens a été complétée entre autres par les travaux de Fodor et ali. sur la notion de postulat de signification, selon lequel le sens d'un terme et sa compréhension dans un contexte d'énonciation donné se fait par le biais de règles d'inférence qui expriment les conséquences nécéssaires de l'énoncé sur le monde usuel. Ces postulats de signification s'appliquent non pas sur les mots eux-mêmes mais sur une certaine image mentale, générique, basée sur des primitives.
Enfin, pour clore ce point, L. Wittgenstein puis H. Putman on noté qu'il n'était pas toujours possible, voire même souhaitable, de ramener un sens à un ensemble de conditions nécéssaires et suffisantes. Ils ont alors introduit plusieurs notions, dont celle de prototype. Cet ajout, plutôt descriptif qu'explicatif, permet de mettre en lumière les composants caractéristiques autant que les composants nécéssaires d'une unité de sens.
La structure lexicale conceptuelle
La LCS est une forme de représentation du sens assez élaborée, avec une forte marque conceptuelle. Elle a pour vocation, de par sa forme, à représenter la composante prédicative du sens d'un mot (le reste pouvant être traité, par exemple, par le biais de systèmes de traits ou par des échelles proportionelles). Elle provient en bonne part d'une representation plus schématique, les 'Lexical Semantics Templates' et s'inspire fortement des catégorisations de (Gruber 65). La forme actuelle a gagné sa popularité sous l'impulsion de R. Jackendoff (Jackendoff 83, 90). La LCS est utilisée pour décrire le sens de mots et de propositions, elle diffère donc des systèmes à base de frames, dédiés à la description de situations du monde.
Examinons à présent le langage de la LCS. Celui-ci a son origine autour de la modélisation de la notion de déplacement. Les autres champs conceptuels auxquels la LCS s'applique assez naturellement sont dérivés par analogie, comme le transfert de possession ou la communication.
La LCS est formée de trois types d'objets conceptuels: les catégories conceptuelles, les primitives et les champs sémantiques. A ceci s'ajoutent bien sûr les variables conceptuelles. Il n'y a pas de formes de quantification, mais il est possible de l'ajouter lorsque l'on traite de propositions. Chaque élément pris à part est relativement simple, la puissance de la LCS vient de leur combinatoire.
Les catégories conceptuelles définissent un ensemble restreint et générique de catégories ontologiques, aussi appelées parties conceptuelles du discours. On compte parmi elles : entités, événements, états, lieux, chemins, propriétés, but, manière, quantité, temps, etc. Lors de l'analyse d'une phrase, ces catégories subsument en générale les restrictions de sélection imposées sur les arguments des prédicats. La phrase:
la réunion a lieu à Toulouse
se catégorise alors en:
[evenement [evenement LA REUNION ] a lieu [lieu à TOULOUSE ] ]
Les primitives conceptuelles sont structurées en deux niveaux: un niveau très général, qui caratérise: les états (BE), les changements (GO), et la cause (CAUSE). D'autres primitives, en plus grand nombre (nous en avons dénombré 65), représentent des dimensions circonstancielles (FROM, TO, ON, AT, AWAY-FROM, etc.).
Les champs sémantiques, quant à eux, caractérisent les domaines auxquels s'appliquent les primitives. Les domaines essentiels sont: la lieu (codé +loc), le temps (+temp), la possession (+poss), l'épistémique (+epist), la psychologique (+psy) et les propriétés constitutives (+car,+ident).
La puissance de la LCS réside alors dans la combinatoire de ces trois classes de primitives. Nous l'évoquons ici rapidement, à titre d'illustration. Une primitive telle que GO peut être appliquée à de nombreux champs sémantiques. Ainsi, un changement de lieu sera-t-il représenté par GO+loc, un changement de possession par GO+poss, etc. BE+psy caractérise un état psychologique. CAUSE n'est pas combinée à de tels champs.
Une primitive conceptuelle est alors une fonction partielle sur les catégories conceptuelles et les champs sémantiques. Ainsi, on définit:
GO: entité x chemin --> événement
TO: entité OU lien --> chemin
GO+loc: entité x (chemin OU lieu) --> événement
Plusieurs conditions de bonne formation et de cohérence régissent l'établissement des formules bien formées de la LCS. Sans rentrer dans les détails ici (voir Saint-Dizier 99), un verbe tel que donner (X donne Y à Z) est représenté comme suit:
[evenement CAUSE([entité X ], [evenement GO+poss([entité Y ], [chemin FROM+poss([entité X ], TO+poss([entité Z ])])]
ce qui se paraphrase en: X est la cause que Y va de X à Z. On notera que des verbes tels que offrir ont cette même représentation. La difference entre donner et offrir ne pouvant être traitée par ce type de représentation, elle fait davantage apparaître des éléments psychologiques, représentables, peut-être, par le biais de séries proportionelles ou une paire attribut-valeur. Une formule symmétrique représente prendre et voler.
Quelques références
Gruber, J.S., Lexical Structures in Syntax and Semantics, North Holland, 1976 (de 1965).
Jackendoff, R., Semantics and Cognition, MIT Press, 1983.
Jackendoff, R., Semantic Structures, MIT Press, 1990.
Katz, J.J., Fodor, J.A., The structure of a semantic theory, language 39, 1963, inclut dans un readings 'structure of language' Prentice hall 1964.
Talmy, L., Toward a cognitive semantics, vol 1 et 2, MIT Press, 2001