Unification

De Sémanticlopédie
Aller à : navigation, rechercher
par Philippe Muller


L'unification est une opération qui consiste à combiner deux sources d'informations, deux structures, pour vérifier si elles sont compatibles et peuvent correspondre à un même objet. Si c'est le cas, le résultat de cette opération est une information qui combinent les deux sources en une seule. L'unification est beaucoup utilisée dans les grammaires où les éléments du lexique sont représentées par des matrices d'attributs-valeurs, appelées encore structures de traits (feature structure en anglais), ce qui a donné le nom générique de « grammaires d'unification » à cette famille de formalismes, comprenant GPSG, LFG, HPSG. Par exemple, si l'on veut coder le genre et le nombre pour une entrée lexicale (déterminant, nom, pronom, adjectif...), une structure comprendra un trait genre avec comme valeurs possibles masculin/féminin, et un trait nombre ayant pour valeur singulier ou pluriel. On représentera ces structures comme suit (par exemple pour "chien") :

St ex1.png


Pour exprimer les contraintes d'accord (entre déterminant et nom par exemple) on peut donc vérifier que ces structures sont identiques pour chaque valeur. Mais certaines entrées peuvent correspondre à plusieurs cas d'accord, comme le déterminant pluriel "les" qui est masculin ou féminin. Plutôt que de dupliquer les entrées on peut avoir des stuctures sous-spécifiées , avec des traits qui ne sont pas instanciés.

St ex2.png

Pour vérifier que l'accord est possible, et aussi pour déterminer le genre et le nombre de la structure combinant les deux items lexicaux (par exemple le SN "les chiens"), on va unifier les deux structures si cela est possible. Unifier correspond alors à trouver l'information qui combine les deux informations si elles sont compatibles, et rien de plus. Dans notre exemple l'une des deux structures (la première) est plus spécifique que l'autre (elle a la même information avec quelque chose en plus), c'est donc elle qui est le résultat de la combinaison. Cette notion de quantité d'information différente est capturée par la notion de subsomption d'information :

[Subsomption] Une structure <math>S_1</math> subsume une autre <math>S_2</math> si tout l'information contenue dans <math>S_1</math> est aussi dans <math>S_2</math> (<math>S_1</math> est plus générale que <math>S_2</math>, <math>S_2</math> est plus spécifique que <math>S_1</math>)

Cette relation est une relation d'ordre partiel (cf Structures d'ordre.) L'unification de deux structures <math>S_1</math> et <math>S_2</math> correspond à la fusion des informations qu'elles contiennent, si elles sont compatibles :

[Unification]

L'unification de <math>S_1</math> et <math>S_2</math>, si elle existe, est une <math>S_3</math> telle que <math>S_3</math> est subsumée par <math>S_1</math> et <math>S_2</math>, et <math>S_3</math> est minimale par rapport à la subsomption.

ex :

St ex3.png

Review.png
Relecture en cours
Les commentaires des relecteurs de cet article n'ont pas encore été intégrés. Il n'est peut-être donc pas dans sa forme définitive.