Réseaux sémantiques

De Sémanticlopédie
Aller à : navigation, rechercher
par Patrick Saint-Dizier


Introduction

Porphyre (234-305), commentant les catégories d’Aristote, définit les contours de ce que nous pourrions appeler de nos jours les réseaux sémantiques. En 1909, C.S. Pierce développa des graphes, dits existentiels, qui sont une première version, plus moderne, des réseaux sémantiques, avec une interprétation logique. Dans les sphères de l’intelligence artificielle, il faut attendre R. Quillian, qui, en 1966, débuta un travail important sur les réseaux sémantiques avec l’objectif de modéliser les capacités de la mémoire humaine et sa façon de traiter le langage. En 1975, apparurent les frames et les scripts (Minsky, 75) qui est sont une reformulation, dans une autre perspective, des réseaux sémantiques.

Bien qu’il existe de nombreuses variantes des réseaux sémantiques (dont, par exemple, les graphes conceptuels), celles-ci partagent toutes de nombreux points communs essentiels que nous introduisons ci-après. A l’heure actuelle, les réseaux sémantiques sont considérés, outre leur capacité à représenter de l’information, comme une facilité graphique pour représenter des contenus de type base de données. Ils offrent aussi des algorithmes efficaces pour inférer des propriétés d’un objet sur la base de son appartenance à une catégorie. Ultérieurement, les logiques de description ont repris cette vision et en ont construit un cadre plus formel.


Structure générale des réseaux sémantiques

Tout d’abord, les réseaux sémantiques peuvent représenter des objets individuels, des catégories d’objets, et des relations entre objets ou catégories. Les objets sont représentés dans des boîtes tandis que les relations étiquettent les nœuds qui relient ces objets :


Resem2.jpg


Ceci correspond à l’assertion en logique à l’application d’un prédicat sur un terme :

<math>etudiant(jean)</math>

ou bien, en théorie des ensembles:

<math>jean \in etudiant</math>.


De la même manière, l’instance de la relation :

<math>soeur-de(X,Y), soeur-de(marie, jean)</math>,

s’écrit en réseaux sémantiques par :

Ressem3.jpg

On peut alors connecter toutes sortes d’objets par les différentes relations à disposition. Cependant, les réseaux doivent être conçus de façon cohérente. Par exemple, nous savons que les humains ont des hommes (= personne-masculin) comme pères. Il n’est pas possible d’établir un lien direct entre personne et personne-masculin parce que les catégories n’ont pas de pères. Pour ce faire, il faut introduire une notation complémentaire, la double boite, qui permet de coder des énoncés du type :

<math>\forall X, X \in personne \Rightarrow [ \forall Y, a-pere(X,Y) \Rightarrow Y \in personne-masculin]</math>

Cet énoncé s’insère graphiquement dans un réseau sémantique comme suit :

Resem5.jpg

La structure d'héritage

La structure d’héritage dans les réseaux sémantiques est à la fois simple et riche : par le fait qu’elle est une personne, Marie hérite de toutes les propriétés attachées au nœud personne. L’algorithme d’héritage, à notre connaissance unique, suit les liens membre-de et sous-ensemble de (bien que ce dernier ne soit pas aussi simple qu’il ne le paraisse quant à l’héritage). La simplicité de cet algorithme et sa ‘visibilité’ graphique a été l’un des atouts majeurs des réseaux sémantiques : toute propriété des objets plus génériques est a priori héritée par l’objet plus spécifique, sans exception.

L’héritage de propriétés, on le sait, devient plus complexe lorsque un objet appartient à plus d’une catégorie, et ceci est fréquent dans des situations ‘naturelles’, on observe aussi des phénomènes dits de blocage lorsqu’une valeur à un niveau inférieur contredit une propriété qui serait héritable. Dans de nombreux environnements de l’époque des réseaux sémantiques, l’héritage multiple était tout simplement banni, dans le meilleur des cas au profit d’une notion de prototypicalité, laquelle imposait ses propriétés aux dépends des autres nœuds pères.

Une autre forme d’inférence intéressante est l’usage des liens inverses. Revenant à l’exemple ci-dessus, a-comme-sœur(Y,X) est la relation inverse de sœur-de(X,Y). Pour que ce lien inverse soit applicable, il faut qu’il corresponde à une réalité conceptuelle et dans les données.


Quelques limitations

Le lecteur attentif a pu remarquer une limitation importante des réseaux sémantiques : les relations sont uniquement binaires. Pour coder des relations d’arité supérieure, il faut passer par une notation événementielle qui relie les arguments:

<math>aller(jean, paris, toulouse)</math>

se code, via l’événement (artificiellement introduit, voir fiches sur la réification des événements et sur les rôles thématiques) e en :

<math>aller(e, jean) \wedge depart(e, paris) \wedge arrivee(e, toulouse).</math>

L’opération de réification est aussi utilisée à ce niveau. Ceci affecte toutefois la simplicité et la lisibilité des réseaux sémantiques.

La réification de propositions permet de représenter toute formule du premier ordre instanciée et libre de fonctions dans la notation des réseaux sémantiques. La quantification universelle pose toutefois des problèmes et requiert des parcours assez indirects.

Réseaux sémantiques et formalismes informatiques

Les approches objet

On peut noter des ressemblances entre les réseaux sémantiques et les approches objet contemporaines de l’informatique. Un nœud est vu comme un objet, et les relations de sous-type et de sous-ensemble établissent des liens d’héritage et d’instance. Comme dans nombre d’approches objet, l’un des grands avantages des réseaux sémantiques est de permettre l’emploi de propriétés avec valeurs par défaut. Si ces défauts sont contredits au niveau d’objets sous-types, alors la valeur de plus bas niveau est préférée, la valeur par défaut étant ‘bloquée’. Ce traitement des défauts et exceptions est simple à représenter dans les réseaux sémantiques et les inférences sont faciles à visualiser pour leurs concepteurs. Les graphes conceptuels, initialement développés par IBM, sont une reprise des réseaux sémantiques, auxquels ont été associées des opérations plus élaborées, telle que la jointure de graphes. Bien que modernisés, et largement utilisés en France, ces graphes gardent globalement la puissance des réseaux. Ils ont un habillage informatique plus poussé ainsi que la mise en place d’étiquettes plus standard, par exemple inspirées des rôles thématiques.

Les logiques de description

Récemment, les logiques de description sont apparues avec l’objectif essentiel de formaliser plus précisément les notions élaborées dans les réseaux sémantiques, en particulier en ce qui concerne la structure taxonomique, vue comme le principe organisateur principal, sinon unique. Les formes d’inférences principales sont alors la subsomption (vérifier qu’une catégorie est un sous-ensemble propre d’une autre en comparant leurs définitions), et la classification (contrôler si un objet appartient bien à une catégorie). Certaines approches incluent aussi des traitements de consistance (vérifier que les critères d’appartenance à une catégorie sont satisfiables).

Les applications

Si les réseaux sémantiques sont tombés un peu dans l’oubli, il n’en demeure pas moins que certaines applications informatiques industrielles en utilisent la base. Enfin, la notion d’héritage introduite dans les réseaux sémantiques se retrouve, avec quelques aménagements, dans diverses approches formelles ou pratiques en linguistique : HPSG pour la syntaxe, DATR pour la morphologie, les systèmes à base de traits en général et, enfin, les structures lexicales hiérarchisées et les ontologies.


Un peu de lecture :

Les réseaux sémantiques constituant une littérature ancienne, nous suggèrons la synthèse présentée dans :

Russel, S., Norvig, P. Artificial Intelligence, a modern approach, International Edition, 2003