Alignement des vocabulaires

mustardunfInternet and Web Development

Oct 21, 2013 (3 years and 9 months ago)

109 views

Web Sémantique et
Interopérabilité des
Vocabulaires Conceptuels

Antoine ISAAC

Projet STITCH


Journée BNF

2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Contexte


STITCH


S
eman
T
ic
I
nteroperability
T
o access
C
ultural
H
eritage


Échange et intégration de méta
-
données


Projet de recherche appliqué au domaine patrimonial



Collaboration avec la BnF


1 an (2006
-
2007)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème: hétérogénéité des vocabulaires


Des objets conceptuels distincts

avec des sens parfois comparables


“Sainte Marie” / “la Vierge Marie”


“ruines antiques” / “paysage avec ruines”



Des représentations différentes


Formats: XML ou pas, MARC, …


Des modélisations différentes:
classes
,
concepts
,
termes
, etc.


Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème



Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Une solution en deux étapes

1. Homogénéiser la représentation des
vocabulaires


Représentation standard


Représentation compatible avec l’alignement


2. Aligner les vocabulaires


Trouver des correspondances sémantiques entre les
éléments de vocabulaires différents


“ruines antiques”


“paysage avec ruines”


“Sainte Marie”
=
“la Vierge Marie”

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS (Simple Knowledge Organisation System)


World Wide Web Consortium (W3C)


Modèle simple pour représenter des vocabulaires
conceptuels (thesauri, classifications,…) sur le WS


Comparable à Dublin Core, au niveau des vocabulaires



SKOS propose des primitives pour créer des données
XML/RDF


Concept
s et
ConceptScheme
s


Propriétés lexicales (
prefLabel
,
altLabel
)


Liens sémantiques (
broader
,
related
)


Notes (
scopeNote
,
definition
)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS: exemple

http://[...]/mandragor
e/descripteurs/c_230

http://[...]/mandragore/descripteurs/c_235

skos:
Concept

rdf:
type


skos:
broader

skos:
prefLabel


“saints et bienheureux”@fr


Attention; c’est un standard, tout n’est pas représenté


Publication et échange de données


Celles qui nous intéressent!

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement des vocabulaires


Trouver des correspondances sémantiques


“ruines antiques”


“paysage avec ruines”


“Sainte Marie”
=
“la Vierge Marie”


Le faire (semi
-
)automatiquement


Inspiré de ce qui se fait pour le Web Sémantique


alignement d’ontologies

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Approches pour l’alignement de vocabulaires


Lexicales


Structurelles


Statistiques


Utilisation de connaissances de contexte



Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement lexical


Libellés des concepts, gloses


avancée à la perche

barque

Barque

broaderMatch

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Après



Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Démo


http://prauw.cs.vu.nl/rp33333/MANDRA
-
SV
-
ICE
-
mandraNewNONE
, amphibiens



Blé


Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Représentation


Il est possible de produire des représentations WS
standardisées (SKOS) des vocabulaires conceptuels


Et des méta
-
données qui les utilisent


Les techniques existantes pour accéder aux méta
-
données et
vocabulaires (OAI
-
PMH, XML) facilitent le travail



C’est utile


Réutilisation/interopérabilité des composants applicatifs
utilisant les vocabulaires


Facilité de la représentation de liens avec des éléments
extérieurs au vocabulaire représenté

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Alignement


Les techniques simples permettent d'obtenir des
résultats rapides


12300 concepts de Mandragore “accessibles” depuis Iconclass



Leur fiabilité ne permet pas de les considérer comme
sources uniques


Combinaison avec travail manuel (vérification, complétion)



L’alignement sémantique est toujours un problème de
recherche
difficile


Aucune technique n’est parfaite


Il faut sélectionner/combiner, en fonction des cas applicatifs

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Merci !


Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Liens


STITCH



http://stitch.cs.vu.nl


Projets d’intégration dans le domaine des bibliothèques:


MSAC



http://sigma.nkp.cz


MACS



http://macs.cenl.org



Liens Web Sémantique


au W3C




http://www.w3.org/2001/sw/


SKOS




http://www.w3.org/2004/02/skos/


Semantic Web projects dans le domaine patrimonial


MuseumFinland


http://www.museosuomi.fi/



eCulture



http://e
-
culture.multimedian.nl
/


Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (1)

Subject vocabulary, collection 1

Subjects

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (2)

Hierarchical path
from root to selected
subject

Possible
specialization for
selected subject

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Document from
Collection 2

Semantic alignment
of subjects activated

Demo (3)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (4)

Subject from voc2 aligned to
voc1:amphibians”

Back