Introduction au WEB sémantique Le WEB sémantique ... - Lirmm

mustardunfInternet and Web Development

Oct 21, 2013 (3 years and 9 months ago)

76 views

1
Introduction
au WEB sémantique
Le WEB sémantique
• « The Semantic Web is an extension of the
current web in which information is given well-
defined meaning, better enabling computers and
people to work in coopération ». Tim Berneers-
Lee, James Hendler, Ora Lassila, The Semantic
Web, Scientific American, May 2001.
• Point de départ
– Une masse gigantesque de documents sur le WEB
– Recherche difficile
Introduction
• Idée du WEB sémantique
– Caractériser explicitement le contenu des documents du WEB
– Diffuser ces propriétés
?Attacher ces propriétés aux documents du WEB : méta-données
?Construire des ontologies pour attribuer une sémantique
explicite, structurée, partagée par une communauté de pratique,
aux documents
• Mise en œ uvre technique (consortium W3C)
– Norme RDF basée sur XML : syntaxe de méta-données et
primitives de base (triplets <prédicat, sujet, objet>)
– Extensions de RDF
Ontologie
• Se mettre d'accord sur le sens des termes
employés dans une organisation, une
communauté, un métier
• Faire en sorte que les personnes et les
logiciels se comprennent
• Utile pour des applications distribuées
telles que le Web
3
Pour faire par exemple :
• un système d’indexation documentaire, de
recherche d’information
• du commerce électronique
• un système d’annotation
Ontologie
• Différentes acceptions du mot ontologie
– Vocabulaire technique,
– Référentiel métier,
– Terminologie/thesaurus,
– Système de classes d’une représentation
par objet
– Base de connaissances terminologique
Conception
• Identifier/modéliser les concepts et les
termes pertinents
• Identifier les relations pertinentes :
subClassOf, isa, partOf, hasPart,
closeTo, over, under, contain,
connected, etc.
• Règles pour combiner les concepts et
les relations : partOf est transitive
Modéliser
• Une ontologie est une modélisation des
connaissances
• Continuum : donnée, information,
connaissance
– donnée: … --- …
– information : SOS
– connaissance: en cas d’alerte,
déclencher les secours
4
Connaissance
• La connaissance permet de produire de
nouvelles données, informations,
connaissances: inférences
Types de connaissances
• Connaissances de résolution de problème :
– conception, diagnostic, évaluation, planification
– tâches, inférences
• Connaissances du domaine
– e.g. électronique, mécanique, médecine, etc.
• ontologie: réutilisable
• modèles de domaine: fonctionnel, causal, structurel,
exprimés dans le vocabulaire de l’ontologie.
Ontologie
concept Object
concept Moteur < Object
concept Vehicule < Object
relation partOf:
Object -> Object
Modèles de domaine
Structurel:
Moteur e1 partOf Vehicule v2
causal :
Moteur en-panne => Vehicule stop
5
Modèles de tâche
Conception :
–specify, design, assess
Diagnostic :
– identifier des symptômes, choisir un
modèle causal, émettre des hypothèses,
imaginer des conséquences, les tester,…
Ontologie
• L’accent est mis sur les concepts et les
relations du domaine
• Orienté modélisation, spécification,
réutilisation, partage, standardisation.
• Relations spécifiques du domaine
considéré
Terminologie/Thesaurus
• L'accent est mis sur les termes utilisés
pour dénoter les concepts du domaine
(linguistique, langue naturelle).
• Les relations entre termes sont
linguistiques.
• Orienté indexation.
Thesaurus (2)
Recueil documentaire alphabétique de
termes servant de descripteur pour :
• analyser un corpus
• indexer des documents
• Relations prédéfinies standardisées pour
les thésaurus
6
Ontologie
• Composant réutilisable
• Réutilisation:généralité, abstraction
(reuse)
• Partage : consensus, standardisation
(sharing)
• Accord sur conceptualisation partagée:
engagement ontologique (commitment)
Caractéristiques
• Formalisation : lever les ambiguïtés
• Indépendance (relative) par rapport à
une tâche, ou un problème précis
• Utilisable pour différentes tâches :
conception,diagnostic, maintenance,
recherche d'information
Caractéristiques
• Indépendante d’une implémentation:
limiter le biais dû à un formalisme de
représentation: niveau conceptuel
• Des inférences sont possibles.
Types d’Ontologies
Ontologies générales, abstraites, de haut
niveau :
• Ontologie des catégories conceptuelles :
• objet, événement, état, processus, action,
temps, espace
Ontologies théoriques:
• physique, mathématique, cinématique
7
Types (2)
Ontologie applicative :
• Médecine, automobile, patrimoine culturel,
organisation, etc.
Principes de conception
• Clarté: communiquer le sens des termes
définis
• Cohérence
• Extensibilité
• Indépendance vs implémentation
• Modularité
Caractérisation des ontologies
• Quelle différence entre ontologie, base de donnée,
taxonomie?
– Une ontologie n’est pas spécifique à tel ou tel système
informatique
– Elle exprime le consensus d’une communauté
– Elle exprime plusieurs points de vue (structurel, fonctionnel,
type, propriétés)
– Elle est stable dans le temps
– Elle est explicite
• Les ontologies peuvent servir de référent pour la
définition d’une base de connaissance, base de
donnée
Base de données
• Base de données véhicules du constructeur X
– Modèles
• noModèle
• annéeDébut
• annéeFin
• typeSegmentMarché
– Pièces
• noPièces
• attributsTechniques,
• noPièceMère
– Gamme
• noGamme
• noModèle
• listeOptions (pièces)
8
Taxonomie
Taxonomie véhicule
– Véhicule terrestre
• Voiture à moteur
– Véhicule à 4 roues
» Berline
» Break
» Coupé
» Décapotable
» Pick-up
» Camionnette
• Train
– Bateau
– Avion
Ontologie Véhicule
• Types
• Terrestre
• Maritime
• Aérien
• Fonctions
• Transport
– De personne
– De fret
• Attributs
• Puissance
• Taille
• Couleur
• Aérien
Ontologie véhicule
• Composants
– Moteur
– Carrosserie
– Équipements
• Environnement
– Système de navigation
Un éditeur d’ontologies
• Protégé
• http://protege.stanford.edu/
• génère RDF et RDFS
9
RDF
• RDF sur le W3C : http://www.w3.org/RDF/
• RDF: description de ressources Web
(métadonnées)
• RDF validator:
http://www.w3.org/RDF/Validator/
• RDF Schéma (RDFS) : vocabulaires de
description