Ontologies spécifiques à une tache

mustardunfInternet και Εφαρμογές Web

21 Οκτ 2013 (πριν από 4 χρόνια και 4 μήνες)

89 εμφανίσεις

Ontologies pour l’astronomie

Nathalie Hernandez

Josiane Mothe

Laurent Cardonner

Objectifs


Représentation des informations via des
ontologies (indexation)


Etude des thesaurus existants


Adéquation aux collections


Mise à jour de la connaissance du domaine


Découverte de connaissances


Ontologie du domaine de la tâche / du contenu


Plan


Résultats des analyses via Syntex


Définition de mesures d’adéquation d’une
ontologie par rapport à un corpus


Techniques de mise à jour


Définition de différents types d’ontologies
adaptés à l’usage des données


Exemple de l’exploration des publications

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses






A notre disposition :


thesaurus de l’astronomie IAU


résumés d’articles publiés dans les revues A&A
et APJ sur plusieurs années.

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses




Syntex :
analyseur syntaxique de corpus


Intérêt : extraire syntaxiquement les expressions
d’une collection documentaire
[Bourigault & Fabre, 2000]


Deux phases


Pré
-
traitement par un étiqueteur


Analyse syntaxique


Originalité : apprentissage endogène
[Bourigault & Lame,
2002]


Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses




Résultats


APJ





A&A

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses




IAU


Thesaurus (représentation terminologique du
domaine de l’astronomie) crée en 1995


2863 termes dont 2222 expressions (magnetic field,
X ray,…)


5000 relations entre termes de plusieurs natures :


t1
BT

t2 : terme t2 plus spécifique t1


t1
NT

t2 : terme t2 plus générique t1


t1
U

t2 : utiliser le terme t1 plutôt le terme t2


t1
UF

t2 : utiliser le terme t2 à la place de t1


t1
RT

t2 : t1 et t2 sont liés

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses




Recherche termes IAU / CORPUS


APJ


1999 : 865 termes retrouvés


2002 : 877 termes retrouvés


A&A


1995 : 832 termes retrouvés


2002 : 884 termes retrouvés


588 termes communs aux 4 corpus



IAU adapté à l’indexation de nos corpus?



Mesures génériques (ontologie/thesaurus)

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses




IAU en OWL


Ontology Web Language
[http://www.w3.org/TR/owl
-
features/]


recommandation du W3C


Transformation


Définition de concepts (différents labels)

X Ray UF X
-
Ray

X Ray UF X
-
Ray radiation


X Ray

; X
-
Ray, X
-
Ray radiation


Définition de relations (généricité/specificité,
est lié à)

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Analyses





Mesures

d’adéquation

Analyse lexicale


Couverture ontologie / corpus


Pourcentage de termes de l’ontologie présents
dans le corpus


Choix ou non de l’ontologie comme point de
départ


Couverture corpus / ontologie


Détection des concepts représentatifs des
documents (tf.idf [Salton 71])


Proposition de nouveaux termes à ajouter

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Analyses





Mesures

d’adéquation

Analyse conceptuelle


Principe : «

un concept est représentatif d’un
domaine si il est en relation avec d’autres concepts
du domaine

»


Définition d’une mesure du pouvoir représentatif
d’un concept


Définition d’une mesure du pouvoir représentatif
d’une ontologie à partir de la mesure des concepts
retrouvés dans les documents



Validation du choix de l’organisation des concepts
dans l’ontologie


Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Analyses





Mesures

d’adéquation

Mise à jour des concepts



Ajout des termes représentatifs des
documents dans l’ontologie


Nouveau label pour un concept


Nouveau concept


utilisation des mesures de proximité
sémantique de Syntex

Exemple





Ontologies spécifiques
à une tache

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Mise à jour des relations


Spécification sémantique de la relation «

est
lié a

» : («

événement lié à

», «

objet lié a

»)


Détection de nouvelles relations entre
concepts



utilisation des mesures de proximité
sémantique de Syntex



Exemple





Ontologies spécifiques
à une tache

Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Nécessité de deux types ontologies :


Ontologie du domaine de la tâche : organisation
des méta
-
données ou
rôles des connaissances
dans la réalisation d’une tâche


Ontologie du domaine abordé dans le corpus:
représentation de la connaissance liée au
domaine

traité dans le contenu des documents



optimiser les tâches

Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Architecture

Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Cadre applicatif


Tâche: Exploration des publications dans
les revues A&A et APJ


Collection à notre disposition


Expérience à partir de Tétralogie


Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Ontologie du domaine de la tache d’exploration










Construction semi
-
automatique


REVUE

OUVRAGE

ACTES DE


CONFERENCE

LITTERATURE DU
DOMAINE

Est un

Est un

Est un

CHERCHEUR

nom

prénom

LABORATOIRE

adresse


Travaille pour

Travaille avec

PAYS

Est situé en

ARTICLE

ref

Publié dans

Rédige

DATE

Ecrit en

Travaille pour

depuis

OBJET DE
RECHERCHE

A pour domaine


d’intérêt

Traite

de

Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Ontologie du domaine abordé dans le corpus









Échantillon construit à partir de IAU et Factguru

ETOILE

SOLEIL

Est un

ECLIPSE SOLAIRE

COURONNE
SOLAIRE

Est un

événement lié

Partie de

SYSTEME
SOLAIRE

Partie de

CORPS CELESTE

a un spectre

Est un

ASTEROIDE

COMET

Est un

Est un

PLANETOIDE

Synonyme

Partie de

Partie de

Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Liens entre les deux ontologies









Est un

Evénement


lié à

CHERCHEUR

nom Dupont

prénom Jean

Travaille avec

ETOILE

SOLEIL

Est un

ECLIPSE SOLAIRE

COURONNE
SOLAIRE

Partie de

A pour domaine d’intérêt

Echantillon de
l’
ontologie de
domaine

Echantillon de l’ontologie de tâche au niveau instance

ARTICLE

Ref

: 1

Traite de

Rédige

objet de
recherche

Exemple





Analyses





Mesures
d’adéquation

Techniques

de mise à jour


Ontologies spécifiques

à une tache

Prototype


interface de visualisation


Plusieurs niveaux de navigation


Niveau conceptuel : vue générale sur le corpus


Niveau instance : détails sur le corpus


Deux accès à la collection


À travers l’ontologie du domaine de la tâche


A travers l’ontologie du domaine abordé dans
la collection

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Aperçu de l’interface

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Exploration via ontologie domaine tache

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Connaissance établie pour instance Chercheur

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Connaissance établie pour instance Article

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Exploration via ontologie domaine abordé dans
corpus

Analyses





Mesures
d’adéquation

Techniques

de mise à jour

Ontologies spécifiques
à une tache

Exemple




Conclusion


IAU


Intégration d

’autres éléments : instances des
concepts ?


Instruments,


objets
-

Exemple objets Lien avec Simbad


FACTGURU ??
[
http://www.site.uottawa.ca:4321/astronomy/index.html
]


Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses





Travaux à faire


Évaluation


Cadre


Réalisable


Définition de tâches


Mise à jour
-

Mots clés (oui avec niveau
souhaité
-

Ontologie
-

Web sémantique)


Lien avec UCD

Techniques

de mise à jour

Exemple





Ontologies spécifiques
à une tache

Mesures
d’adéquation

Analyses





Evaluation


Comparer l’adéquation d’échantillons de
deux ontologies sur un même corpus, puis
sur des différents (évolution du domaine)



Proposer les corpus et les deux ontologies

Evaluation

Ontology

A

Ontology

B

particle

photon

radiation

high energy
radiation

X ray

X ray radiation

X
-
ray

electromagnetic wave

X

ray

spectra

X ray source

X ray binaries

star

X ray pulsar

pulsar

X ray


scattering

X

ray

background

wave

Background radiation

Photon

Electromagnetic

radiation

X

ray

X
-
Ray

wave

hard X ray

soft X ray

X ray source

celestial sphere

X ray pulsar

pulsar

psr

particle

neutral particle

celestial body

X ray astronomy


Is a

Part of

Is related to

Ontologie


Ontologie : «

spécification explicite et
formelle d’une conceptualisation

partagée»

[Studer 1998]


Deux niveaux sémiotiques :


Lexical (termes)


Conceptuel (concepts et relations entre
concepts)




base pour la communication entre les
machines, entre humains et machines

Recherche d’information et
ontologie


Intégration des ontologies dans un
processus de recherche :


Réduction du silence : extension des requêtes à
partir des termes et concepts de l’ontologie


Réduction du bruit : désambiguïsation des
termes contenus dans la requête

Recherche d

’information et
Ontologie


Indexation des documents à partir des
concepts de l’ontologie


Descripteurs choisis dans l’ontologie


Indexation à partir de concepts et non plus à
partir de mots souvent ambigus



Choix d’une ontologie reflétant le ou les
domaines de connaissance relatifs aux corpus

Exploration de collections
documentaires à partir d’ontologies


Objectifs :


Aide à l’indexation des documents par un
procédé de catégorisation automatique des
documents au niveau des concepts d’ontologies

Météorite

Achondrite

Chondrite

Chondrule

Chondrite
carbonnée

Météorite…
…………….
chondrule

Chondrule
……..

Chondrule

Extraits des
documents

Extrait
d’une
hiérarchie
de
concepts