Projet One Dior Apports des technologies du Web sémantique

shrubberyweakInternet and Web Development

Oct 21, 2013 (4 years and 23 days ago)

112 views

Isidore à l’interface de la rencontre

des SHS et du Web de données


Gautier Poupeau

@lespetitescases

http://www.lespetitescases.net

2

L’ENJEU

3

Sortir de la logique des silos de données….

D’un Web de documents

Documents reliés par des liens

Pas de structuration sémantique

Pas de requêtes structurées

…à un Web d’applications…

Données exposées à travers API

API valable que pour un Silo

Pas d’interopérabilité entre les silos

Web de données = espace unifié

Liens entre les données

APIs remplacés par standards ouverts

…à un
Web

de données

4

…pour libérer les données sur le Web

« Webifier » les bases de données existantes pour les
rendre accessible aux utilisateurs

Il ne s’agit pas de

Déployer des protocoles spécifiques qui limitent
l’utilisation des données voire ne respectent pas les
principes du Web

Il s’agit de

Placer les données sur le Web,

juste le Web

Rendre le Web invisible

visible

5

LES USAGES DU WEB

ÉVOLUENT

6

L’évolution du Web (1)

Le Web des documents : un accès universel

7

L’évolution du Web (2)

Je publie
donc j’existe

Mon avis
compte

LOL ;
-
)

ROTFL

Le Web social : l’utilisateur


acteur

avis, notes, commentaires …

8

L’évolution du Web (3)

Je publie
donc j’existe

Mon avis
compte

LOL ;
-
)

ROTFL

Le Web de données : les machines sont de retour

9

LES TECHNOLOGIES DU WEB

ÉVOLUENT

10

Qu’est
-
ce
-
que le Web ?

Un cadre d’interopérabilité pour mettre à disposition, consulter, lier et
partager des documents sur un réseau de machines connectées.

Les principes du Web

Un protocole

Un «

langage

»

Un principe

Un mécanisme

d’identification

HTTP

HTML

L’hypertexte

URL/URI

11

Qu’est
-
ce
-
que HTML ?

Un modèle

HTML est la lingua franca du Web pour encoder des
documents

L’arbre

Une syntaxe

Les balises

SGML

Une grammaire

La DTD

HTML

12

Qu’est
-
ce
-
que le Web sémantique ?

Un cadre d’interopérabilité pour mettre à disposition, consulter, lier et
partager des données sur un réseau de machines connectées.

Les principes du Web sémantique

Un protocole

Un «

langage

»

Un principe

Un mécanisme

d’identification

HTTP

RDF

L’hypertexte

URL/URI

13

Qu’est
-
ce
-
que RDF ?

Un modèle

RDF est la lingua franca du Web pour encoder des
données

Le triplet

Une syntaxe

RDF/XML

Une grammaire

Sujet

prédicat

Objet

Sujet

Objet

prédicat

prédicat

chien

animal

est

Le graphe

14

Le Web de données

La rencontre du Web et des technologies du Web sémantique

15

ISIDORE

ET LE WEB DE DONNÉES

16

Les quatre principes du Web de données ou Linked Data

Source : http://www.w3.org/2009/Talks/0204
-
ted
-
tbl/#%281%29

http://dbpedia.org/resource/

French_National_Centre_for_Scientific_Research

Utiliser des URIs

Utiliser des URIs

accessibles via HTTP

Donner l’accès aux
données utiles en
utilisant les standards
SPARQL et RDF

Exprimer

l’URI des objets liés

17

Utiliser des URIs

Chaque ressource reçoit dans Isidore un identifiant unique et stable

délivré par le CCSD selon le système Handle

http://www.rechercheisidore.fr/resource/ 10670.1/qydusc

Résolveur

Identifiant Handle

18

Des URIS HTTP pour donner l’accès aux données utiles

Pour chaque URI, Isidore est capable de renvoyer le format

le mieux adapté à l’émetteur de la requête :

la négociation de contenu

http://www.rechercheisidore.fr/resource/10670.1/qydusc

http://halshs.archives
-
ouvertes.fr/halshs
-
00004902/en/

http://www.rechercheisidore.fr/data/10670.1/qydusc.n3

19

Exprimer l’URI des objets liés

ISIDORE

Référentiel

Disciplines

HAL
-
SHS

Référentiel

Auteurs

HAL
-
SHS

Référentiel

Organisation

HAL
-
SHS

Référentiel

Catégories

Calenda

Référentiel

Pactols

Référentiel

Geonames

Référentiel

Rameau

Référentiel

Lexvo

Référentiel

Thésaurus W

SIAF

20

Rendre accessible les enrichissements d’Isidore

Enrichisse
ment par
Isidore

Exposition
par Isidore

Récupération
par les
producteurs

Traitement
par le
producteur

Exposition
par le
producteur

Collecte
par Isidore

pour mettre en place une boucle de rétro
-
action

21

Garder la maîtrise des identifiants et des données

Une ressource de HAL exposée dans le cadre du projet rkbexplorer

Une URI a déjà été attribuée

Problème de qualité des données

Si vous ne le faites pas, d’autres le feront voire l’ont déjà fait…

La même ressource dans Isidore

22

DÉMONSTRATION


Merci pour votre attention

Gautier Poupeau

Antidot | GSM: +33 (0)6 45 49 59 77

F
-
75 Paris | mailto: gpoupeau@antidot.net

Blog :
Les petites cases
| Twitter : @lespetitescases