Linked Data for the Masses: Η προσέγγιση και το λογισμικό

transportdingdongSoftware and s/w Development

Jul 14, 2012 (5 years and 1 month ago)

407 views

Linked Data for the Masses1
Linked Data for the Masses: Η
προσέγγισηκαιτολογισμικό
ΓιώργοςΑναδιώτης, ΠάνοςΑνδριόπουλος, Πάνος
Αλεξόπουλος, ∆ημήτρηςΒεκρής, Αριστοτέλης
Ζωσάκης
IMC Technologies S.A.
15/05/2010
Linked Data for the Masses2
∆ομήΠαρουσίασης
1.Εισαγωγή: ΑπότονΠαγκόσμιοΙστόστον
ΣημασιολογικόΙστόκαισταLinked Data
2.ΗInbound/Outbound Linked Data Προσέγγιση
3.Υλοποίηση: ΠρότυπακαιΛογισμικό
4.Εφαρμογέςκαιεξελίξεις
Linked Data for the Masses3
∆ομήΠαρουσίασης
1.Εισαγωγή: ΑπότονΠαγκόσμιοΙστόστον
ΣημασιολογικόΙστόκαισταLinked Data
2.ΗInbound/Outbound Linked Data Προσέγγιση
3.Υλοποίηση: ΠρότυπακαιΛογισμικό
4.Εφαρμογέςκαιεξελίξεις
Linked Data for the Masses4
ΒασικέςελλείψειςτουΠαγκόσμιουΙστού
•Έλλειψηδομής: Πληροφορία≠∆εδομένα.ΟΠαγκόσμιοςΙστός, με
τηνμορφήπουπαρέχειτηνπληροφορία(ιστοσελίδες), περιορίζεται
ουσιαστικάστηνπαρουσίασήτης. ∆ενμπορείναδώσειτηνδομή
τηςπληροφορίας, ακόμακαιανυπάρχειτέτοια(π.χ. ηπληροφορία
αυτήπροέρχεταιαπόκάποιαΒάση∆εδομένων): έχουμεανάμιξη
παρουσίασηςκαιπεριεχομένουμετηνμορφήεγγράφων.
•Έλλειψησημασιολογικούπροσδιορισμού: Τισημαίνειαυτό?Ακόμα
καιανμπορέσουμεναδιαχωρίσουμετηνπαρουσίασηαπότο
περιεχόμενο, ηερμηνείατουτελευταίουείναικάτιπουεναπόκειται
αποκλειστικάστοναναγνώστη: δενείναιδυνατήηαυτόματη
επεξεργασίακαιοσυνδυασμόςτωνδεδομένων, καθώςδεν
προσδιορίζεταιη‘σημασία’τους.
Linked Data for the Masses5
ΟΣημασιολογικόςΙστός
•ΤιςελλείψειςαυτέςυπόσχεταινααντιμετωπίσειοΣημασιολογικός
Ιστός, επιχειρώνταςναφέρειστοιχείαΑναπαράστασηςΓνώσηςκαι
ΤεχνητήςΝοημοσύνηςστηνδομήτουΠαγκόσμιουΙστού,
αποτελώνταςτηνμετεξέλιξήτου.
Linked Data for the Masses6
ΠρότυπαΣημασιολογικούΙστού
•ΤοπρότυποXML(eXtendedMarkup Language)είναιτοπλέον
διαδεδομένoπρότυποδομημένηςαναπαράστασηςδεδομένωνκαιη
υποστήριξήτουεξασφαλίζειτηνδυνατότηταανταλλαγήςδεδομένων
ανάμεσασεδιαφορετικέςεφαρμογέςκαισυστήματα.
•RDF(S). ΗγλώσσαRDF (Resource Description Framework) είναι
έναμοντέλοδεδομένωνγιατααντικείμενακαιτιςμεταξύτουςσχέσεις, με
αναπαράστασηκαισεμορφήXML. ΤοRDF Schema μετησειράτουείναι
έναλεξιλόγιογιατηνπεριγραφήτωνιδιοτήτωνκαιτωνκλάσεωνRDF
αντικειμένων, μεμιασημασιολογίαγιατιςγενικευμένεςιεραρχίεςτέτοιων
ιδιοτήτωνκαικλάσεων.
•ΗγλώσσαOWL (Web Ontology Language) προσθέτειεπιπλέον
δυνατότητεςγιατηνπεριγραφήτωνιδιοτήτωνκαιτωνκλάσεων.
•HγλώσσαSPARQL(SimpleProtocolandRDFQuery
Language) είναιηαντίστοιχητηςSQLγιαεπερωτήσειςσεσημασιολογικά
δεδομένα. Επιπλέον, αποτελείκαιπρωτόκολλοπρόσβασηςσεαυτάμέσω
HTTP.
Linked Data for the Masses7
ΣημασιολογικόΜοντέλοRDF
•ΤαRDF δεδομέναδιαφέρουναπότασχεσιακάδεδομένα
ωςπροςτομοντέλοπουεκφράζουν: τοRDF είναι
γράφος
•ΤαRDF δεδομέναέχουντηνμορφήτριπλετών(triples)
•<subject><predicate><object> : <cat><is-a><mammal>
•ΤοRDF(S) δίνειέναπρώτοεπίπεδοπροσδιοριστικής
λογικής: κλάσειςκαιταξονομικέςσχέσεις(ιεραρχία)
•ΗOWL προσθέτειεπιπλέονδυνατότητεςαξιωματικών
προσδιορισμών, περιορισμώνκαισυμπερασμού
Linked Data for the Masses8
∆ιασυνδεδεμένα∆εδομένα
(Linked Data)
•ΧρήσητουΣημασιολογικούΙστούγιαναεπιτευχθείπρόσβασησε
δεδομένα, αλλάκαιδιασύνδεσημεταξύτους
•ΟιπαρακάτωβασικέςαρχέςτωνLinked Dataπροσδιορίστηκαναπό
τονSir Tim BernersLee, εφευρέτητουΠαγκόσμιουΙστού, μετην
προοπτική‘νακάνουντονΙστόναλειτουργήσεισωστά’
•Χρήσητωνυπαρχόντωνπροτύπωντου∆ιαδικτύουκαιυλοποίηση
4 βασικώναρχών:
1.ΧρήσηURIsωςπροσδιοριστώνγιααντικείμενακέννοιες
2.ΧρήσηHTTP URIsώστεοιπροσδιοριστέςναμπορούννα
αναζητηθούν
3.Παροχήπληροφοριώνμέσωσχετικώνπροτύπων(RDF, SPARQL)
όταναναζητείταικάποιοURI
4.ΧρήσησυνδέσμωνπροςάλλαURIsώστεναείναιδυνατήηπρόσβαση
σεεπιπλέονπληροφορία
•Ησημασιολογίατωνδεδομένωνπροσδιορίζεταιμέσω
οντολογιών/λεξιλογίων
Linked Data for the Masses9
The Linked Data cloud
Linked Data for the Masses10
DBpedia
•ΕξάγειδομημένηπληροφορίααπότηνWikipediaκαιτηνδημοσιεύει
ωςLinked Data.
•ΧρησιμοποιείμιαOWL οντολογίαγιατηναναπαράστασητων
πληροφοριώνκαιτηνδημοσίευσητουςσεRDF μορφή
–Places
–Person
–Organization
–…
•ΕπιτρέπειτηνχρήσητηςγλώσσαςSPARQL γιατηνανάκτηση
δεδομένωνμέσωεπερωτήσεων
•Ηπληροφορίαπουεξάγεταιαποθηκεύεταισεμίατεράστιαcross-
domain knowledge base (479 εκατομμύριαRDF τριάδες)
•Υπάρχουν2 εκδόσεις:
–Αγγλική
–Γερμανική
Linked Data for the Masses11
∆ομήΠαρουσίασης
1.Εισαγωγή: ΑπότονΠαγκόσμιοΙστόστον
ΣημασιολογικόΙστόκαισταLinked Data
2.ΗInbound/Outbound Linked Data Προσέγγιση
3.Υλοποίηση: ΠρότυπακαιΛογισμικό
4.Εφαρμογέςκαιεξελίξεις
Linked Data for the Masses12
ΗInbound/Outbound Linked Data
Προσέγγιση
•Πωςμπορούνναφανούνχρήσιμασεπρακτικές
εφαρμογέςταLinked Data?
•Κάθεκόμβος/εφαρμογήστονΣημασιολογικόΙστόμπορεί
ναδραείτεωςκαταναλωτής(Inbound Linked Data) είτε
ωςπάροχος(Outbound Linked Data)
•Ωςκαταναλωτής, ταπλεονεκτήματαείναιεμφανή:
μπορείναχρησιμοποιήσειεξωτερικάδεδομέναγιανα
εμπλουτίσειτοπεριεχόμενοκαιναπαρέχειπρόσθετες
υπηρεσίες
Linked Data for the Masses13
ΗInbound/Outbound Linked Data
Προσέγγιση
•Ωςπάροχος, ταπλεονεκτήματαείναιλιγότεροεμφανή, πλην
υπαρκτά:
Linked Data for the Masses14
ΗInbound/Outbound Linked Data
Προσέγγιση
•Ηπροσέγγισηπαρουσιάστηκεσταπλαίσιατουδιεθνούς
διαγωνισμούLinking Open Data TriplificationChallenge
2009, οοποίοςδιοργανώνεταιαπόδιεθνήεπιτροπή
ειδικώνυπότηναιγίδατουSir Tim BernersLeeμε
σκοπότηνπροώθησητωνLinked Data διαθέτονταςστο
κοινό:
–ΑνοιχτάDatasets σεμορφήLinked Data
–Ανοιχτόλογισμικόπουμπορείναχρησιμοποιηθείγιατην
παραγωγήLinked Data
•Outbound Linked Data εφαρμογή: LiferayLinked Data
Module
•Inbound Linked Data εφαρμογή: ΕφαρμογήΑπόδοσης
ΝοήματοςTags
Linked Data for the Masses15
∆ομήΠαρουσίασης
1.Εισαγωγή: ΑπότονΠαγκόσμιοΙστόστον
ΣημασιολογικόΙστόκαισταLinked Data
2.ΗInbound/Outbound Linked Data Προσέγγιση
3.Υλοποίηση: ΠρότυπακαιΛογισμικό
4.Εφαρμογέςκαιεξελίξεις
Linked Data for the Masses16
Outbound Linked Data: LiferayLinked
Data Module
•Liferay: open source Portal/CMS framework(Java, Portletcontainer)
–Πάνωαπό10 χρόνιαανάπτυξης
–Μεγάλομερίδιοαγοράςδιεθνώς, μεπελάτεςόπωςUN, Cisco, BMW
Linked Data for the Masses17
Outbound Linked Data: LiferayLinked
Data Module
•∆ιάθεσητουπεριεχομένουπουπαράγεταιαπότον
Liferay(blogs, web content, forums, wikis…) σεLinked
Dataμορφή
•Επιπλέονπληροφορία: users, groups, organizations,
tags..
•SPARQL endpoint.
•Χρήσηανοιχτούλογισμικού: D2R Server+ Mapping
language
•Χρήσηπροτύπωνλεξιλογίωνγιατοπεριεχόμενο
•∆ιαθέσιμοστοSourceforge, LGPL license
Linked Data for the Masses18
ΛεξιλόγιαΑναπαράστασηςΓνώσης
•ΗαναπαράστασητωνRDF δεδομένωνγίνεταιμετηνχρήση
κατάλληλωνλεξιλογίων, όπως:
–FOAF: Friend-Of-A-Friend –Λεξιλόγιοπεριγραφήςχρηστών
–DC: Dublin Core -Λεξιλόγιοορισμούιδιοτήτωνμεταδεδομένων
–SIOC: Semantically Interlinked Online Communities -Λεξιλόγιο
αναπαράστασηςκοινοτήτων
–SKOS: Simple Knowledge Organization System -Λεξιλόγιο
αναπαράστασηςταξονομιώνκαιδομημένηςγνώσης
–MOAT(Meaning Of A Tag): ΛεξιλόγιοπεριγραφήςTags, χρήσηςκαι
διαφορετικώννοημάτωντους.
•Ηεπαναχρησιμοποίησητωνλεξιλογίωνπροωθείτην
διασυνδεσιμότητακαιβοηθάστηνεύκοληκαιάμεσηεπεξεργασία
τωνδεδομένωναπότιςεκάστοτεεφαρμογές.
Linked Data for the Masses19
D2R Server
•Είναιέναεργαλείοτοοποίοαντιστοιχίζει(mapping) μίαΣχεσιακήΒάση
∆εδομένωνσεμορφήRDF καιδημοσιεύειτοπεριεχόμενοτηςωςLinked
Data
•ΕπιτρέπειτηνπλοήγησηκαιτηνανάκτησητωνRDF δεδομένων
•ΠρόσβασημέσωSPARQL
•Χρησιμοποιείταιγιατηνδημοσίευσηεπιλεγμένωνδεδομένωντηςβάσης
περιεχομένουτουLiferayServer
Linked Data for the Masses20
Inbound Linked Data: Εφαρμογή
ΑπόδοσηςΝοήματοςTags
•ΑναπτύχθηκεστηνπλατφόρμαLiferayPortal
•∆ιασυνδέειδεδομένατύπουTag πουδημιουργούνταιστο
περιβάλλοντουLiferayκαιταοποίαχρησιμοποιούνταιγιατην
επισημείωσηπεριεχομένου
•Παρέχειστοχρήστηγραφικόπεριβάλλονγιατονσημασιολογικό
προσδιορισμότηςέννοιαςκάθεTag σταπλαίσιατηςεκάστοτε
χρήσηςτου
•Μπορείναχρησιμοποιηθείγια
–ακριβέστερηαναζήτηση
–εύρεσηόμοιωνεννοιών
–αντιστοίχισηtags
–…
•Οπροσδιορισμόςγίνεταιμεταξύπιθανώνεννοιώνπουανακτώνται
απότηνDBpediaασύγχρονα, μετηνχρήσηεξειδικευμένου
λογισμικού
Linked Data for the Masses21
Inbound Linked Data: Εφαρμογή
ΑπόδοσηςΝοήματοςTags
•∆ημιουργία
Blog“Apple”.
•Προσθήκη
Tag στο
περιεχόμενο
τουBlog.
–Προσθήκη
νέουtag
“Wild”.
–Προσθήκη
tag
“Apple”και
“Fruit”από
λίστα.
Linked Data for the Masses22
Inbound Linked Data:
ΕφαρμογήΑπόδοσηςΝοήματοςTags
•∆ιασύνδεση
αυτώνμέσωτου
“Interlink Tags”
–Αναζήτηση
πιθανών
νοημάτωναπό
προηγούμενες
διασυνδέσεις.
–Ανάκτηση
πιθανών
νοημάτωνγια
κάθεtag.
–Συνολική
παρουσίαση
αποτελεσμάτων
–Επιλογή
κατάλληλου
νοήματος
–Αποθήκευση
νοήματοςμέσω
του“Save”.
Linked Data for the Masses23
Presentation Structure
1.Εισαγωγή: ΑπότονΠαγκόσμιοΙστόστον
ΣημασιολογικόΙστόκαισταLinked Data
2.ΗInbound/Outbound Linked Data Προσέγγιση
3.Υλοποίηση: ΠρότυπακαιΛογισμικό
4.Εφαρμογέςκαιεξελίξεις
Linked Data for the Masses24
Εφαρμογές
•ΤοLiferayLinked Data Module έχειενσωματωθείαπό
τηνIMC ωςμέροςτηςπλατφόρμαςΗλεκτρονικής
ΣυμμετοχήςeDialogos, όπωςέχειχρησιμοποιηθείστα
αντίστοιχαέργαπουέχουνυλοποιηθείαπότην
ΝομαρχίαΣάμουκαιτιςπόλειςτηςΆρταςκαιτης
Θεσσαλονίκης
•∆ημιουργία‘οικοσυστήματοςδιαλόγου’, στοοποίο
μπορούννασυμμετέχουνωςπάροχοιή/και
καταναλωτέςόλοιόσοιεπιθυμούνμέσωαπευθείας
πρόσβασηςσταδεδομένα
–∆ιαφάνεια-Προσβασιμότητα: Ανοιχτά∆εδομένα
–Συμβατότητα: Χρήσηπροτύπων, πρόσβασηαπ’ευθείαςστα
δεδομένα, χωρίςμεσολάβησηΑΡΙ
Linked Data for the Masses25
ΕπέκτασηΠροτύπων:
eDialogos-eDeliberationOntology
•Συμβατότηταμετα(γενικά) λεξιλόγιαπουχρησιμοποιήθηκαν,
επέκτασημεεπιπλέονέννοιεςπουαφορούντοπεδίοτης
ΗλεκτρονικήςΣυμμετοχής
Linked Data for the Masses26
Οικοσύστημα∆ιαλόγου
Linked Data for the Masses27
Εξελίξεις
•ΣυνεργασίαμεLiferay
–ΕνσωμάτωσητουLinked Data Module στοεπίσημοdistribution
(μετάτηνεπερχόμενηέκδοση)
–Consulting γιατηνεπέκτασηκαιενσωμάτωσηακόμα
περισσότερωνχαρακτηριστικώνστομέλλον
•ΣυνεργασίαμεDBpedia, Πανεπιστήμια
–∆ημιουργίαΕλληνικήςDBpedia
•∆ιάθεσητουeDialogosσεOpen Sourceέκδοση
–Τοακριβέςπλαίσιοθακαθοριστείεντόςτου2010
Linked Data for the Masses28
Αναφορές
•[1] Anadiotis, G., Andriopoulos, P., Vekris, D. and Zosakis, A. Linked
data for the masses –using open source infrastructure and the
inbound/outbound linked data approach to bring added value to end
user applications. In I-KNOW 09 and I-SEMANTICS 09, 2009. See
http://i-
semantics.tugraz.at/2009/triplification/04_liferay_TriplificationChalle
nge2009.pdf
•[2] LiferayLinked Data Module:
http://sourceforge.net/projects/liferayldm/
•[3] Bryan Cheung (LiferayCEO), “LiferayLinked Data Module”,
LiferayBlog, December 12, 2009. See
http://www.liferay.com/web/bryan.cheung/blog/-/blogs/liferay-linked-
data-module
•[4] Anadiotis, G., Alexopoulos, P., Mpaslis, K., Zosakis, A.,
Kafentzis, K. and Kotis, K. (2010). Facilitating Dialogue –Using
Semantic Web Technology for eParticipation. Extended Semantic
Web Conference, June 2010, Crete.
Linked Data for the Masses29
Ερωτήσεις
????