Fluidification informationnelle et

mustardunfInternet και Εφαρμογές Web

21 Οκτ 2013 (πριν από 3 χρόνια και 11 μήνες)

64 εμφανίσεις

Fluidification informationnelle et
intermédiaires sociotechniques

Recherche d

informations

: enjeux et
perspectives autour du web s
é
mantique


Congrès Fadben
-

Evelyne Broudoux
-

29 mars 2008


Introduction


Etat des lieux du point de vue des
pratiques et des techniques


Quelles sont les pratiques actuelles


Problématique
: derrière la fluidité de la
recherche, une complexité qui
s’accentue

La consommation des médias

Chez les «

digital natives

»


Consommation plurimédias


L’ordinateur connecté est entré
progressivement dans les foyers


La consommation des «

nouveaux
médias

» excède souvent celle de la
télé/radio :
messagerie instantanée
,

mobile
,

web


Consommation individualisée centrée
autour de l’utilisateur qui «

choisit

»

Recherche d’informations
chez les «

digital natives

»


Pourquoi faire ?


Documenter une activité


Un jeu : recherche des jeux en réseaux


Un travail : exposé oral ou écrit


Dans un environnement


Dépendant d’un contexte (contraintes)


Variable et dépendant du zapping (mobilité)


Quels intermédiaires ?


Intermédiaires humains


S’inscrivent toujours dans une cha
î
ne critique de
validation de l’information


Sont susceptibles d’apporter une aide, mais aussi
de porter des jugements


Intermédiaires sociotechniques


Bénéficient de la «

neutralité

» apparente de la
technique


Ne préjugent pas (pour l’instant) de ce que vous
allez faire des informations

Etat des lieux chez les
«

digital natives

»


Pratiques
directes

de recherches d’infos par
automates interposés


Moteurs de recherche (Google, Yahoo)


Réseaux sociaux : liens de la blogosphère
(skyrock), communautaires (myspace), partage de
ressources (youtube, dailymotion, flickr, etc.),
autopublication (deviantart)


Ignorent le
savoir
-
faire

des infomédiaires
(intermédiaires humains)

Etat des lieux chez les
«

digital natives

»


Problèmes cognitifs rencontrés


«

Deep attention

» : capacité de se concentrer
longtemps sur un seul objet, en ignorant les
stimuli extérieurs pendant une longue période


«

Hyper attention

» : capacité de réaliser
plusieurs tâches en parallèle en changeant
d’objectif, faiblesse tolérance à l’ennui


Déluge informationnel : multiplication
des sources (fiables ou non)

Problèmes liés à l’évaluation
des informations


Confiance aveugle dans les résultats fournis
par les moteurs


Neutralité apparente


Référencement dit «

organique

» ou «

naturel

»


Une culture informationnelle trop rare


Fonctionnement technique et commercial des
moteurs de recherche et de recommandation


Processus de médiatisation et place des
infomédiaires


Fabrique de l’ « information

» : relations publiques,
journalisme, marketing politique, etc.

Problèmes liés à la
fluidification => médias


L’information journalistique file, court, passe,
elle est prise dans un flux sans fin


Seule la contrainte juridique obtient la rectification
publique des informations erronées


Celle
-
ci se produit en second plan et apparaît
donc accessoire au public (voir inexistante)


Les éventuelles «

suites

» données aux
informations sont rares et superficielles


Conclusion : peu importe que les informations
soient vraies ou fausses…

Conclusions pour les


«

digital natives

»


Point de vue pessimiste


La véracité de l’information n’a que peu
d’importance, l’essentiel étant de remplir
(
copions ce que nous trouvons
)


Inutile de creuser, passons à autre chose
(
ne cherchons pas à comprendre
)



Quelles solutions rechercher alors !

Une solution ? Apprendre à
fabriquer l’information


Apprendre à choisir en croisant les sources


Qu’est
-
ce qu’une information vraie ?


Qu’est
-
ce qu’une source fiable ?


Comment l’évaluer ?


Prévention du plagiat


Une urgence : dépasser le copier/coller en
apprenant la réécriture de manière ludique


Une solution : pratiquer la publication
«

personnelle

» en apprenant à fabriquer soi
-
m
ême de l’information

Comment ?


En manipulant les outils de publication
et de recherche actuels


Fabrique collective de l’info = wikis


Maitrise d’un concept éditorial = blogs


Recherche thématique d’information = rss


En opérant un retour critique encadré
sur les produits réalisés

Réalités techniques du web


Une complexification croissante


Différentes sources d’information


Des données hétérogènes


Des calculs et traitements sur ces données


Un web documentaire qui s’affirme


Métadonnées interopérables (XML et
RDF

: standard de description de
métadonnées)

Le web «

actuel

»


Première phase : 1996
-
2004


Introduction d’outils générant des sites web «

clés
-
en
-
mains

» : blogs, wikis, cms, ce qui démocratise
l’accès à la publication web


Les plates
-
formes de publication en ligne : blogs,
wikis (wikimedia : Wikipédia), misent sur la
collaboration massivement distribuée


Principales caractéristiques


De nouveaux formats éditoriaux (microblogging)


Une forte connectivité (blogosphère)

La recherche d’informations
du web «

actuel

»


Première phase : les moteurs de recherche


Processus d’indexation des documents sur le web et
classement en fonction de calculs statistiques


Documents vus par les algorithmes comme des jeux de
mots
-
clés auxquels on attribue des poids et sur lesquels on
effectue des statistiques


Principales caractéristiques


Un classement des réponses aux usagers basé sur la
fréquence des mots
-
clés des pages web ET


En fonction d’une analyse des liens «

entrants

» qui
détermine le référencement des sites web (qui pointe vers
qui ?)

Le web «

actuel

»


Deuxième phase : 2004
-
2008


L’industrie logicielle crée le «

web2.0

» dans l’objectif de
provoquer la migration «

en ligne

» d’activités

pratiquées sur
ordinateur personnel


Messagerie électronique : gmail


Traitement de texte, gestion de projets, outils de création


Partage de ressources : images, vidéos, signets


Les internautes consultent mais aussi
manipulent
la
«

ressource

» informationnelle (création
-
consommation
-
critique)


Principales caractéristiques


Identification des internautes par leur adresse électronique


Systématisation du réseautage


Par leurs activités, les internautes créent la valeur (UGC)

La recherche d’informations
du web «

actuel

»


Deuxième phase : évaluation par les usagers


Processus d’indexation collaborative des documents sur le
web (généralisation du «

tagging

»)


Évaluation et classement possible des ressources par les
usagers (généralisation des commentaires et votes)


Principales caractéristiques


Appropriation par les usagers de la notion de
«

métadonnées

» avec les «

folksonomies

»


L’utilisation de métadonnées interopérables se
démocratise (fils rss encodés en RDF)


Enjeu : faire se rejoindre les pratiques des usagers
avec celles des professionnels (tags et thésaurus)

Promesses du web
sémantique


Tim Berners Lee, W3C, 2001 :
« un vaste
espace d’échanges de ressources entre
machines permettant l’exploitation de grands
volumes d’informations et de services variés,
aidant les utilisateurs en les libérant d’une
bonne partie de leur travail de recherche

et de combinaison

de ces ressources »


Objectif : informer les gens ET les machines
en rendant le web intelligent

Promesses du web
sémantique


Web actuel

: l’objectif principal est de
transmettre

des contenus

intelligibles, leur
restitution sur écran doit
être fidèle à ce que
veulent les auteurs


Web sémantique

: l’objectif principal qui
s’ajoute au précédent est de
produire des
contenus

par des traitements


Comment ? En préjugeant ce que veulent les
internautes =>

formalisations produisant de
l’intelligibilité
[Bachimont, 2003]

Caractéristiques du web
sémantique


Les ressources


peuvent
être des documents mais aussi des
programmes, des interfaces web, des services


sont caractérisées par leurs
métadonnées


Chaque ressource est reliée aux autres par
des
relations
hiérarchiques ou associatives

(étiquettage des liens), indiquant leur
appartenance à des domaines


Les connaissances sur les domaines sont
formalisées (définition et relation entre les
termes) et organisées en
ontologies

Vers le web «

sémantique

»

(W3C Semantic Web Activity, Koivunen and Miller, 2001)

URI
, URL et URN







Une
URI

(uniform ressource identifier) est une
chaîne de caractères identifiant une ressource web
physique ou abstraite qui peut
être de type
«

accès

»
locator
, ou «

nom

»
name

ou les deux






URI,
URL

et URN





• Une
URL

(Uniform Resource Locator) est une
URI qui fournit l’accès à une ressource.

URI, URL et
URN








Une
URN
(Uniform Resource Name) est une URI qui
identifie une ressource par son nom unique dans un
espace de noms.


Une URN peut être employée pour parler d'une ressource
sans s’occuper de son emplacement ou de la manière de la
référencer.


Par exemple, l'URN urn:isbn:0
-
395
-
36341
-
1 est une URI
qui, comme un
International Standard Book Number

(ISBN),
est une référence à un livre.

Web de demain ?



Liens entre documentation et informatique réalisé, il
manque le lien avec l’enseignement