LIVRE BLANC - Olivier Jacquemont

mustardunfInternet and Web Development

Oct 21, 2013 (3 years and 9 months ago)

323 views


LIVRE BLANC


Les d
onnées

sociales

:
De nouvelles
perspective
s

p
our les systèmes
d’information
décisionnels

?



L
es données sociales

:

De nouvelles perspectives pour le
s SID

2

Préambule

A propos de
Logica

Business

Consulting

Le Groupe Logica est un acteur européen majeur des services informatiques qui
réunit 39 000 personnes dans 36 pays, dont
10

000 collaborateurs en France. Son
activité englobe le conseil en management, l’intégration de systèmes et
l’outsourcing
de processus métier et IT. Logica travaille en étroite collaboration
avec ses clients afin de les aider à libérer leur potentiel pour devenir plus
productifs, accélérer leur croissance et mieux gérer les risques. Logica s’appuie sur
ses connaissances appro
fondies des secteurs, son excellence en matière de
technologie et de production ainsi que sur son expertise en matière de delivery
pour aider ses clients à se positionner en tête de leurs marchés respectifs.


Logica Business Consulting, quatrième acteur du

conseil en France, se positionne
avec une approche « catalyseur des idées et des énergies » pour accompagner les
grandes entreprises et organisations dans l'amélioration de leurs performances
opérationnelles. Ses 1
250

consultants se différencient par l’é
quilibre de leurs
compétences sur les volets métiers, fonctionnels et technologiques.

Au sein de cette entité, l’équipe BI adopte une posture de conseil vis
-
à
-
vis du
marché global de la Business Intelligence et n’hésite pas à se positionner sur des
sujets
d’innovation tels que les réseaux sociaux.
De manière générale, s
es
consultants expérimentés
accompagnent les clients
sur
d
es problématiques
d’organisation, d’urbanisation et de pilotage de la performance mais
fournissent
également une expertise technologi
que

avancée.


Logica est coté à la Bourse de Londres et d'Amsterdam (LSE : LOG ; Euronext :
LOG). Pour plus d’informations, consultez le site www.logica.com/france




L
es données sociales

:

De nouvelles perspectives pour le
s SID

3

Objet du Livre Blanc

La Business I
ntelligence a atteint une grande maturité dans la valor
isation des
informations structurées et internes à l’entreprise.
L’intégration de données
externes et, plus récemment
,
le croisement de données structurées et non
structuré
es ont considérablement enrichi

les
environnements dé
cisionnels
.
Ces
dernières
années
, l’émergence fulgurante des
medias

sociaux

et des technologies
du web 2.0 en général,
constitue de nouvelles sources de données et donne

de
nouvelles perspectives à la Business I
ntelligence de demain. Il est question ici de
s
données
que nous appelle
rons sociale
s
.


Issue
s

de
s

interac
tions entre les personnes,
les données sociales

caractérisent
l’activité des
individus

au sein d’un réseau social
.
Même si l
a notion de réseau social
est loin d’être un néologisme et
bien que
l’analyse des réseaux sociaux

soit

une
discipline vieille de plus de
50

ans, l’explosion
des outils de
réseau socia
l
, appelés
médias sociaux,
produit aujourd’hui des gisements

de données
sociale
s

sans
précédent
que
l’entreprise doit apprendre à valoriser
.


En effet, q
ue
l
es d
onnées
provienne
nt

d’
un

media

social d’entreprise

ou d’un
media

social public
tel que
Facebo
ok,
Twitter ou LinkedIn
,

leur

analyse
apporte
de l’information sociale

à forte valeur
ajoutée
sur
les interactions entre les
collaborateurs
de l’
entreprise, les
interactions entre les clients ou les
fournisseurs
,

et de manière générale, les
interactions entre les acteurs de
l’écosystème de l’entreprise

étendue
.




Les
médias sociaux

exploitent déjà cette information à des fins commerciales, en
vendant des espaces

publicitaires
très
ciblés aux entreprises et des accès
«

Premium

»

aux utilisateurs.





Plus récemment, l
’ouverture d’API
(App
lication Programming Interface),
permettant d’interopérer avec les
données
ouvertes
d
’un ou plusieurs

medias

sociaux
,

offre

de nouvelles
perspectives
d
’exploit
ation de
s données
sociale
s
.





Chiffres clés

400

millions de comptes actifs Facebook
dont 16 en France

105

millions d’utilisateurs Twitter

70

millions d’utilisateurs LinkedIn

456%

de croissance pour les ventes de
solutions de
medias

sociaux d’entreprise d’ici
à 2013 (source Forrester)

Les consortiums sur les données ouvertes et
interopérables se multiplient. D’importants
volumes de données sociales sont déjà
disponibles sur les plateformes OpenSoci
al
(Google), W3C, Open Mashup Alliance ou
Linked Data. Autant d’informations qui
pourraient être valorisées dans un système
d’information décisionnel.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

4


I
ntégrer
des
flux de
données

sociale
s

dans
le

système
d’information
décisionnel
d’entreprise serait
-
il la prochaine
étape

? Peut
-
on mettre
les données sociales

de
l’écosystème de l’entreprise
en résonance
avec les environnements BI
qu’elle a déjà
mis en place

?

Dans quels cas cela pourrait
-
il être pertinent et quelle en
serait la
valeur ajoutée pour l’entreprise

?


Né d’une réflexion interne sur le mariage

B
usiness
I
ntelligence et réseaux s
ociaux,
ce livre blanc vise à mesurer les opportunités et les enjeux de l’exploitation des
données sociales dans
l’environnement décis
ionnel
.



Figure
1

:
De
nouvelles perspectives
pour

la Business I
ntelligence



Mots clés

Business
I
ntelligence,
r
éseau

s
ocial
,
r
éseau

s
ocial

d’
e
ntreprise,
média
s

sociaux,
données sociales, i
nformation s
ociale




L
es données sociales

:

De nouvelles perspectives pour le
s SID

5

Précision

Nous identifions comme important le fait de bien distinguer les termes de réseaux
sociaux (interactions entre des personnes) et de medias sociaux (outillage
informatique de ces réseaux sociaux). A la lumière de cette précision, nous pouvons
cependant
consi
dérer que le terme Médias Sociaux est un synonyme de
l’acceptation usuelle du terme Réseaux Sociaux.

Guide

de lecture

Ce document a été écrit avec la volonté de s’adresser au p
lus grand nombre. Il ne
requiert

pas de bagage technique avancé et se veut compr
éhensible par tous.


Cependant, à la suite de la première partie de définition des concepts de base
manipulés dans le livre blanc, la seconde partie
est plus théorique et s’attache à
démontrer la faisabilité de l’intégration des données sociales dans le sy
stème
d’information décisionnel.
Les lecteurs plus intéressés par l’utilisation qui pourrait
être faire des données sociales trouveront de nombreux axes de réflexion en lisant
la dernière partie intitulée

«

l’exploitation des données sociales dans un systè
me
d’information décisionnel

».

Réagir au contenu

En tant qu’utilisateurs de plates
-
formes de Business Intelligence, Analyste,
Décideur, Architecte, Directeur des Systèmes d’Information, Expert de la Sécurité
ou simple curieux... vos avis et commentaires n
ous intéressent.


N’hésitez pas à réagir au contenu de ce document.


Pour contacter Logica Business Consulting

Olivier Jacquemont, M
anager de la division Business Intelligence


olivier.jacquemont@logica.com


+33 1 57 87 40 00


www.logica.com




L
es données sociales

:

De nouvelles perspectives pour le
s SID

6

Table
des matières


PREAMBULE

................................
................................
................................

2

A

PROPOS DE
L
OGICA
B
USINESS
C
ONSULTING

................................
.........................

2

O
BJET DU
L
IVRE
B
LANC

................................
................................
....................

3

M
OTS CLES

................................
................................
................................
..

4

P
RECISION

................................
................................
................................
...

5

G
UIDE DE LECTURE

................................
................................
.........................

5

R
EAGIR AU CONTENU

................................
................................
.......................

5

TABLE DES MATIERES

................................
................................
.................

6

TABLE DES ILLUSTRATI
ONS

................................
................................
.......

7

QUELQUES D
EFINITIONS

................................
................................
............

8

L
A
B
USINESS
I
NTELLIGENCE

................................
................................
..............

8

D
ONNEES SOCIALES ET I
NFORMATION SOCIALE

................................
........................

11

L’E
COSYSTEME DE L

ENTREPRISE ETENDUE

................................
.............................

13

LES DONNEES SOCIALES

AU SEIN DE L’ECOSYST
EME DE L’ENTREPRISE

..

14

O
U SE TROUVENT LES DO
NNEES SOCIALES

?

................................
...........................

14

C
OMMENT LES INTEGRER
AU SYSTEME
BI

?

................................
............................

15

Q
UELLE VALEUR BRUTE P
ORTENT LES DONNEES S
OCIALES
?

................................
..........

19

L’EXPLOITATION DES D
ONNEES SOCIALES DANS

UN SYSTEME
D’INFORMATION DECISI
ONNEL

................................
................................

21

A

L

ORIGINE

:

V
ALORISER DES TICKETS

D

APPELS POUR MINIMISE
R L

ATTRITION DANS LE
SECTEUR DES TELECOMM
UNICATIONS

................................
................................
...

21

Q
UICKWIN

:

E
XPLOITER LES DONNEES

SOCIALES ISSUES DU R
ESEAU SOCIAL D

ENTREPRISE

...

24

A
LLER PLUS LOIN

:

E
XPLOITER DES DONNEES

SOCIALES EXTERNES A
L

ENTREPRISE

.............

29

POINTS D’ATTENTION E
T PRECONISATIONS

................................
............

33

L
E SOURCING

................................
................................
...............................

33

A
NALYSE SEMANTIQUE

................................
................................
....................

33

L
A CONFIDENTIALITE

................................
................................
......................

33

L
A PERTINENCE
ET LA REPRESENTATIVI
TE DES DONNEES

................................
.............

33

L’APPROCHE LOGICA BU
SINESS CONSULTING

................................
.........

34

GLOSSAIRE

................................
................................
...............................

35



L
es données sociales

:

De nouvelles perspectives pour le
s SID

7

Table des illustrations


F
IGURE
1

:

D
E NOUVELLES PERSPECT
IVES POUR LA
B
USINESS
I
NTELLIGENCE

................................
................................
..

4

F
IGURE
2

:

P
ROCESSUS DE MISE A D
ISPOSITION DE L

INFORMATION DANS UN
SYSTEME
BI

................................
..............

10

F
IGURE
3

:

E
COSYSTEME DE L

ENTREPRISE ETENDUE

................................
................................
...............................

13

F
IGURE
4

:

P
ANORAMA DES SOURCES
DE DONNEES DE L

ECOSYSTEME DE L

ENTREPRISE ETENDUE

................................
....

14

F
IGURE
5

:

R
EPRESENTATION D

UN R
ESEAU SOCIAL SELON L
A THEORIE DES GRAPHE
S

................................
.....................

17

F
IGURE
6

:

C
ORRESPONDANCE
M
ATRICE
-

S
OCIOGRAMME

................................
................................
......................

18

F
IGURE
7

:

L’
EXPLOITATION DES DON
NEES SOCIALES DANS U
N SYSTEME DECISIONNE
L POUR MINIMISER LE
CHURN
.

.............

22

F
IGURE
8

:

E
XPLOITATION DES DONN
EES SOCIALES DANS UN

SYSTEME DECISIONNEL
POUR AMELIORER LA PE
RFORMANCE DE SES
EQUIPES COMMERCIALES

................................
................................
................................
..........................

28

F
IGURE
9

:

T
ABLEAU DE BORD DE SU
IVI DE LA PERFORMANC
E D

UNE EQUIPE COMMERCIA
LE

................................
...........

28




L
es données sociales

:

De nouvelles perspectives pour le
s SID

8

Quelques définitions

La
Business Intelligence

La B
usiness
I
ntelligence

(BI)
, ou
informatique d
écisionnel
le
,

désigne les
méthodes
et
outils d’aide à la décision qui permettent
à des analystes ou à des responsables

de l’entreprise de piloter
l
eur
activité

en disposant en permanence des informations
nécessaires à la prise de décision
.




A partir des données disponibles dans l’entreprise, l
a Business I
ntelligence apport
e
aux décideurs l
es indicateurs clés qui
leurs
permettent de répondre à ces questions
et de les accompagner dans le processus de décisio
n.

L’objectif de ces outils est
d’être capable de
réaliser

des analyses détaillées sur les données de l’entreprise
pour expliquer des résultats, comprendre des phénomènes, détecter des ten
dances
et même prédire l’avenir

!



Voici les trois phases sur lesqu
elles repose la mise à disposition d’information
s

clés
à partir des différentes sources de données de l’entreprise.

La collecte

des données de l’entreprise

L’entreprise dispose aujourd’hui d
e nombreuses sources de données hétérogènes
qui peuvent être inter
nes et/ou externes à l’entreprise.
On compte parmi
elles, les
données opérationnelles
structurées issues des bases de données des systèmes
ERP, CRM ou PLM et plus généralement de toutes les applications métiers.
Ces
données «

classiques

»
de production, d
e vente ou de stock
sont parfois complétées
par l
es données non
-
structurées qui circulent dans l’entreprise telles que les
documents
produits par les collaborateurs,
les emails

et autre
s

champs de textes.


Aujourd’hui, des systèmes décisionnels intègrent é
galement des flux de données
externes telles que des données économiques,
financières,
démographiques,
sociales
ou encore des

données météorologiques,
sur le trafic aérien qui permettent
de comprendre des phénomènes qui dépassent parfois l’entreprise.


Une

fois que le périmètre du système décisio
nnel a été défini, il s’agît d’intégrer
les

données pertinentes parmi les sources de données
grâce à un outil
d’intégration de
données appelé
ETL
(Extract
, Transform
, Load
)


Quelle est l’évolution du chiffre d’affaires sur le premier semestre

? Est
-
elle alignée avec les
objectifs fixés

? Les résultats d
e mes équipes sont
-
ils homogènes

? Quel est le produit
responsable de ma croissance

? Dois
-
je déclencher un plan d’action
s

sur la région
commerciale sur laquelle je rencontre des difficultés

? Quelle est la tendance sur cette région
depuis quelques années

?

L
es données sociales

:

De nouvelles perspectives pour le
s SID

9

L’intégration

A la suite du processus de
collecte d’in
formation, il s’agît d’unifier d
es données aux
formats hétérogènes pour les intégrer dans l’environnement décisionnel. L’objectif
étant d’obtenir un ensemble cohérent de données qu’il sera possible de croiser dans
la

phase de restitution
.

La d
iversité des données, des problématiques métiers et l’explosion des volumes de
données
nécessite s
ouvent d’éclater
«

l’entrepôt de données

»

(datawarehouse),
qui rassemble toutes les données collectées,
en «

magasins de données

»
spéci
alisé
s (datamart).



La

restitution

La
phase de
restitution correspond à la mise à disposition des
informations

de
l’environnement décisionnel. Selon les besoins métiers, cette restitution peut
prendre
les
différentes formes

suivantes

:



Reporting

Le rapport est le mode de restitution le plus classique. Il permet de présenter des
données de manière synthétique et lisible.
Il s’agît de rapports
prédéfinis

(ou
statiques),
mis à disposition des utilisateurs à travers un portail pour qu’il
s

puisse
nt

le
s

consulter et les
rafraichir à tout moment.



Reporting
ad’h
oc

Le reporting
ad’hoc

s’oppose au reporting classique puisqu’il répond à un besoin
d’analyse interactive. Appelé en français, analyse à la demande, il permet de
chercher de l’information en effectu
ant des analyses successives, les résultats d’une
recherche
influençant la recherche suivante.



Tableau de bord

Le tableau d
e bord est un mode de restitution dédié au pilotage de l’activité
.

L’intérêt est de rassembler un ensemble d’indicateurs de performan
ce dans une
même fenêtre afin de suivre l’évolution des résultats en un clin d’œil. Il s’agît de
créer des vues personnalisées rassemblant tableaux, graphiques, jauges, qui
répondent à des besoins métiers spécifiques.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

10



Cube OLAP (OnLine Analytical Process
ing)

Le cube OLAP répond aux besoins utilisateurs de réaliser des analyses quantitatives
dynamiques selon plusieurs angles de vues, appelés dimensions. Il offre des
possibilités de navigation dans les données et des fonctionnalités d’analyse
avancées qui e
n font le mode de restitution phare des environnements décisionnels
d’aujourd’hui.

L’analyse
multi
d
imensionnelle

permet
,

par exemple,
de visualiser un résultat tel
que le chiffre d’affaires
selon la dimension temps, la dimension géographi
e

et la
dimension produit. Ainsi, un dirigeant d’entreprise
a la possibilité de

ventiler son
chiffre d’affaires sur les douze mois de l’
année ou sur les quatre trimestres, mais
également sur les différentes régions du portefeuille puis sur les différents pa
ys. S’il
a besoin de passer d’un niveau agrégé à un niveau plus fin d’analyse, il peut aussi
ventiler le chiffre d’affaires par produit.




Figure
2

: Processus de mise à disposition de l’information dans un système BI



L
es données sociales

:

De nouvelles perspectives pour le
s SID

11

Données
so
ciales et

i
nformation s
ociale

Quelle est la différence

?

Les données sociales désignent les caractéristiques des interactions ent
re les
personnes. L’information sociale est la valeur qui peut être générée à partir de ces
données brutes. Appliqué au monde

de l
’entreprise, il s’agît de l’information
valorisant les liens
entre les différents acteurs de l’écosystème de l’entreprise

étendue
.




Les données sociales apportent les réponses aux premières questions alors que
l’information sociale découle de l’analyse de
s

données
brutes pour répondre aux
der
nières.



D’où proviennent les données sociales

?

Les données sociales sont générées lors
d’une discussion orale,
d’une collaboration
quelconque,
d’une communication téléphonique, d’échanges emails, ou, plus
récemment,
des interactions entre les utilisateu
rs à travers les
technologies

du Web
2.0 comme les réseaux sociaux
.

Même si les données sociales n’émergent pas forcément de médias technologiques,
seules les données

sociale
s

provenant d’
interaction
s

outillées

sont

raisonnablement
exploitable
s
.

Ainsi, nous nous limiterons aux sources de données informatiques,

qu’elles soient internes ou externes à l’entreprise.



Au sein de ces sources, v
oi
ci les trois types de données

que nous considérerons
comme sociale
s

:

-

Les caractéristiques des individus

(P
rofils)

-

Les liens entre personnes


(Relations)

-

Le contenu des échanges


(Flux d’information)





Qui parle avec qui

? Qui fait quoi

? Qui échange quoi

?

Quelles sont les personnes influentes de mon réseau

? Qui
est au centre de mes réseaux

?

L
es données sociales

:

De nouvelles perspectives pour le
s SID

12




L
e développement
de
médias

sociaux grands publics

tels que Facebook,

Twitter, de
réseaux professionnels tels que LinkedIn ou Viadeo et même de réseaux sociaux
internes à l’entreprise sont générateurs d’un immense volu
m
e de données

explicitement et
exclusivement
sociale
s
.

Ce capital d’information sociale
formelle
,
explicite, directe

explose et portera bientôt sur la majeure partie de la population.
On verra qu’il s’ajoute à d’autres sources d’information sociale plus
informelles,
implicite
s
, indirectes
.

L’entreprise devra rapidement apprendre à maitriser et à intégrer ce nouveau type
de données afin d’en profiter

:


"Le premier ROI de vos efforts de communication dans les médias sociaux
n’est autre que la pérennité de
votre activité sur les 5 ans à venir

…" (Erik
Qualman)



Médias

Sociaux d’Entreprise

2010 est considéré comme l’an 1 des
médias

sociaux d’entreprise. S’ils sont déjà
67 mi
llions d’utilisateurs
aujourd’hui, ils
seront 164 millions d’ici à 2014.



(source Radicati Group)

Médias

S
ociaux

Alors que Twitter a enregistré une croissance
au
-
delà des 500% en 2009, Facebook a
annoncé récemment son ambition d’atteindre
le milliard
d’utilisateurs en 2012.

Peut être plus important encore, le temps
mensuel moyen passé sur les
médias

sociaux, intimement lié au contenu généré,
était de 5h30 par personne en février
dernier, en croissance de 60% sur un an
(source Nielsen).

Facebook a dépas
sé l’audience de Google
aux Etats
-
Unis en mars dernier.



(source ComScore)

L
es données sociales

:

De nouvelles perspectives pour le
s SID

1
3

L’Ecosystème de l’entreprise é
tendue

L’écosystème de l’entreprise étendue correspond
au réseau de l’ensemble des
individus en lien
plus ou moins
direct avec l’entreprise.


Les personnes en lien direc
t avec l’entreprise
sont
les personnes dont la relation
avec l’entreprise est clairement identifié
e
.
C’est
l’en
semble d
es collaborateurs,
partenaires
et fournisseurs
mais aussi les clients et les prospects clairement
identifiés par l’entreprise.

Pour compl
éter notre écosystème,
les personnes en lien indirect
avec l’entreprise
sont les individus
avec qui l’entreprise a des intérêts communs sans pour aut
ant
être
en relation direct avec eux
. Il s’agît
des clients
et prospects non
-
identifiés
(issus
des canaux
de distribution indirects
)
,
d’experts dans le même domaine que
l’entreprise,
de personnes influentes
dans le
secteur

d’activité de l’entreprise

ou
tout simplement de personnes s’intéressant à l’entreprise
.

C’est typiquement la
population que l’on retrouve
sur les
médias

sociaux grand
-
public
s
.
Cette dimension
de l’entreprise étendue a toute son importance dans notre problématique puisque
l’acquisition et l’exploitation d’information sociale dans un système décisionnel
pourrait être le moyen de se rapprocher
efficacement
de ce réseau «

indirect

».





Figure
3

: Ecosystème de l’entreprise étendue



Réseau étendu
Concurrents,
Prospects
Clients,
Partenaires,
Fournisseurs
Collaborateurs
L
es données sociales

:

De nouvelles perspectives pour le
s SID

14

Les données
sociale
s

au sein de l’écosystème
de l’
Entreprise

Où se trouvent les données sociales

?

Les données sociales se trouvent dans
de nombreuses sources de l’entreprise. En
effet, à partir du moment où une source contient
au moins
un des trois types
d’information sociale
suivants
et qu’e
lle
entre dans le périmètre de l’environnement
décisionnel, elle pourra servir à enrichir le modèle

de données
.


Rappel des
trois types d
e données sociales

:

-

Les caractéristiques des individus

(Profils)

-

Les liens entre personnes


(Relations)

-

Le contenu des échanges


(Flux d’information)


Voici un panorama des sources de l’écosystème de l’entreprise. Les

dimensions
interne
/
externe et structuré
/
non
-
structuré permettent d’évaluer la complexité
d’intégration de ces données
dans le

système décisionnel.
Les sources internes et
structurées étant les plus simples alors que les sources externes et non
-
structurées

sont les plus complexes.




Figure
4

: Panorama des sources de données

de

l’écosystème de l’entreprise
étendue




L
es données sociales

:

De nouvelles perspectives pour le
s SID

15

Comment l
es

intégrer
au

système BI

?

Collecte

des données

Parmi les différentes sources de données sociales, l’enjeu est de collecter
uniquement les données qui
apportent

de la valeur dans l’environnement
décisionnel. L’homogénéisation des données permet ensuite d
e les
agréger pour
créer le
mix

de données sociale
s



mashup

»)

le plus approprié.


Alors que l’entreprise a un accès direct à ses propres données internes, qu’elles
soient structurées ou non, les données externes et notamment sociales ne sont pas
toujours facilement accessibles.


Il existe plusieurs
méthodes d’extraction des données sociales exter
nes dont voici
les principales

:



Le crawling

:

Le crawling est une méthode d’exploration des ressources du web. Initialement
destinée au
x

moteur
s

d
e recherche pour indexer le web, e
lle peut
également
être
app
liquée à l’extraction de
s

données sociales contenu
es

dans les

pages des
médias
sociaux
.

A partir de quelques points d’entrées dans un réseau social, le crawling

permet d’explorer le réseau de manière récursive en allant d’individu en individu
par l’intermé
diaire des liens.



API

(Application Programming Interface)

et mashup

:

Les API, interface de programmation en français,
sont destinées à faciliter
l’interopérabilité des applications informatiques. Cela correspond à l’ensemble des
fonctions, procédures, cla
sses et protocoles qui régi
t

la communication avec une
application.

L’utilisation de plusieurs API permet aux utilisateurs de créer des
mashup de données (agrégation de données provenant de sources
externes
hétérogènes)
et de les
intégrer
à l’environnement

décisionnel
. Dans l’ère Web 2.0,
de nombreux outils et projets cherchent à faciliter l’accès direct aux données
notamment sociales des réseaux les plus célèbres

:

o

OpenSocial

est un ensemble d'
API

d
éveloppé par Google

afin d’unifier l’interopérabilité avec tous les réseaux
sociaux en ligne partenaires. OpenSocial donne
notamment accès aux données MySpace, Friendster et
Orkut.

o

OpenData
,

LinkedData
et
Ope
n
M
ashup

Alliance

sont
des initiatives

internationales
en plein essor
,

pour
l’adoption de langages ouverts facilitant
l’interopérabilité des données du web et notamment des données
sociales. Alors que les deux premières cherchent respectivement à
définir d
es bonnes pratiques d’ouverture des données et des
méthodes pour lier les informations du web entre elles, la troisième
promeut la
création de mashup d’entreprise
.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

16

o

Graph API et
OpenGraph
Protocol
sont les outils Facebook
qui permettent
d’interagir
simplement
avec les données
Facebook

en accédant directement aux données.

o

Twitter

API est l’équivalent Twitter qui donne
accès aux
nombreux flux d’information de cette plateforme de
réseaux sociaux.


Intégration des données



Principe de modélisation

Une fo
is que l
es données sociales ont

été collectée
s

et homogénéisée
s, il s’agît de
les

modéliser de manière
logique

pour
agréger les différentes sources de données
sur un même modèle.


Dans le cas de l’analyse des réseaux sociaux, l
’idéal est de
collecter

l’inf
ormation
sous forme matricielle (relationnelle) et de la visualiser sous forme graphique.

Cela fait appel à
deux principes de modélisation.
D’u
ne part, la théorie des graphes



dont

le mathématicien Euler est à l’origine (XVIIIe siècle)

-

s’est imposée com
me
la principale méthode de représentation des réseaux sociaux. A côté de cela, le
modèle de données relationnel sous forme matriciel
le

facilite la manipulation et
l’exploitation d’importants volumes
de données

sociale
s
.

Pour aller plus loin dans
la modéli
sation des données sociales, il existe également
des

ontologies issues des techniques d’analyse sémantique. Certains modèles
ontologiques permettent de structurer les termes et les concepts de champs
d’information
s

hétérogènes pour pouvoir les exploiter.


o

La
Théorie des graphes

La théorie des graphes a deux avantages qui en
font le modèle incontournable de
représentation des réseaux
sociaux. Le premier avantage est qu’elle facilite la
visualisation de la structure du

réseau (nœuds et liens),

son exploration

et la mise
en évidence de ses propriétés structurales. Le second avantage est qu’elle
comporte un ensemble de concepts formels qui permet de qualifier, de distinguer et
de classer les structures relationnelles

par rapport à une multitude de propriétés
fon
damentales de distribution et d’agencement des liens sociaux au sein des
réseaux.


L’utilisation de la théorie des graphes dans la représentation des réseaux sociaux

d
onne naissance aux sociogrammes.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

17


Sociogramme G (V, E)


V

: Ensemble des nœuds

E

:
Ensemble des liens


Ordre = 12

Diamètre = 5

Densité = 17/(12*11) = 0,13


Figure
5

: Représentation d’un réseau social selon la théorie des graphes


Voici les
principaux
concepts
manipulés dans
la théorie des graphes, décliné
s

pour
la représentation des réseaux sociaux

:

-

Un

n
œud

(ou sommet) est l’unité de base des réseaux. Dans un réseau
social, il représente un individu.

-

Un

l
ien

(ou arrête) est une connexion entre 2 nœuds.

On parle de lien
orienté lorsque le lien a une direction (d’un nœud vers un autre) et à
l’inverse, on parle de lien non
-
orienté lorsque le lien est bidirectionnel.

-

Un
s
ocio
gra
mme

correspond à un ensemble de nœuds et de liens
.

-

Un
lien pondéré

est un lien a
uquel on associe un poids
.

-

Un
lien étiqueté

est un lien auquel on associe un label
.

-

Un
chemin

est une séquence de lien
s

qui relie 2 nœuds
.

-

Un
chemin orienté

est un chemin qui respecte l’orientation des liens
.

-

Une
géodésique

est l’un des plus courts chemins entre 2 nœuds
.

-

Un graphe est
connexe

lorsqu’il existe un chemin entre toutes les paires de
nœuds.


Voici les indicateurs de base
qui en découlent

:

-

Le
degré

d’un nœud est le nombre de liens qui en partent où y arrivent

-

La
longueur d’un

chemin
géodésique
est appelé
distance géodésique
.

-

Le
diamètre

d’un graphe

est la longueur

du chemin géodésique le plus long
de ce graphe

-

L’ordre

d’un graphe correspond au nombre de nœuds de ce graphe

-

La
densité

d’un graphe correspond au rapport entre le nombre de liens et le
nombre maximum de liens possible
. Lorsque la densité est égale à 1, cela
signifie que toutes les relations possibles existent.

On parle alors de
graphe
complet

ou de
clique
.


o

Les m
atrices

Lo
rsque le nombre de nœuds et de liens est trop important, l
a
visualisation

et le
calcul
des concepts d’ordre, de densité, de
distance
géodésique ou de dia
mètre
devien
nen
t très complexe
s
.

Pour cela, la matrice est l’objet mathématique
qui complète
le mieux
l
a théorie des
graphes en facilitant la manipulation des concepts cités précédemment
. La
L
es données sociales

:

De nouvelles perspectives pour le
s SID

18

représentation matricielle correspond au modèle de données relationnel et permet
donc de représenter l’information sociale dans un format plus conventionnel.


Parmi les

matrices, o
n dis
tingue les matrices d‘adjacence

et les matrices
d’incidence

:

-

Les matrices d’adjacence sont des matrices carrées qui ont les mêmes
ressources en ligne qu’en colonne. Les matrices d’adjacence servent à
représenter les liens qu’il existe ent
re les nœuds. La valeur contenue dans la
case A
ij

indiquant le poids de la relation entre le nœud i et le nœud j.

-

A l’inverse, une matrice d’incidence contient des objets différents en ligne et
en colonne. La valeur contenue dans la case A
ij

indiquant la relation entre
l’objet i et l’objet j.



Voici la matrice d’adjacence correspondant au sociogramme précédent (Figure 5).





Figure
6

: Correspondance Matrice
-

Sociogramme


o

Les o
ntologie
s

La limite des techniques de modélisation précédentes
réside

dans la représentation
d
u contenu des échanges
entre les individus d’un réseau. En effet,
la va
lorisation
du contenu participatif du web 2.0 tel que celui des posts, des commentaires ou des
tweets
, nécessite de le rendre accessible et compréhensible par une suite logicielle

pour automatiser leur traitement
.
On parle de sémantisation du contenu.



Il existe pour cela un ensemble de modèles ontologiques qui permettent de
représenter
tous les types de

données soc
iales pour les rendre exploitables

par un
e
solution informatique
comme une solution de Business I
ntelligence
.


Le modèle ontologique le plus connu est FOAF (Friend Of A Friend)
. Il sert à
modéliser précisément les profils des u
tilisateurs, leur

activité et leurs relations
avec d’autres utilisateurs.

D’autres modèles ontologiques comme
Relationship,
SIOC (
Semantically
-
Interlinked
Online Communities
), SKOS (Simple Knowledge Organisation System), SKOT
L
es données sociales

:

De nouvelles perspectives pour le
s SID

19

(Social Semantic Clouds of Tags)
et MOAT permet
tent d’aller plus loin en
modélisant le contenu et la signification des interactions participative
s entre les
utilisateurs
2.0.


Quelle
valeur

brute

portent les données

sociales
?

Une fois intégrées et modélisées, les données sociales peuvent
être manipulée
s
pour générer un certain nombre d’indicateurs qui serviront de base à l’analyse et à
l’exploitation des données sociales.
Une grande partie de ces indicateurs

est issue
des théories d’analyse des réseaux sociaux.

L’
Analyse des Réseaux Sociaux

(ARS)

L’
ARS
est basée sur la théorie des réseaux, la théorie des graphes et l’analyse
sociologique
. Cette discipline très universitaire, dont le précurseur serait Georg
Simmel (1858
-
1918),
est bien antérieure à l’apparition des technologies
de
l’information et du Web
2.0.

Cepen
dant, les
méthodes de collecte,
d’intégration
et de modélisation
des données
sociale
s

décrites précédemment permettent
d’
appliquer
facilement
les théories
d’ARS

à notre modèle de données
.


Depuis Georg Simmel,
de nombreux scientifiques, mathématiciens, informaticiens
ou sociologues ont
travaillé à la
qualification

des réseaux sociaux.
C’est à eux que
l’on doit les
concepts, in
dicateurs et algorithmes qui aident à qualifier

un réseau.


Voici les quelques concepts

d’ARS qui complètent les concepts issus de la théorie
des graphes

:

-

Un
trou structure
l

correspond à l’absence de lien entre deux nœuds.
L
es
personnes proches d
’un trou structur
e
l

sont les personnes les mieux
informées et le plus rapidement.
Ce sont les pe
rsonnes les plus susceptibles
d’avoir de bonnes idées.

-

La
résistance

d’un réseau social se réfère à l’impact du retrait de nœuds ou
de liens au sein du réseau. Le retrait d’un nœud ou d’un lien stratégique
peut
par exemple
scinder un réseau en deux.

-

Les
composants
,
cliques
, ou
cycles

sont des structures de sous
-
ensembles d’un réseau.


Outre les indicateurs d’ordre, de diamètre, de densité, ou de degré
,

énoncés dans
le paragraphe précédent,
il existe également les indicateurs suivants

:

-

Centralité

o

De degré

: Valorise les nœuds ayant le plus de liens
.

o

D’intermédiarité

: Valorise les nœuds rapprochant les autres nœuds
(intermédiaires)
. Lorsqu’un nœud est le seul à rapprocher deux
autres nœuds, il détient le contrôle de l’information
circulant entre
ces deux
nœuds.

o

De proximité

: Valorise les nœuds les plus proches des autres nœuds
.

o

De vecteur

: Valorise les nœuds ayant les voisins les plus centraux
.

o

De prestige

: Valorise les nœuds ayant le plus de liens entrants
.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

20

-

Coefficient de clustering

:
Mesure la probabi
lité que deux nœuds reliés à
un même nœud soient reliés entre eux.


Ces indicateurs

de base
sont

utilisés dans le

système
d’information
décisionnel pour
créer des variables plus spécifiques qui réponde
nt aux besoins de l’entreprise.





Web s
émantique

Les

technologies de

web sémantique et les

méthodes de modélisation ontologiques
citées précédemment

rendent le contenu
participatif non
-
structuré

expl
oitable par
le système d’information décisionnel pour qu’il entre dans la prise de décision
.


Des solutions de
«

text mining

»
, mêlant intelligence artificielle et linguistique, sont
capables de valoriser
instantanément
ce contenu
en
pondérant

sa pertinenc
e, en
évaluant le ton
des messages

(positif, négatif ou neutre)
,
et en extrayant les
informations essentielles.

Dans le cas de la valorisation d’un commentaire
Facebook, l’analyse du ton et du contenu de ce dernier ainsi que des réactions des
autres utilis
ateurs permet non seulement de scorer l’intérêt d
u commentaire mais
également l’influence
de celui qui l’a écrit.



La puissance de ces outils

permet de prendre en charge d’importants

flux de
données non
-
structurées en provenance de médias sociaux pour le
restituer sous la
forme souhaitée par les utilisateurs du système décisionnel.




Quelques indicateu
rs sociaux essentiels

Dans le cadre de l’analyse du réseau social de l’entreprise, voici les 6 indicateurs les plus
utilisés

:



Sens des échanges (unilatéralité ou réciprocité)



Volume des échanges



Fréquence des échanges



Diversité des échanges



Rôle des
acteurs



Niveau de cohésion

L
es données sociales

:

De nouvelles perspectives pour le
s SID

21

L’exploitation des données sociales dans un
système
d’information
décisionnel

A l’origine

:
Valoriser

des

tickets d’appels pour
minimiser l’attrition

dans le secteur des
télécommunications


Un des

premiers domaines dans lequel le m
ariage
B
usiness
I
ntelligence et réseau
social

a été
effectué

est le domaine des
télécoms. En effet, les opérateurs disposent
d’un important volume de données
brutes sur les interactions
téléphoni
ques
ent
re
individus qui leurs permet

de reconstituer le
réseau social de leurs clients.
L
a
valorisation
de ce
s

donnée
s
, stockées sous forme de tickets d’appels, génère de
l’information
sur les clients dont ils ne bénéficiaient pas auparavant.


Par
exemple, l’analyse du réseau

social

de
s

client
s

permet de détecter
des communautés, également
appelées tribus, et de les qualifier par rapport aux

profil
s

des personnes qui les composent
et à leur
s

positions au

sein du réseau.
L’information sociale
qui en
découle donne aux opérateurs la capacité de
discerner
dans la relation client
,
l
es individus ayant
une position centrale s
ur le réseau (taux
d’interaction fort

et prédominance d’appels
entrants),
et les

clients en bout de réseau.

Ces nouvelles dimensions d
’analyse des clients
viennent enrichir les théories du marketing traditionnel qui ne tiennent pas
forcément compte des interactions cl
ient
-
client
.

Ainsi, les équipes marketing
disposent de

nouveaux

éléments
d’analyse
pour affiner grandement la
connaissance

client et
la pertinence du

ciblage marketing.


A
méliorer la performance et la profit
abilité des campagnes marketing
.


Les opérateurs télécoms exploitent
également

ces nouvelles dimensions
sociales
pour
améliorer

la rétention de leurs clients.

L’information sociale
permet d’une part
d’
enrichir
le
s modèles de prédiction de la résiliation (churn)

et

d’autre part
d’identifier les populations les plus intéressantes à retenir

(ciblage marketing)

pour
finalement maximiser la rentabilité des campagnes
de rétention.
Quand on sait

qu’il
est 4 à 7 fois plus cher

d’acquérir un nouveau client que de fidéliser un client
existant,
l’enjeu est de taille et l’exploitation de cette information peut

devenir un
avantage comp
étitif

déterminant.


Des modules d’analys
e de réseau
x sociaux

ont été développés pa
r les éditeurs de
solutions de Business I
ntelligence pour répondre
à cette problématique
. Ces
modules complètent les environnements

décisionnels classiques en ajoutant la
dimension «

interaction client
-
client

» aux

données clients
type

CRM
.
Grâce à la
L
es données sociales

:

De nouvelles perspectives pour le
s SID

22

puissance des outils BI, le croisement et l
a manipulation de ces données via un
Cube OLAP ou directement

sur l
a représentation graphique du réseau social des
clients

facilitent

la
maitrise

de phénomènes complexes comme

le churn
.

Exemple d’environnement décisionnel de minimisation du churn

Le schéma ci
-
dessous montre le processus de création d’un environnement
décisionnel de minimisation du churn à destination des opérateurs télécoms.


Figure
7

: L’exploitation des données sociales dans un système décisionnel
pour
minimiser le churn
.




Détail des étapes du processus de création de l’environnement décisionnel

:

Etape 1

:

Chargement des tickets d’appels.

Etape 2

:
Création du réseau de client à
partir des tickets d’appels.

Etape 3 :
Détection des communautés de clients et des trous structuraux du réseau. Calcul
des indicateurs de base tels
que
le diamètre et la densité du réseau, la centralité et le degré
des individus, le poids des liens ou enco
re la longueur des géodésiques. Création
d’indicateurs composés tels que la position d’un individu sur le réseau (central, intermédiaire,
extrémité, …) ou l’indice d’influence sur le réseau. Déclinaison des indicateurs en dimensions
sociales.

Etape 4

:

Agr
égation des informations sociales avec des données clients type CRM telles que
le sexe, l’âge, le forfait souscrit, la référence du téléphone, l’indice de fidélité, l’indice de
satisfaction, l’indice de solvabilité client, ...

Etape 5

:

Mise à disposition
de l’information sous différentes formes de restitution.

Etape 6

:
Réalisation d’analyses croisées dynamiques poussées.

Optimisation du modèle
de prédiction du churn
en y intégrant les interdépendances entre le profil d’un churner, sa
dimension sociale, l’
évolution de ses usages, sa fidélité, sa satisfaction, sa solvabilité, sa
localisation géographique.
Affinage du ciblage marketing

en intégrant la dimension
sociale dans l’analyse des clients.


Objectif

:

Anticiper sur les phénomènes de churn et proposer des campagnes de rétention
très ciblées.

Finalité

:

Améliorer l’efficacité des campagnes de rétention.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

23




De la même manière, les entreprises des secteurs financiers et de la distribution
utilisent ces solutions d’analyse de réseaux sociaux pour exploiter les données do
nt
elle
s disposent
.

En effet, l
es entreprises du secteur financier
détiennent
énormément d’informations
sociales sur leurs clients mais également
des données
sur les transactions
financières qui lient
les clients entre eux.

Du côté de la distribution,

les

outils d’analyse de réseaux sociaux leurs servent
,

d
ans un premier temps, à valoriser les tickets de caisse pour
analyser les
associations de produits
. Ces données peuvent ensuite être enrichies par les
informations sur les clients possédant une carte de
fidélité mais également par
les
données d

u
n

système de
parrainage qui permettent de lier des clients entre eux.




Un des éditeurs

de
solutions de B
usiness
I
ntelligence et de data mining propose
depuis peu
un modu
le d’analyse de réseaux sociaux ayant pour
vocation d’analyser les relations entre
les clients des secteurs des télécommunications, des services financiers et de la distribution,
à travers
une meilleure connaissance du comportement des clients et de leurs interactions.

Les différentes fonctionnalités de
l’outil
permettent d’extraire les données sociales à partir de
sources transactionnelles ou relationnelles, de créer de nombreuses variables

qualifiant par
exemple le rôle ou l’influence de chaque client, et d’exploiter ces variables pour définir des
modèles prédictifs de manière simple et rapide. Tout cela sur des volumétries pouvant aller
jusqu’à 20 millions de nœuds et 130 millions de liens


Retour d’expérience sur
la mise en place de la solution chez un opérateur télécom
pour l’amélioration de sa stratégie de rétention client.

L’objectif du projet était de définir des manières efficaces de prédire le churn à partir des
données des tickets d
’ap
pels (CDR). Le modèle de prédic
t
i
on du churn de
l’opérateur
téléphonique

est basé sur l’analyse psychographique (analyse du comportement client),
l’analyse géographique du churn et l’analyse des réseaux sociaux. La mise en place d

u
n

module d’analyse de

réseaux sociaux a permis de renforcer ce dernier type d’analyse grâce
notamment aux fonctions de détection de communautés clients et d’identification des
structures de communauté.

L’opérateur téléphonique

a ainsi augmenté la performance de son modèle de p
rédiction du
churn de 47%.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

24

Quickwin

: Exploiter les données
sociales
issues du
réseau social d’entreprise

Comme le montre l’exemple de
la valorisation

des tickets d’ap
pels, les données
sociales ne sont pas toutes issues de réseaux sociaux

explicites
. Cependant, pour
dépasser la simple transformation de données classiques en données sociales, nous
nous placerons maintenant dans le cas d’une entreprise ayant
mis en place
un
réseau social d’entreprise et souhaitant valoriser les données générées par ce
dernier.

Grâce au système d’information décisionnel, il est d’abord possible d’industrialiser
l’analyse et la va
lorisation des données issues de ce

réseau social d’entreprise

(RSE)
et ensuite de croiser dynamiquement cette nouvelle information à forte
valeur
-
ajoutée avec d’autres flux de données.



Dépasser le simple organigramme

:
Créer

de nouvelles dimensions
sociales d’analyse de l’organisation

L
’existence d’un réseau socia
l dans l’entreprise permet de visualiser la structure de
l’organisation
sous l’angle social d
es interactions entre les collaborateurs
et ainsi de

dépasser le simple organigramme

représentant uniquement les relations
hiérarchiques
.


Le premier niveau d’enrichissement des données sociales
dans le système décisionnel consiste à générer des
indicateurs et des d
imensions d’analyse à partir des
données brutes. L’industrialisation des techniques
d’analyse de réseau sociaux ou d’analyse de c
ontenu
permettent
de calculer des indicateurs tels que la

densité du réseau,
la

centralité des collaborateurs
,
la

pertinence des échanges
, la pertinence des publications
ou encore le poids des
interactions

entre
les
individus
. A
part
ir de ces indicateurs d
e base, il est possible de
scorer le
rôle

et la position
des collaborateurs sur le réseau pour alimenter
des

dimension
s

sociale
s

d’analyse de
l’organisation.


Selon les critères les plus pertinents pour l’entreprise,

ce scoring permet de
détecter d
es
perso
nnes clés
qui peuvent être les personnes les plus connectées, les
personnes par qui passe le plus d’information,
les personnes à l’intersection de
sous
-
réseaux,
les personnes créant le plus de contenu

pertinent
, les personnes
collaborant le plus, les perso
nnes reconnues comme expertes par le réseau, …
mais
aussi de détecter les personnes
aux extrémités du réseau
.


Les données de profils des utilisateurs telles que leur âge,
leur localisation
géographique,
les projets auxquels ils ont participé, les
formations auxquelles ils
ont assisté, leurs domaines de compétences ou leurs centre
s

d’intérêt
s
,
complètent
également
l’analyse de l’organisation de nouvelles dimensions.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

25

Dans un premier temps, ces dimensions sociales sont un moyen d’analyser le
réseau so
cial d’entr
eprise pour comprendre,
piloter
et optimiser la

collaboration.
Pour cela, l
a Business I
ntelligence apporte d
es outils de restitution et d’analyse
puissants
à partir desquels
les utilisateurs peuvent croiser
dynamiquement
l’information sociale av
ec toutes les dimensions. On peut imaginer quelques
premiers cas d’utilisation à valeur
-
ajoutée pour l’entreprise

:

-

La d
étection de communauté

:
l’analyse multidimensionnelle du réseau
social d’entreprise

permet de détecter
, selon les dimensions d’analyse
sélectionnées,

des communautés explicites (sous
-
structure
s

du réseau à
forte densité de liens) mais égale
ment des communautés implicites
telles
que des co
mmunautés d’experts

sur un sujet
, des communautés par centre
d’intérêt ou par expérience, ...

L’intérê
t
premier
est de découpe
r
l’organisation en communautés pour
mieux
comprendre la structure du
réseau.

-

La mise en relation automatique

:
l
e requêtage du réseau social d’entreprise
selon toutes les dimensions sociales
permet de suggérer
aux
collaborateur
s
,
c
lient
s
, partenaire
s

ou fournisseur
s
,
une
liste d
e personnes du réseau qui
pourraient les intéresser.

L’
objectif

est de faciliter la collaboration entre
personnes pour améliorer la performance globale des collaborateurs.
On
peut par exemple automatiquement mettre en relation des personnes
travaillant sur le même sujet
sans le savoir
. On peut également m
ettre en
relation un client avec le

collaborateur ou le partenaire
qui répondra le
mieux à ses besoins
.

-

La recherche de pr
ofil

:
l
’exploration de données

selon
toutes les dimensions
sociales
,

permet d’effectuer des recherches de profils
sur le réseau social
d’entreprise
très
ciblées
.
Par exemple
,
lors de la constitution d’une équipe
projet,
on peut imaginer
aller chercher les

«

personnes clés de succès

»
directement sur le réseau social d’entreprise et non uniquement dans une
équip
e locale. Grâce aux fonctions d’analyse multidimensionnelle
, il est facile
de trouver des

experts s
ur le sujet

du projet ayant au moins 5 ans
d’expé
rience, des personnes centrales sur le réseau qui seront
coordinatrices

du projet ou encore
des
leaders de changement.

-

L’exploration des échanges par mot
s

clé
s

:
l
’analyse multidimensionnelle

des
échanges, grâce notamment à la sémantisation

du contenu
, permet
d’exploiter
les commentaires, les feedbacks et toutes les expressions
spontanées
qu
e l’on retrouve sur les réseaux
. L’objectif est d
e faciliter
l’exploration de ces importants volumes de données non
-
structurées pour
extraire les informations essen
tielles sur un sujet (mots clés). Par exemple,
lors du choix d’un fournisseur, on peut
imaginer
analyser les différents
échanges concernant les fournisseurs potentiels pour
extraire l’avis des
collaborateurs sur chacun d’entre eux
.

Les dimensions sociales
permettent
même de pondérer les avis par rapport à la position ou à la pertinence de
leurs auteurs.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

26

L’analyse sociale de son organisation constitue un premier niveau d’exploitation des
données sociales.
Même si c
ette analyse est aujourd’hui
en partie
réa
lisée par des
consultants en organisatio
n, son industrialisation dans un système décisionnel

donne une vision beaucoup plus
dynamique

de la collaboration dans l’entreprise.
Maintenant,
l’objectif est d’augmenter la valeur
-
ajoutée de ces nouvelles
dimension
s en les croisant avec d’autres données de l’entreprise.



Mettre
les nou
velles dimensions
sociales

en résonance avec les
données de l’entreprise

Le rapprochement des données sociales et des données d’entreprise
dans un
environnement décisionnel
se fait à
travers les personnes.

Q
ue ce soi
en
t des
collaborateurs, des clients, des partenaires ou des fournisseurs, il est possible
d’agréger les données qui les concernent quel
le

qu

e
n

soit la source
.

Ainsi, c
ompte tenu de la diversité croissante des sources dans
l’entreprise, les
agrégations possibles sont nombreuses
. V
oici un exemple de croisement de
données qui semble particulièrement intéressant.


Améliorer

la performance de

se
s équipes en
s’appuyant sur l
es

dimension
s

sociale
s


Dans le but d’améliorer la
performance globale de ses
équipes, l’apport de l’information sociale dans l’analyse de
la performance peut être très intéressant. En prenant
l’exemple des équipes commerciales, l’analyse de leur
s

performance
s

commen
ce par
l’
agrégation
,

dans un même
enviro
nnement

décisionnel
,

des
données de vente,
de
relation client

et des dimensions sociales
.



P
our pousser l’exemple à l’extrême,
on se place
même
dans le cas
d’une
entreprise qui
a intégré ses
interlocuteurs clients
(vraisemblablement B2B)
dans le
réseau so
cial d’entreprise.



Dans un premier temps
, l’intérêt est de confronter ces données pour comprendre
les corrélations entre les résultats des commerciaux (données de vente), l’intensité
des interactions avec le client (données CRM) et les dimensions
sociales dont on a
parlé précédemment.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

27

L’environnement décisionnel d’analyse de la performance des équipes commerciales
offre la possibilité de mesurer l
e degré d’interdépendance
d
e ces donné
es
pour
ensuite

définir les

profils de
s

commerciaux
performants

en allant même jusqu’au
niveau de
détail des profils

de commerciaux
par
type de
client.

L
es dimensions
sociales apportent de nouvelles réponses à des questions comme q
uel est le profil
idéal pour mes commerciaux grands comptes

? Et pour mes commerciaux

dentaires

?

Quel est l’âge de mes meilleurs commerciaux, leurs expériences,
leurs passions ou leurs formations

?


En allant plus loin dans l’analyse multidimensionnelle, il est également possible
d’identifier des best
-
practices
«

sociales

»
,

à destination
des commerciaux
,

en
matière de collaboration interne
et de relation client.
L’explor
ation des données
dans l’environnement BI apporte des réponses à des questions comme q
uelle est

la
meilleure
position
à avoir
sur le réseau
au sein des équipes commerciales

mais
également
par rapport aux équipes marketi
ng ou aux équipes de production

?
Quelle est l’intensité
idéale
des échanges à adopter avec les équipes internes
et
avec

le client

?



L
es données sociales

:

De nouvelles perspectives pour le
s SID

28

Exemple d’environnement décisionnel d’analyse de la performance
des équipe
s commerciales

Le schéma ci
-
dessous montre le processus de création d’un environnement
décisionnel d’analyse de la performance des équipes commerciales sous un angle
social.


Figure
8

: Exploitation des données sociales dans un
système décisionnel pour
améliorer la performance de ses équipes commerciales


Voici l’
exemple

d
’un
t
ableau

de bord
qui rassemble d
es indicateurs de suivi de la
perfo
rmance d’une équipe commerciale avec un angle social.


Figure
9

: Tableau de bord de suivi de la performance d’une équipe commerciale

L
a dimension sociale apporte une nouvelle vision dans l’analyse de la performance
de ses équipes qui permet de mieux maitriser
leurs

constitution
s

et leurs méthodes
de travail, en allant

jusqu’à optimiser le recrutement de ses collaborateurs.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

29

Aller plus loin

: Exploit
er d
es données
sociales
externes à l’entreprise

Les exemples précédents montrent que les données
sociales issues du réseau social d’entreprise ont une
forte valeur ajoutée dans
l’analyse

stratégique d’une
organisation. Cependant, le développement fulgurant
des réseaux sociaux publics et
l’explosion de la
quantité de données sociales externes disponibles
incite
nt

à
aller plus loin dans la réflexion sur
l’exploitation des données sociales

dans un
environnemen
t

décisionnel
.


Pour tirer de la valeur de l’exploitation des données
sociales issue
s des réseaux sociaux publics,
l’entreprise doit pouvoir se limiter aux
données
sociales concernant les
individus
avec qui elle
entretient un lien plus ou moins direct
.
Pou
r cela, la
première possibilité est de cibler les personnes en lien
avec l’entreprise par l’intermédiaire de l’image de
cette dernière sur les réseaux sociaux publics. La
seconde possibilité, et certainement la plus aboutie,
est d’utiliser les données de l
’entreprise pour
reconstituer le réseau des col
laborateurs,

des clients,
des prospects,
des partenaires ou des fournisseurs
sur les réseaux sociaux publics.

V
aloriser la présence de l’entreprise sur les réseaux sociaux publics

Les entreprises qui utilisent

les réseaux sociaux tels que Facebook, Twitter et bien
d’autres, ont encore peu de moyens de valoriser leur p
résence sur ces derniers et
d’
exploiter de manière stratégique
ce nouveau canal marketing.

La création d’un compte Twitter, d’une page Facebook
, d
’une application Facebook,

ou d’une campagne marketing sur les réseaux sociaux, génère des données
sociales concernant les followers (Twitter), les amis ou les fans de l’entreprise
(Facebook) qu’il faut apprendre à exploiter.



Les entreprises
s’intéressent de plus en
plus aux réseaux sociaux
et cherchent des moyens
de les exploiter. Selon une
enquête Forrester (avril
2010), réalisée auprès de
900 DSI d’Amérique du
Nord et d’Europe, 26% des
entreprises utilisent déjà
les réseaux sociaux à des
fins internes ou externes et
la moitié d’entre elles
comptent étendre leur
utilisation. 6% des
entrepris
es non
-
encore
converties ont l’intention
de le faire rapidement.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

30

Dans un premier temps
, l’an
alyse
du

réseau
social des f
ollowers (Twitter)
ou de
s

fans (Facebook)
de
l’entreprise
,

étendu à leurs amis

et
aux amis de leurs amis, apporte de
nombreuses informations sur cette
population
«

sensible

»

à l’entreprise
.
L’
analyse multidimensionnelle de ce

réseau

selon les
dimensions sociales
qui ont été décrit
e
s
précédemment
permet de
qualifier précisément

les
profils de ces

p
ersonnes
(âge, sexe,
localisation géographique, centre d’intérêt
, …
)
,
leur
rôle

et

leur position sur le
réseau

pour finalement comp
rendre les raisons pour lesquelles ils s’intéressent à
l’entreprise
.


Dans la continuité
,
on peut également
exploiter le

contenu de
s
échanges

qui
concernent

l’
entreprise. D’une part
,

les
échanges structuré
s tel
s que la fonction
«

like

» de Facebook permett
ant de signifier un se
ntiment positif sur un contenu
,

mais surtout les interactions non
-
structurées

telles que les articles, les tweets, les
commentaires, et

autres expressions spontanées.
Les

outils d’analyse sémantique
(text mining)
utilisés dans le
domaine de la Business I
ntelligence,
rendent ce
contenu intelligible par le système d’information décisionnel
.
Celui
-
ci est ensuite
capable d’extraire le t
on (
positif,

négatif ou neutre) et l
es informations
importantes

d’un commentaire
puis
d
’analyse
r l
es
feedbacks utilisateurs sur
ce dernier
pour
finalement
scorer la pertinence des
contenus échangés
.

Ces scores,
s
ur une échelle
de 1 à 5

par exemple
, sont ensuite déclinés en dimensions d’analyse pour faciliter
la recherche et la restitution de l’information

circulant sur le réseau

concernant
l’entreprise
.


De la même manière mais avec un niveau de granularité encore plus fin,
l’évaluation du contenu échangé apporte l’information nécessaire au scoring de la
pertinence des acteurs du réseau. Grâce à cela, il e
st possible d’identifier
,

de
manière très précise, les individus «

influents

» dont les avis peuvent avoir une
aura importante. Mais aussi de détecter
des «

stimulateurs d’innovation

» dont les
échanges peuvent contenir des idées innovantes ou des besoins
nouveaux pour les

clients.


L’environnement
BI

offre la possibilité de croiser
toutes les
données cité
e
s ci
-
dessus
et d’industrialiser la valorisation

de ce
s

nouveau
x

flux. Ensuite, la mise à disposition
de l’information sociale générée
,

sous différentes f
ormes de restitution, donne
,

aux
utilisateurs d
u système
BI
,

tous les éléments pour mesurer la pré
sence de
l’entreprise sur les réseaux sociaux,
évaluer
l’impact d’une campagne marketing
,

maitriser
la propagation d’un buzz

mai
s également
réaliser de la vei
lle sur les
réseaux sociaux.


L
es données sociales

:

De nouvelles perspectives pour le
s SID

31



Cette première étape dans l’exploitation des
flux de données sociales externes
permet de fo
rtement maitriser
le

réseau de
s

personnes sensibles à l’entreprise mais
sans connaitre leurs liens avec cette dernière
. Aller plus loin, consiste à
reconstituer
un réseau de personnes dont la relation avec l’entreprise est connue.


Met
tre en résonnance les

données de l’
entreprise avec les données
sociales externes


I
l est fort probable que les collaborateurs ayant un profil sur le réseau social
d’entreprise aient également un profi
l sur un réseau social externe.

De la même manière, les clients,
les prospect
s,
les partenaires ou les fournisseurs
ont certainement une visibilité quelconque sur un des réseaux publics.


Ainsi,
on
peut imaginer reconstituer
, à partir
d’une base client type CRM,

son réseau de
client
s

et de prospects
sur les

réseaux
sociaux
publics
. L’analyse de ce nouveau
réseau
,

étendu aux amis, ou aux followers
des clients

et des prospects
,

fourni des
informations
complètement nouvelles sur
ces derniers
.
Le croisement, dans un
environnement

décisionnel,

de ces données
avec l
es données CRM classiq
ues
permet
d’enrichir l’analyse de la segmentation client

d’un certain nombre
de dimensions sociales
et
ainsi d’affiner le ciblage marketing.



Voici quelques exemples d’indicateurs pouvant être mesurés à partir de flux de données en
provenance de réseaux sociaux publics

:

-

Indicateurs de croissance

:
nombre de followers sur Twitter, nombre d’amis ou de
fans sur
Facebook, nombre d’installation
s

quotidienne
s

d’une application Facebook,
nombre de visiteurs uniques par jour, nombre de nouveaux membres, temps de
connexion, nombre de commentateurs actifs, ratio de commentaires par article

-

Indicateurs de présence

:

taux

d’interaction sur la marque (nombre de citations,
share, bookmark, commentaires, articles) par rapport aux concurrents, mesure d’un
buzz sur 30 jours

-

Indicateur
s

de sentiment

:
ton des commentaires et/ou articles écrits au sujet de
l’entreprise, pertinenc
e des auteurs, ratio entre les mentions positives, neutres et
négatives par rapport aux concurrents

L
es données sociales

:

De nouvelles perspectives pour le
s SID

32

De la même manière, on peut imaginer
reconstituer son réseau de collaborateurs
sur la toile pour obtenir des do
nnées
sociales
complémentaires à l’analyse de
ses ressources. Dans l’exemple de
l’analyse de
la performance de

se
s équipes

évoqué

précédemment
, l
e recours à un
système BI pour agréger

ces nouvelles
données avec les informations sociales
du

réseau social d’
entreprise mais également

avec l
es données
d’entreprise
concernant la
performance de

se
s collaborateurs
,

donne naissance à des possibilités de croisement infinies.

L’intégration du flux de
données sociales externe
s

permet de
connaitre

le

positionnement de ses
collaborateurs
performants
sur les réseaux sociaux publics
et ainsi d’aller
, par
exemple,

jusqu’à recruter
,

de manière éclairée
,

sur les réseaux sociaux.





Dans la continuité, et si on reprend l’exemple de l’analyse de la
performa
nce des équipes commerciales, on peut aller jusqu’à
croiser toutes les données clients, prospects et commerciaux
évoquées dans le livre blanc pour comprendre les interactions
entre ces sous
-
réseaux avec l’objectif final d’optimiser la
di
stribution de sa fo
rce de vente dans son réseau de clients.



L
es données sociales

:

De nouvelles perspectives pour le
s SID

33

P
oints d
’attention

et préconisations

Le sourcing

Les informations sociales dont nous avons parlé dans ce livre blanc ont des formats
très hétérogènes et proviennent de sources diverses parfois externes à l’entreprise.
Ainsi, contrairement aux
données essentiellement internes et structurées qui
alimentent

les systèmes BI actuels,

les informations sociales sont plus difficiles à
collecter et à intégrer au système décisionnel.

Analyse sémantique

L’analyse sémantique des interactions
non
-
structurées
entre les personnes à
travers les réseaux sociaux semble ess
entielle pour affiner l’analyse de ces
derniers. Même si
les systèmes BI ne sont pas aussi mûrs dans la valorisation des
données non
-
structurées que
dans la valorisation des données
structurées, il est
déterminant

de
mettre en place des solutions puissantes de
prise en charge
de
contenu
.

La confidentialité

Aujourd’hui, même si la tendance des utilisateurs
est à publier facilement un pro
fil, des documents et
même des sentiments, paradoxalement l
es
utilisateurs ne sont pas prêts

à accepter l’ouverture
complète des informations sociales les concernant.
C’est la raison pour laquelle les données des
réseaux sociaux publics ne sont pas toujour
s
ouvertes et directement exploitables.

Le dévoilement d’Open Graph par Facebook en
avril dernier montre bien la tendance à l’ouverture
des réseaux sociaux. Cependant, il faudra être
vigilant à respecter les limites de confidentialité
imposées notamment en

France par la CNIL
(Commission Nationale de l’Information et des
Libertés).

La pertinence et la représentativité des données

L’échantillon de la population mondiale inscrite sur les réseaux sociaux n’est pas
encore parfaitement complet. Cependant,
alors q
ue les réseaux enregistraient
récemment de très fortes croissances grâce à une population plutôt jeune,
Facebook enregistre aujourd’hui sa plus forte croissance aux Etats
-
Unis chez les
femmes de plus de 55 ans (+175% sur les 4 derniers mois).

La démocratis
ation des outils de réseaux sociaux comme outil
s

d’échange
d’information et l’homogénéisation de la population des utilisateurs vont
transformer l’engouement pour les réseaux sociaux en une véritable révolution des
usages en matière de communication. La pe
rtinence et la représentativité des
données deviendront alors indiscutables.


Suite au mécontentement
général des utilisateurs
Facebook, la fonction Beacon
qui informait les amis d’un
utilisateur quand celui
-
ci
visitait un site affilié a été
modifiée.

Dans le

même esprit,
certains
utilisateurs préfèrent utiliser
des pseudonymes plutôt que
leurs réelles identités et
deviennent ainsi plus difficiles
à identifier.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

34

L’approche Logica Business Consulting


Ce premier livre blanc pose les bases de la réflexion de Logica Business Consulting
sur l’exploitabilité des données sociales dans le
système d’information décisionnel.



Convaincues de
la valeur ajoutée de l’information sociale dans les environnements
décisionnels
, les équipes Logica Business Consulting sont

aujourd’hui

prêtes à
accompagner
l
es entreprises dans la réflexion autour des n
ouvelles perspectives
que nous offrent les technologies du web 2.0
telles que

les réseaux sociaux.



Fort de son expérience dans la mise œuvre de solutions décisionnelles innovantes,
Logica
Business

Consulting
adopte une démarche qui se résume

en trois

grandes
étapes

:

-

En amont, la première
étape est une phase de
réflexion et de
cadrage

:

prise

de connaissance de l'environnement, des contraintes, de

l'existant de
l'entreprise, et des attentes
du client
. A

partir de cet environnement, Logica
Business

Con
sulting

fixe avec l'entreprise les objectifs ainsi que les gains

financiers et concurrentiels attendus par la mise en
œuvre
d'une solution
BI
orientée sociale.

-

La seconde étape consiste à
définir

un cas concret

pour créer
un prototype
permettant de maquett
er la mise en
œuvre

de la

solution
.

-

A l’issue de cette seconde étape, on entre dans une phase

d'intégration, de
généralisation de la solution au sein de

l'entreprise dans des domaines
variés, impliquant un

enrichissement idoine des processus BI traditionne
ls
.




L
es données sociales

:

De nouvelles perspectives pour le
s SID

35

Glossaire

API

: Application Programming Interface

Interface programmatique de niveau « code source » permettant à deux
applications informatiques de communiquer.
Exemples

d’API

: SAX (Simple API for
XML), DOM (Document Object Model), Java RMI (Remote Method Invocation), EASA
(Exalead Advanced Search API)…

ARS: Analyse des Réseaux Sociaux

CRM

:
Customer Relationship Management

Ensemble de processus, de méthodes et de logiciels pe
rmettant à l’entreprise de

gérer efficacement sa relation avec ses clients, sous tous ses aspects (relation

commerciale, approche marketing, service clients, service après
-
vente…). Le

CRM
vise ainsi à créer une vue logique consolidée et homogène des échang
es

entre
l’entreprise et ses clients dans le but d’accroître la satisfaction et donc la

fidélité de
ceux
-
ci
.

Datamart

: Magasin de données

Dispositif de stockage dédié à un univers métier déterminé. Les data marts sont
alimentés à partir du data warehouse
central (filtrage, consolidation et agrégation
de données). La taille réduite d’un data mart accroît sensiblement la pertinence et
la performance des applications décisionnelles qui exploitent ses données.

Datawarehouse

: Entrepôt de données

Dispositif de
stockage central (SGBDR en général) utilisé dans les architectures
décisionnelles et alimenté à partir de plusieurs sources de données grâce à un outil
de type ETL.

ERP

: Enterprise Ressource Planning

Progiciels ou chaînes de composants applicatifs destiné
s à automatiser les

traitements métier d’entreprises de taille moyenne ou grande : fabrication,

distribution, gestion de la relation client, comptabilité, ressources humaines…

La
mise en oeuvre d’un ERP constitue un projet à part entière et monopolise

d’im
portantes ressources (humaines et financières).

ETL

: Extract, Transform, Load

Outil d’extraction, de transformation et de chargement de données en provenance
de sources structurées vers un entrepôt (Data warehouse).

Facebook

«

Facebook

est un
réseau social

créé par
Mark Zuckerberg

et destiné à rassembler
des personnes proches ou inconnues
.

» [
http://fr.wikipedia.org/wiki/Facebook
]

L
es données sociales

:

De nouvelles perspectives pour le
s SID

36

Friendster

«

Friendster est un site Web de réseau social

basé sur les techniques de cercles et
de réseaux d'amis pour mettre en contact des personnes dans des communautés
virtuelles et faire la démonstration du
phénomène du petit monde. Il compte
actuellement plus de 50 millions d'utilisateurs et est surtout utilisé en Asie.

»
[
http://fr.wikipedia.org/wiki/Friendster
]

LinkedIn

«

LinkedIn est un service en ligne qui permet de construire et d’agréger son réseau
pro
fessionnel. Il se définit comme un réseau de connaissances qui facilite le
dialogue entre professionnels. Pour ses membres, c'est aussi un outil de gestion de
réputation en ligne et de personal branding.

»
[
http://fr.wikipedia.org/wiki/LinkedIn
]

Mashup

Com
binaison de contenu provenant d
e plusieurs applications plus ou moins
hétérogènes.

MSE

: Média Social

d’Entreprise

(cf. RSE)

MySpace

«

MySpace est un site Web de réseautage social fondé aux États
-
Unis, qui met
gratuitement à disposition de ses membres enre
gistrés un espace web
personnalisé, permettant de présenter diverses informations personnelles et d'y
faire un blog. Il est connu pour héberger de nombreuses pages internet de groupes
de musique et de DJs qui y entreposent et présentent leurs compositions
musicales.

» [
http://fr.wikipedia.org/wiki/MySpace
]

OLAP

: On Line Analytical Processing

Sous
-
ensemble de la BI regroupant les techniques et méthodes visant à fournir des
réponses rapides aux requêtes analytiques portant sur des informations par nature
com
plexes et multidimensionnelles.

Ontologie

«

ensemble structuré des termes et concepts fondant le sens d'un champ

d'informations

»

[
http://fr.wikipedia.org/wiki/Ontologie_(informatique)
]

Orkut

«

Orkut est un site de réseautage social qui permet de mettre en

relation les amis
de ses amis (créer/gérer son réseau social).

» [
http://fr.wikipedia.org/wiki/Orkut
]

C’est un concurrent direct de Facebook et Twitter, surtout utilisé au Brésil.

PLM

: Product Lifecycle Management

Outil de gestion du cycle de vie d’un pr
oduit.

L
es données sociales

:

De nouvelles perspectives pour le
s SID

37

RSE

: Réseau Social

d’Entreprise

(Cf. MSE)

SCM

: Supply Chain Management

Outil
de gestion de la chaine logistique.

SID

: Système d’Information Décisionnel

Désigne l’ensemble des données et programmes d’applications visant à assister les
utilisateurs

dans leurs processus de prise de décision, de contrôle et d’analyse
concurrentielle.

SIRH

: Système d’Information de Gestion des Ressources Humaines

Twitter

«

Twitter est un service de microblogage, permettant aux utilisateurs de bloguer
grâce à des tweet
s (messages courts de 140 caractères maximum, soit une ou
deux phrases).

» [
http://fr.wikipedia.org/wiki/Twitter
]

Les fonctions de Twitter permettent notamment de suivre les tweets des personnes
auxquelles l’utilisateur s’est abonné.

Viadeo

Viadeo

est un r
éseau social professionnel

qui s'adresse aux professionnels
souhaitant augmenter leurs opportunités de business (recherche de nouveaux
clients, partenaires ou fournisseurs…), gérer et développer leur réseau de contacts
professionnels et accroitre leurs opp
ortunités de carrière (être chassé, accroître leur
visibilité). [
http://fr.wikipedia.org/wiki/Viadeo
]

Web sémantique

«

ensemble de technologies visant à rendre le contenu des
ressources

du
World
Wide Web

accessible et utilisable par les programmes et agent
s logiciels, grâce à un
système de
métadonnées

formelles, utilisant notamment la famille de langages
développés par le
W3
C

»
[
http:/
/
fr.wikipedia.org/wiki/Web_sémantique
]