Les outils d'analyse et de mesure d'audience Web

mustardunfInternet και Εφαρμογές Web

21 Οκτ 2013 (πριν από 3 χρόνια και 8 μήνες)

108 εμφανίσεις


1

Nicolas Blancpain

A3 Réseau






Sujet n°24

: Les différentes façon

de mesurer l’audience d’un site web











PLAN

:


I. Les outils d'analyse et de mesure d'audience Web


II. Mesure des connexions log : Web
T
rends

III. Marquage des pages : Weboscope

IV. Au
dientia : la mesure par les tags Javascript


V. Les outils de mesure des éditeurs décisionnels


VI. Macromedia investit la mesure d'audience avec Aria

VII. Profile For You évalue gratuitement le profil de vos visiteurs

VIII. Compaq combine WebTrends et We
borama

IX. Cetelem : WebTrends pour la navigation mais pas pour le transactionnel

X. Après Hit
-
parade, @t Internet lance sa solution de mesure d'audience gratuite

XI. Principaux outils de mesure d'audience Web


ANNEXES

:




Lexique d
u CESP (Centre d

E
tude des
S
upports de
P
ublicité)



Les offres
W
eb
T
rends



D
émonstation Weband
S
tats



L

offre Weboscope



Macrom
e
dia

Aria



L
'
offre
Hyperion




SAS Institute et son offre e
-
intelligence



2

I. L
es outils d'analyse et de me
sure d'audience Web



Optimiser les contenus rédactionnels de son site, faciliter et pérenniser la vente de son
espace publicitaire ou encore définir des partenariats d'affiliation performants : autant
d'objectifs qui peuvent être atteints grâce à la mesur
e et à l'analyse de l'audience des
sites Web.

Une palette d'outils existe aujourd'hui afin de répondre à ces diverses problématiques
de dénombrement et de qualification de l'audience. Selon la terminologie du
CESP

(
Centre d'étude des supports de Publicité), on distingue les mesures "site centric" des
mesures "user centric". Les premières comptabilisent le trafic depuis les sites en terme
de volumes échangés (demandes qui arrivent au site et les pages qui en partent).

Soit
un rôle essentiellement porté sur la fréquentation du site. Tandis que la seconde
catégorie porte sur l'identification des comportements des internautes ; elle se fonde
principalement sur les enquêtes qualitatives et les panels (Net Value, MMXI…). Ce

dossier ne prendra pas en compte ces serveurs de publicité (ad servers) qui gèrent plus
particulièrement l'audience publicitaire (gestion des campagnes publicitaires, des
expositions publicitaires…) du type DART du prestataire
Double Click
.


Nous ne présenterons ici que les outils de mesure de trafic. Ceux
-
ci évoluent vers des
fonctionnalités plus étendues, en particulier vers la qualification de l'audience grâce à
des méthodes analogues à celle des serveurs
de publicité (conservation de
l'information qualifiante sur des populations ayant accepté de se faire connaître).

Sur un marché hétérogène, on distingue des éditeurs venus d'horizons divers aux
techniques différenciées. Parmi les ténors de l'industrie, on
trouve ERS (Enterprise
Reporting Server) de l'éditeur
WebTrends

qui travaille à partir des fichiers de
connexion Log. Une technique éprouvée qui permet un comptage relativement fiable.

Plus exhaustif
s, les outils de mesure basés sur le marquage des pages tels que
Weborama

ou
Webandstats
. Le webmaster doit positionner une marque (un tag) sur
toutes les
pages dont il veut mesurer l'audience afin de pallier le manque d'exhaustivité
des logs (même si la page provient d'un serveur proxy, le marqueur déclenche une
connexion vers un serveur de comptage).


Plus rares, certaines solutions offrent la possibilité
d'analyser le trafic directement sur le
réseau TCP/IP (
voir Aria de Macromedia
). Avantage : l'analyse en temps réel. A noter
la très récente version Webtrends Live qui comporte dés
ormais une solution temps réel.

Enfin, les outils mis au point par les éditeurs spécialistes du décisionnel tels
qu'
Hyperion

avec Web Analysis Suite (dont le moteur OLAP a récemment été intégré à
Webtr
ends Live) ou encore
SAS Institute

et son offre e
-
intelligence. Ces derniers
offrent des possibilités d'analyse élaborées : du croisement d'information jusqu'à la
prédiction du comport
ement des internautes…


Enfin signalons que les outils "user centric" constituent des outils complémentaires fort
appréciables pour connaître les profils et les comportements de l'audience d'un site.
Les premiers permettent de comptabiliser sans intermédia
ires toutes les provenances
et les lieux de connexion tandis que les seconds affinent la connaissance de la
perception et des attentes des visiteurs. Néanmoins enquêtes et panels restent encore
l'apanage des sites les plus développés…



3


Les crit
ères de choix de son outil



Identifier précisément les indicateurs que l'on souhaite suivre sur son site




Prendre en compte l'architecture de son site (pages dynamiques ou non)




Le volume du trafic (perte des pages proxies significatives ou non)




La consult
ation des données (convivialité des reporting, lisibilité...)




La dimension marketing et CRM (intégration ou non avec le système
d'information pré
-
existant ou non)




La plate
-
forme technique (multi plate
-
forme ou pas)




En cas d'hébergement des données chez
un tiers, vérifier que les données
sont sa propriété.





4


II. Mesure des connexions log : Webtrends


Issu de la famille des logiciels de traitement de fichiers à partir des connexions log,
l'éditeur
WebTrends

détient environ 40% de part de marché du marché mondial
(source IDC). Son offre se décline autour de plusieurs produits dont le produit le plus
complet se nomme ERS (Enterprise Reporting Server). Distribuée en France par le
revendeu
r
Alpha Media
, cette solution couvre un vaste spectre de fonctionnalités
relatives au trafic sur le site et génère des rapports sous forme d'états quotidiens,
hebdomadaires, mensuels, trimestriels, ou
annuels.


Mode de fonctionnement

Les logiciels de la gamme Web Trends vont rechercher dans les journaux de connexion
du serveur (Apache, I
-
planet : Netscape, IIS, etc.), les fichiers log (ou fichier de trace)
qui correspondent à une synthèse des requêtes e
ffectuées auprès du serveur. Ils sont
alors capables de les lire, les analyser et les lister dans des états pré
-
définis par les
utilisateurs. Le volume de données ainsi recueillies s'avère considérable et donc
difficilement exploitable. Il est nécessaire d
e déterminer des filtres qui permettent de
sélectionner les informations pertinentes parmi l'information brute contenues dans les
fichiers log (transfert de fichier, trace de toutes les erreurs survenues, etc.). "Ainsi il
semble utile de retirer du comptag
e les connexions des salariés du site ou extraire les
frames qui faussent les résultats émis ", recommande Jean
-
Philippe Resca, ingénieur
technico
-
commercial chez Alpha Media. "Cette configuration doit être réalisée par un
technicien disposant d'un minimum

de connaissance dans le maniement des fichiers
log", précise
-
t
-
il. Les paramétrages ainsi opérés permettent de connaître avec précision
les statistiques d'un groupe de pages en particulier (en définissant leurs URL) ou de
reconstituer le cheminement d'int
ernautes grâce à un filtrage par adresse IP ou par
cookie. Les données filtrées seront compilées pour pouvoir être mises en forme en
graphique ou en page HTML (suivi de sessions utilisateurs sous forme de tableaux ou
de diagrammes). Les indicateurs pricipa
ux ainsi analysés portent sur le nombre de
pages vues, le nombre de hits, de pages vues, des ressources les plus populaires…


Une percée vers le marketing visiteurs

L'éditeur a récemment complété sa gamme d'un nouvel outil destiné à gérer la relation
avec
le visiteur : Visitor Relationship Management (VRM). Il s'agit d'une plate
-
forme
capable d'analyser les visites grâce à la copie sur les pages web d'un javascript qui
surveille l'audience de pages entières ou d'éléments plus ciblés comme les publicités.
Ou
tre les rapports statistiques générés (nombre total de visiteurs, de pages vues, etc.),
le logiciel offre la possibilité de croiser ces informations avec des informations
commerciales du type fréquence/montant des achats. Ainsi l'éditeur investit désormais

2 nouveaux terrains : les marqueurs et la dimension marketing grâce à l'intégration du
moteur OLAP d'Hyperion. Les tarifs indicatifs de ces solutions sont respectivement :
15.000 francs pour ERS et une commercialisation en mode ASP pour
WebTrend Live

allant de quelques milliers à plus de 35.000 francs par mois. L'entreprise pourra
accéder à plus ou moins de données sur le site Webtrendslive par connexion sécurisée
SSL.


Quelques limites

Ce type d'outil (hor
mis la solution Webtrends Live) présente deux limites principales,
inhérentes à son fonctionnement même. La première porte sur le manque d'exhaustivité
des résultats obtenus car certaines requêtes (en général les plus fréquentes) peuvent

5

être arrêtées en r
oute, soit dans les serveurs proxy des fournisseurs d'accès ou des
entreprises. Ces serveurs relais sont utilisés pour fluidifier les connexions mais peuvent
conduire à des aberrations dans le comptage : ainsi plus une page est demandée, plus
son audience
est sous
-
estimée ! Les mémoires caches des postes clients posent le
même type de problème en ne déclenchant aucune requête au niveau du serveur mais
en récupérant les pages sur le disque dur de l'internaute. Par ailleurs comme le fait
remarquer Françoise R
enaud, directeur des études pour l'
UDA

(Union des
Annonceurs), "la difficulté principale réside dans l'estimation du nombre de visiteurs
uniques." Le critère de distinction entre visiteurs se fonde principalement sur
l'adresse
IP émise au serveur lors de la requête censée correspondre à un utilisateur précis.
Néanmoins un même poste peut être utilisé par plusieurs utilisateurs. A l'inverse un
même utilisateur peut diposer de deux adresses IP différentes (bureau, maison
). Enfin,
la configuration des systèmes de protection (les firewalls) des entreprises peut fausser
les mesures en ne communiquant qu'une seule et unique adresse IP pour l'ensemble
des connexions issues de la société. Dans cette approche, c'est seulement la

machine
connectée qui est reconnue et on a jamais l'assurance qu'il y a bien un utilisateur
derrière la machine, ni qu'il
est bien celui que l'on croit…


Autres outils de cette catégorie

Net Audience

de Cartel
Informatique


Site Server

de Microsoft





6

III. Marquage des pages : Webos
cope


La deuxième génération d'outils de mesure des performances d'un site Web repose sur
des fichiers log "améliorés". Ceux
-
ci prennent en compte l'intégralité des pages vues y
compris celles interceptées par les proxies ou les caches. Un des outils repré
sentatif de
cette catégorie est le
Weboscope

de Weborama.


Mode de fonctionnement

L'astuce réside dans le positionnement sur les pages de marqueurs encore nommés
tag. Il s'agit de javascript ou de marqueur image évidemment
invisibles pour
l'internaute. Lorsque la page est chargée sur l'ordinateur de l'utilisateur, le marqueur
déclenche une connexion vers un serveur de comptage indépendant interne ou déporté
chez un spécialiste. Pour que la page soit entièrement téléchargée,
elle doit appeler le
serveur pour exécuter le tag. Ce type d'outil peut être utile sur des sites très spécialisés
et pointus qui génèrent un trafic moyen et où la perte de pages peut se révéler
significative au regard du volume de pages totales. De même l'
architecture du site est
également à prendre en compte dans le choix de ce type d'outils. En effet les pages
dynamiques d'un site ne sont pas interceptées par les serveurs proxies donc dans ce
cas l'étude des fichiers log peut suffire.


Variations selon l
'environnement d'utilisation

Le
CESP

(Centre d'étude des Supports de Publicité) qui a mené des tests en
laboratoire sur cette catégorie de logiciels, a identifié un certain nombre de différences
dans les résultats f
ournis.

"Ces divergences portent en particulier sur la nature du navigateur (Netscape ou
Internet Explorer). Selon le type de navigateur utilisé, la façon d'appeler la page et
d'afficher les différents éléments (images, textes, etc.), la faculté de reconna
ître java ou
non différent et occasionnent des variations significatives dans les statistiques", note
Hélène Haering, directeur d'études Internet pour le CESP.

A noter également que ce type d'outil requiert un marquage préalable de l'ensemble
des pages que

l'on souhaite suivre, ce qui peut se révéler très contraignant. "L'objectif
est de limiter le nombre de tag à poser", précise Olivier Rossinelli, ingénieur d'affaires
chez
Webandstats.
"Un seul type

de tag sur les pages statiques qu'il suffit de dupliquer
et un tag pour les pages dynamiques qui sera exécuté automatiquement sur l'ensemble
des pages aux templates identiques."

La solution Weboscope de Weborama

Dans cette catégorie, on trouve entre autre
s la solution Weboscope du prestataire
Weborama utilisée par
Compaq

(voir
témoignage
), l'agence interactive
404 Found!

ou
encore
L'Oréal Finance
. Elle s'apparente à un service distant de mesure et d'analyse de
trafic Internet. Aucun logiciel ne doit être installé sur les serveurs du propriétaire du s
ite
: l'intégralité des fonctions est gérée via une interface web (ajout et gestion des clients,
visualisation des statistiques, etc.)

Le principe est donc l'insertion sur chacune des pages à auditer d'un marqueur invisible
qui renvoie les informations ver
s le serveur Weborama (une image 1x1 pixel
transparente). Un programme spécifique peut être délivré par la société pour
automatiser le process de marquage.

Les visites sont comptées directement par le serveur Weborama sur lequel les
statistiques sont consu
ltables à tout moment,à l'exception des statistiques de la journée
en cours, qui sont consultables à partir de minuit. Les rapports fournis par le
Weboscope

recensent l'ensemble des indicateurs utiles : nombre d
e pages affichées,
de visites ou de visiteurs mais aussi la localisation en terme de fuseaux horaires ou la

7

liste des principaux points d'entrée. Les statistiques sont présentées page par page
mais aussi par regroupement de pages permettant de réaliser des

analyses
thématiques.

L'outil permet en outre d'obtenir un premier niveau de qualification de l'audience : âge,
sexe et CSP. Cette analyse est basée sur les votes d'internautes issus d'environ 10.000
sites d'horizons très variés (musique, informatique, ar
t, etc.) et fédérés sur le site
weborama.fr
. "Nous qualifions environ 1.000 à 1.500 internautes par jour", précise
Rodolphe Rodriguesl, directeur général de Weborama.

A l'heure actuelle, une base de 150.000 inter
nautes actifs sont stockés dans la base.
Dès que l'un de ces internautes visualise une page, l'information est enregistrée grâce à
un cookie et une consolidation est opérée entre les pages vues et le profil. Grâce à
cette population qualifiée, le Weboscope

permet de distinguer par exemple quels sont
les thèmes préférés des femmes, des cadres ou des moins de 25 ans.

"Ces initiatives de qualification me semblent pleines d'avenir, même si ces pratiques
doivent faire l'objet d'une grande prudence au regard de l
a déontologie quant aux
données personnelles des internautes", estime Hélène Haering.


Tarifs de Weboscope

A titre indicatif, cette solution est facturée selon le principe d'un forfait annuel dépendant
du nombre de pages vues : à partir de 8.000 fancs (HT)

par an jusqu'à 1,.2 million de
pages vues (60.000 francs (HT) entre 24 à 36 millions de pages vues).


Autres outils de cette catégorie tag

e
-
stat

d'Echo


Webandstats

de Tableau de bord

devenu désormais
Audientia




8

IV. Audientia : la mesure par les tags Javascript



La société Tableau de bord créée en novembre 97 fait figure de précur
seur en matière
de solution de mesure d'audience en ligne à partir de tags. D'un développement tous
azimuts sur un certain nombre d'activités telles que le référencement ou l'e
-
mailing, la
société souhaite désormais se concentrer sur son créneau d'expertis
e : la mesure
d'audience . "Un créneau beaucoup plus porteur", estime Patrick Mangeol, directeur de
l'ingénierie et des services chez Audientia. Ainsi la société après presque 3 ans
d'existence vient d'être rachetée par
Audientia

qui n'existe donc que par cette première
croissance externe.



La nouvelle entité est dirigée par Jean
-
Michel Lunati, ex directeur Apple Enterprise
MEA. "La technologie de Tableau de Bord nous a particulièrement intéressée sur deux
point
s principaux", explique Patrick Mangeol. Tout d'abord l'aptitude des marqueurs
Javascript installés sur les sites des clients à capturer l'information sur le navigateur de
l'internaute pour ensuite l'exporter sur la base de données SQL Server de la société
.
Les API de cette base autorisent la consultation par Internet en temps réel de ses
informations (à la minute près), via un navigateur web. La société peut également
héberger chez elle la base de données contenant ces données de navigation.


Par ailleurs
le mode de représentation des données "plus synthétique" constitue un
autre atout de la solution et a d'ailleurs fait l'objet d'un dépôt d'un brevet. Il est possible
de définir une arborescence de pages (sous
-
sites thématiques) pour obtenir des
information
s particulières sur ces sous
-
ensembles. "Cette possibilité correspond tout à
fait à l'idée que les utilisateurs des solutions de mesure d'audience sont de plus en plus
les gens du business et non plus les webmasters uniquement", note Patrick Mangeol.
L'idé
e est en fait de segmenter les informations selon les besoins de chaque
profession.



Ainsi les webmasters pourront avoir besoin de connaître de quels plug
-
in dispose leur
audience afin de développer des applications compatibles avec leurs équipements.
Tand
is qu'un responsable de rubrique souhaitera mesurer l'impact d'une promotion
spéciale sur une page et le taux de transformation en acte de vente. La structuration du
site en sous
-
ensembles peut s'effectuer par l'administrateur à travers une interface web
o
ù il indique quelles pages sont rattachées à quels sous
-
ensembles.

A noter également la possibilité de connaître le mot clé tapé par l'internaute pour
aboutir sur le site de l'éditeur.


Les visiteurs uniques sont identifiés sur la base d'un cookie (seuleme
nt si le site éditeur
l'accepte) couplé à l'adresse IP. Celle
-
ci est identifiée en prenant en compte des
paramètres supplémentaires tels que le type de navigateur ou la taille de la fenêtre. Et
ce en vue de pallier les problèmes d'adresses flottantes (attr
ibution dynamique
d'adresses par le FAI des particuliers).





9

Le prestataire ne tarifie pas ses services en fonction du volume de pages auditées ou
du trafic mais selon un forfait fixe. Ainsi en vente directe, le logiciel est installé sur le
serveur du clien
t et peut auditer jusqu'à 10 sites pour 7000 francs par mois. En vente
mutualisée (la solution est hébergée chez un ISP), le loyer est de 2.500 à 3.000 francs
par mois pour une seule URL par client (commercialisé par
Internext

et
Imaginet
). Parmi
la cinquantaine de clients de la société, on note Cegetel (la boutique) ou encore M6.


La nouvelle société prévoit d'apporter de franches améliorations à l'outil Webandstats.
C
es dernières (qui seront annoncées en septembre) pourraient bien s'articuler autour
du nouveau cheval de bataille de la société qui est "l'analyse de la circulation" donc une
approche résolument tournée vers le comportement et le profiling dynamique des
in
ternautes.

10

V. Les outils de mesure des éditeurs décisionnels



Fort de leur connaissance des bases de données et de l'exploitation fine des
informations clients de l'entreprise, un grand nombre d'acteurs du décisionnel ont tour à
tour pris le virage d'Inte
rnet. Ces derniers proposent une déclinaison de leur offre
adaptée au Web sous la forme d'applications analytiques destinées à optimiser la
compréhension marketing des visiteurs d'un site.



L'offre de SAS Institute

L'américain
SAS Institute

et sa solution
e
-
intelligence

décline en 4 briques son offre
destinée à piloter l'activité du site. Parmi
les indicateurs de performance évalués on
trouve les indicateurs de trafic, de navigation, ou encore de rentabilité. Le dernier type
d'indicateur fournit notamment le taux de conversion ou encore la perte d'acheteurs
potentiels au cours du processus de com
mande. "Autour de cette brique de base
nommée e
-
clic stream, une seconde composante e
-
discovery permet de valoriser les
informations collectées (logiques d'achat, anticiper les comportements...)", indique
Christine Lebras, responsable de l'offre e
-
intellig
ence pour SAS France. "Les données
log constituent une première étape et permettent d'identifier des typologies de
comportement de navigation. Si le site décide de mettre en place des formulaires en
ligne, il enrichira alors sa base de données (e
-
warehouse
) et pourra affiner les modèles
comportementaux qu'il aura déterminés. "L'objectif de la démarche est de fournir une
vision à 360° des visteurs du site et ce en proposant une intégration totale avec les
données off line issues par exemple des bases de donn
ées Oracle, Sybase ou Informix.
La société propose son propre outil de recherche des fichiers log même si l'offre est
compatible avec les principales solutions du marché. Le format de stockage des
données peut être multidimensionnel ou relationnel. Quant a
ux rapports, ils peuvent
être délivrés sous une forme HTML (statique), CGI (semi
-
dynamique) ou java
(dynamique). L'environnement technique peut être indifféremment Unix ou NT. "Notre
vision de l'audience Web est qu'un comptage simpliste des pages vues ou d
u nombre
de visiteurs est trop réducteur aujourd'hui. Il est nécessaire d'aller plus loin et de
réellement valoriser les statistiques", explique Christine Le Bras.

Tarif indicatif de la
solution : 1,5 million de francs.


L'offre d'Hyperion

La suite modulai
re d'
Hyperion

baptisée
Web Site Analysis Suite

comprend des
composants d'analyse, de reporting (Site Analysis) et un moteur de règles
(Sessi
onizer). Ces composants s'intègrent aux principaux serveurs Web du marché et
aux systèmes traditionnels de back et de front office. Elle s'appuie de préférence sur la
base de données multidimensionnelle Essbase, mais sans exclusivité. Pour produire
des enr
egistrements précis et fiables des fichiers log, le système propose Sessionizer,
un moteur qui se fonde sur des règles pour identifier et caractériser de manière fiable
les visites issues des hits et des clics enregistrés sur le site Web. Sessionizer stock
e les
informations sous un format de base de données ouvert, accessible à des outils
analytiques. Suivant la même philosophie que son concurrent SAS, le trafic mesuré
n'est pas indépendant du reste de l'activité de l'entreprise : les informations de
market
ing en ligne ou de transactions e
-
business sont associées à des sources de
données diverses telles que les ERP, les outils CRM et les entrepôts de données.
Objectif : apporter une perspective plus pertinente et surtout plus globale. A noter
le
récent partenariat

d'Hypérion avec WebTrends pour WebTrends Live.



11

L'offre de MicroStrategy

MicroStrategy

propose au sein de sa suite d'e
-
CRM un module d'analyse Web (e
-
Web
Analysis) qui permet d'éditer une trentaine de rapports pré
-
définis "sous une forme
dynamique (activeX et java mais aussi HTML)", précise Thierry Duval en charge de la
formation sur ce produit pour MicroStrategy. "Il est
possible de naviguer dans le rapport
et d'affiner sa requête en visualisant les données sous une autre forme avec d'autres
attributs." Par exemple afficher le nombre de visites sur une localité particulière.
L'éditeur ne propose pas de système de traçage d
es fichiers log. "L'outil a pour vocation
d'extraire les données et de les représenter sous une forme particulière. Sa force réside
dans sa capacité à traiter jusqu'à plusieurs dizaines de tera octets (millions de millions
d'octets) de données. L'utilisati
on de cette brique présuppose l'installation d'une plate
-
forme modulaire comprenant entre autres "Intelligence Server", le maillon entre les
différents outils et la base de données ainsi que Microstrategy Web, le moteur
analytique. L'environnement techniqu
e doit être sous NT. Le coût de l'investissement
est estimé à environ 150 000 dollars pour 50 utilisateurs (tarif bundle comprenant
l'ensemble de la plate
-
forme produits, les modèles de données et l'audit de consulting).
La solution française sera disponib
le cet été.


En conclusion...

De l'avis des spécialistes ces acteurs ont un avantage certain sur ce marché en
apportant une plate
-
forme complète orientée d'abord sur la relation client. Néanmoins,
certaines technologies comme l'analyse des fichiers log ne
font pas partie de leur cœur
de métier. En outre les solutions prêtes à l'emploi ne sont pas toujours de bonnes
stratégies en la matière et il est souvent préconisé de se tourner vers des solutions
personnalisées.



12

VI. Macromedia investit la mesure d'aud
ience avec Aria


Le spécialiste de la création et du design Web,
Macromédia

(avec Flash ou
Dreamweaver) se lance sur le marché de la mesure d'audience grâce à l'acquisition
d'Andromedia en décembre dernier. "C
ette nouvelle brique technologique permet à
Macromedia d'être présent sur presque l'intégralité du cycle de vie Web à savoir la
conception du contenu, l'affichage (Flash Player et Shockwave), l'analyse (Aria) et la
personnalisation (Like Minds)", explique
José Vasco, directeur France de Macromedia.

Ainsi la solution Aria Enterprise se présente comme un outil d'analyse haut de gamme
destiné en priorité aux sites générant un fort trafic (aux Etats
-
Unis, les sites utilisateurs
atteignent le million de connexio
ns par jour).

Par ailleurs, les sites disposant d'une architecture complexe (de type distribuée et sites
dynamiques) sont aussi des cibles privilégiées pour ce type de logiciel.

"En fait, Aria ne travaille pas sur les fichiers logs comme la plupart des out
ils
concurrents mais s'intéresse aux informations issues des requêtes HTML en se greffant
directement sur le réseau. Le module de sniffing de la solution lui permet de s'installer
en toute transparence sur des architectures variées sans remise en cause de
l'existant",
explique Yann Sonnier, ingénieur avant
-
vente chez
Matranet
, (le revendeur exclusif de
la solution jusqu'à présent). Un plug
-
in peut également être intégré au serveur Web afin
d'exploiter l
es flux SSL. Le logiciel fournit alors des informations en temps réel via des
rapports émis toutes les heures (les données sont issues de sa base de données objet
propriétaire "ObjectStore").

La nouvelle version de la solution (version 5.0) est compatible
avec la base de données
Oracle. Dans ce cas, les rapports pourront être obtenus à la demande (via un
composant fourni par Business Objects). La solution est bâtie selon une architecture
modulaire. Le moniteur (le sniffer) se charge de l'écoute du réseau av
ec des
fonctionnalités de filtrage pour optimiser les temps de traitement : sur les sites
dynamiques il peut réunir par exemple en un seul objet les URL d'une fiche produit
visionnée par plusieurs internautes (URL mapping). Les données collectées par le
mo
niteur sont ensuite transmises au Recorder qui traite les informations afin de générer
des rapports HTML, en synergie avec le troisième module nommé le Reporter.


L'autre point fort de la solution est sa capacité à créer des catégories. "Celles
-
ci
peuvent
être des catégories de visiteurs (selon une origine géographique) ou bien une
catégorie de contenu telle qu'une offre spéciale ou une promotion. Ces catégories
permettent de regrouper des sessions de visites selon un thème donné et obtenir ainsi
des statis
tiques très fines en terme de navigation.


La solution qui travaille sur des plate
-
formes à forte puissance de calcul telle que
Solaris (Enterprise 250) a un coût d'entrée de l'ordre de 500.000 francs. "Nous pensons
trouver un marché en France pour ce type

de solution haute gamme", estime José
Vasco. "En particulier depuis le développement d'un module de dialogue spécifique
entre Aria et la solution Broadvision qui ouvre ainsi un large spectre de sites
potentiellement clients." A noter qu'Aria s'interface é
galement nativement avec le
logiciel de publication Dreamweaver (les objets Aria peuvent être intégrés
automatiquement dans les pages Dreamweaver). En France, le cyber
-
marché
Houra

utilise Aria.



13

VII. Profile For You évalue gratuitement le profil de vos visiteurs


La start
-
up franco
-
britannique
Profile for You
, lancée en juillet 99, innove en matière de
mesure e
t d'analyse d'audience sur le Web. Ses outils "
All Stats For You
" permettent
aux webmasters des sites personnels (pages perso) de suivre gratuitemement la
navigation des internautes en fonction de

paramètres quantitatifs, qualitatifs et de
navigation. En échange de quoi, la société sera à même de constituer une base
d'internautes qualifiés de façon très fine qui pourra être commercialisée auprès de sites
d'e
-
commerce soucieux d'affiner leur marketi
ng. Le principe de cet "échange de bons
procédés" repose sur l'aspiration des sites personnels qui se seront inscrits à ce
programme et qui seront analysés selon deux méthodes : l'analyse des mots
-
clé suivie
d'une analyse sémantique et conceptuelle. Cette
dernière permettra, grâce à des bases
de connaissance constituées par la société, de fournir une vision globale du profil du
site ainsi aspiré.

A partir de là les bases de connaissance seront à même de générer un profil type
(scoring comportemental) associ
é aux visiteurs susceptibles de se rendre sur un tel
site. Trois critères d'identification seront déterminés sur ce site : l'âge (selon des
tranches d'âge identiques à celles utilisées par Médiamétrie ), le genre (si pertinent) , et
les thématiques d'intér
êt associées (24 thèmes préférentiels listés). Par exemple pour
le site d'un club de foot local, on peut imaginer que les visiteurs sont constitués
d'adhérents donc de jeunes garçons aimant le sport. Un cookie crypté est alors émis
une fois le profil du vi
siteur calculé au moment où il passe sur le site personnel. Au fur
et à mesure de son passage sur différents sites, le cookie du visiteur sera affiné en
croisant les différentes informations issues des différents profils de sites visités. "Les
sites person
nels sont un terrain idéal de qualification d'audience, souligne Jean
-
Claude
Jamet, directeur de l'antenne française de la société, conçus par des passionnés pour
des passionnés : ils bénéficient d'une audience très ciblée." Même si les informations
ainsi
collectées ne sont pas nominatives, la société a travaillé en étroite collaboration
avec la CNIL pour la mise en place d'un dispositif informant de la collecte d'informations
et la validation des profils adéquats par l'internaute audité.

"Les webmasters qu
i acceptent notre mesure sur leur site se voient non seulement
gratifier d'un bilan gratuit complet de leur site et de leur cible mais bénéficient
également d'un programme de points bonus (
Allstats
-
Tower
) ouvrant droit à des
cadeaux", précise
-
t
-
il . La société prévoit de recruter environ 50.000 sites perso pour
débuter même si leur plate
-
forme technique (Apache, Linux et mySQL) est prévue pour
aspirer des centaines de milliers de sites.

"A terme, l'
idée est de proposer aux sociétés un scoring prédictif qui leur permettra de
connaître, lorsqu'un internaute se connectera à leur site, sa propension à s'inscrire, à
acheter, ou bien à s'inscrire à une mailing list. Et ce grâce à l'identification des varia
bles
déterminantes dans son profil. Une personnalisation pourrait donc ainsi être opérée de
façon simple (pop
-
up ou bandeau personnalisable qui apparaît selon la prédiction
opérée). La prestation serait facturée selon le niveau de service rendu pour enviro
n 10
francs pour 1000 internautes décodés."Nous prévoyons de pouvoir identifier entre 20 et
30% du trafic d'un site, ce qui est amplement suffisant pour un panorama représentatif",
assure Jean
-
Claude Jamet. Le service sera commercialisé à partir de septemb
re.



14

VIII. Compaq combine WebTrends et Weborama


La filiale française du constructeur informatique Compaq a opté pour une combinaison
de deux outils de mesure et d'analyse d'audience : WebTrends et Weborama, pour
suivre le site institutionnel Compaq.fr
et ses extranets (revendeurs et grands comptes).

"Les deux outils sont complémentaires et nous permettent de répondre à des besoins
différenciés", explique Olivier de Lavalette, directeur du Commerce électronique chez
Compaq France. Weborama nous donne une

vision macro de l'audience globale des
différents sites en fédérant un certain nombre de pages du site.

En effet, Weborama à travers son outil Weboscope permet de grouper un certain
nombre de pages du site. On peut ensuite en déduire par exemple qui vient

voir les
portables grand public ou la gamme PME. En un clin d'oeil, il est possible de visualiser
pour l'ensemble des sites, toutes les visites et leurs origines. L'intérêt majeur réside
dans la possibilité de fusionner les mesures sur plusieurs sites à l
a fois indépendants et
distants : Houston, Paris, Munich.

Quant à WebTrends,
il fournit une vision
de détail, très
élaborée, utile pour la
finesse de ses
analyses. Il permet à
Compaq de piloter
par exemple son
agence de création
dans le
développement ou l
a reconfiguration de certaines pages et de mesurer la rentabilité de
certains investissements.

Weborama fournit des rapports plus simples et plus conviviaux pour le personnel non
informaticien. Il est également appréciable de pouvoir éditer des rapports hi
storisés du
trafic et suivre ainsi l'évolution sur plusieurs mois.

"Nous sommes satisfaits de l'équipe Weborama qui est à l'écoute de nos besoins. Ainsi
l'outil évolue en permanence : on peut obtenir les statistiques d'une date de son choix à
une autre ou
recevoir le reporting en push. Les données qualifiées grâce aux cookies,
sur certaines zones, peuvent être intéressantes mais non significatives en terme de
volumes. La population qualifiée représente moins de 10% du trafic global", conclut
Olivier de Lava
lette.


Chiffres clé du site Compaq.fr

Visiteurs


environ 40.000/semaine


Pages vues


1 million de pages/mois


Temps moyen


Entre 7 à 8 minutes



Copyright: Benchmark Group


"
Weborama nous fournit une vision
d'ensemble conviviale tandis que
WebTrends affine les analyses sur les
détails de la navigation.
"

Olivier de Lavalette

Compaq France



15

IX. Cetelem : WebTrends pour la navigation mais pas pour le transa
ctionnel


L'agence de crédit en ligne de
Cetelem
, gère depuis 1998 les demandes de crédit (prêt
personnel, crédit auto, travaux...) d'une clientèle de particuliers via notamment des
formulaires formatés et sécurisé
s. Depuis un an et demi, elle utilise WebTrends comme
logiciel de suivi statistique. Il a notamment été retenu pour ses qualités de fiabilité et la
finesse de ses statistiques. "WebTrends est un explorateur de données, il contient des
milliers et des milli
ers de chiffres", estime Eric Le Berre, responsable front office du site
Cetelem.fr
. "Pour nous, il est essentiellement utile pour repérer les habitudes de
navigation de nos clients. Par exemple d'où viennent les clients : quel mot clé ont
-
ils
tapé ? Dans
notre cas, les clients ont à 60% tapé directement le nom de notre
enseigne, Cetelem, et non pas crédit comme on aurait pu le penser... Nous sommes
également intéressés par les heures de connexion de notre cible qui sont
essentiellement les heures ouvrables

avec un pic le mercredi (les gens se connectent
au bureau). Donc pas de demandes la nuit comme le laissaient entendre certains
spécialistes du Web qui prédisaient la fin des horaires traditionnels en la matière.


C'est ainsi que nous
avons adapté nos
heures d'ouverture à
ces pratiques (une
équipe d'une

dizaine
de commer
-
ciaux se
relaient pour traiter
les demandes des
clients). Cette information nous permet de dimensionner efficacement nos effectifs pour
plus de réactivité. Enfin le type de navigateur constitue également une information
pertinente. On se

rend compte que la plupart ne dispose pas d'un matériel de pointe ce
qui nous limite dans les plug
-
in, java ou autre flash sur notre site qui ne seraient pas
forcément lisibles par tous. En revanche nous ne prêtons aucun intérêt au nombre de
pages vues. L
'essentiel pour nous c'est le nombre de demandes de crédit effectivement
réalisées puis concrétisées. Selon moi, les outils de mesure doivent évoluer vers la
mesure d'audience de production, c'est
-
à
-
dire l'évaluation des transactions, le taux de
transforma
tion dans une approche commerciale pragmatique. Chez Cetelem, nous
avons développé en interne avec nos équipes de programmeurs des applications
spécifiques pour mesurer l'efficacité des demandes de crédit, le nombre de demandes
de crédit classé par type de

crédit, le CA réalisé chaque jour, l'analyse du taux de clic.
Autant d'indicateurs fondamentaux au suivi de notre activité. Par ailleurs, nous
souhaitions des applications intégrées à notre système d'information central IBM pour
un système d'information m
ulticanal et unifié ce qui n'est pas possible avec
WebTrends."



Chiffres Clé du site Cetelem


Visiteurs uniques/jour


2000


Nombre de demandes de crédit/jour


350


Temps passé


environ 10 minutes




"
Les outils de mesure d'audienc
e
devraient évoler vers la mesure de la
performance commerciale
."


Eric Le Berre

Cetelem




16

X. Après Hit
-
parade, @t Internet lance sa
solution de mesure d'audience gratuite


Fort de son expérience en matière de mesure d'audience et de classement au travers
du site
hit
-
parade.com

(qui audite désormais un peu plus de 50.000 sites
francophones)
, la société @t Internet, créée il y a 4 ans lance sa nouvelle solution de
mesure d'audience en ligne :
Xiti
. "Nous avons travaillé pendant près de 4 ans sur le
développement de ce nouvel outil qui nous permettra de
proposer à nos clients des
fonctionnalités plus pointues que nous ne pouvions le faire avec hit
-
parade en matière
de gestion d'audience", explique Alain Llorens, pdg de

@t Internet.


Et ce dernier pèse bien c
haque mot : "La gestion, car il s'agit réellement de proposer
une solution qui va au delà de la mesure statistique et qui propose des données
pertinentes pour l'administrateur du site" et "l'audience, à distinguer du trafic qui ne
constitue pas une poupula
tion significative sur le site (seulement des passages puis
zapping à la suite par exemple d'un clic sur un bandeau publicitaire)". Xiti veut donc
aller au delà de la mesure quantitiative en fournissant des indicateurs permettant de
comprendre le comportem
ent des internautes.


Sur le même principe que Hit
-
Parade (qui regroupe notamment des sites comme Spray
ou Wanadoo), les sites souhaitant bénéficier du service de Xiti devront mettre au
préalable des tags sur leurs pages (intégration d'un logo javascript s
ur chaque page à
copier
-
coller). De façon classique dans cette technique, la page appelée par un
internaute déclenchera sur le serveur distant hébergé chez Xiti un log. A partir de ce
stock de logs, la solution Xiti sera à même d'extraire et de calculer en

croisant
l'ensemble des données ainsi obtenues (heure de connexion, nom de la page, le
référeur...), un ensemble d'indicateurs présentés sous forme de rapports en ligne au
gestionnaire du site. Ce dernier viendra se connecter au site de Xiti muni de ses m
ots
de passe.


"Nous avons déterminé un ensemble de critères d'intérêt en recensant en fait nos
propres besoins (ndlr : @Internet est gestionnaire de plusieurs site dont
un site de
rencontre

et
un site de vente de vins
) et ceux de nos clients", explique Gérald
Bignonneau, directeur technique pour Xiti. Ainsi, le webmaster pourra distinguer le taux
de visite à 1 page, c'est
-
à
-
dire en fait les visiteurs correspondant à d
u "simple trafic",
comme défini plus haut. Mais aussi le nombre de pages vues par visite et ce en fonction
du navigateur utilisé, des systèmes d'exploitation ou encore de leurs versions. "En effet,
ces détails sont importants, nous avons ainsi pu détecter
des différences importantes
dans le nombres de pages vues selon le navigateur utilisé (9 pages vues avec
Netscape contre 18 pages vues avec Internet Explorer).

Une remontée d'alerte de ce type nous a permis d'identifier que des techniques de
développement
telles que le dynamique HTML n'était pas exploité de la même façon
par les navigateurs utilisés, de même la mise en page peut être affichée différemment
sous Windows ou sous Mac et engendrer des déperditions d'audience", explique
-
t
-
il.


Parmi les critères
d'intérêt, les rapports présentent également la durée moyenne de
consultation par visiteur ou encore le nombre de pages vues par visite significative
(soustrait des données relatives au trafic). En option, il est possible de repérer les
erreurs 404 ou de d
éterminer pour les sites à vocation internationale, la part de chaque
pays dans l'audience globale. "Nous sommes capables de déterminer précisément
l'origine géographique d'une connexion et pas seulement à partir du nom de domaine
qui peut conduire à des i
nterprétations erronées. Nous nous basons sur un croisement

17

de données (croisement de l'adresse IP avec l'appartenance de l'adresse IP au pays)."
Plus tard (d'ici septembre), il sera possible pour le gestionnaire de plusieurs sites de
disposer d'un bilan s
uccint unique de l'ensemble des caractéristiques de ses audiences.


L'ensemble du service sera proposé gratuitement aux sociétés acceptant de placer sur
chaque page un tag apparent représentant le logo de la société. Et par ailleurs, ils
devront être des s
ites à petite audience (jusqu'à 2 millions de pages vues par mois).
Pour, les sites ne souhaitant pas faire apparaître ce logo, le service sera payant à
raison de 300 francs HT par mois pour les petits sites.Tandis que pour les sites
générant plus de 2 mil
lions de pages vues par mois, le service sera facturé 1.250 francs
HT par mois.


La société table sur environ 10.000 inscrits d'ici la fin de l'année incluant 3.000 à 4.000
payants. Les hébergeurs de sites et les web agencies constituent des cibles priorit
aires.
"Depuis le lancement du service (le 22/05), nous enregistrons 1.000 nouveaux inscrits
chaque jour !", s'étonne presque Alain Llorens.

La société s'intéresse de très près aux solutions de datamining et prépare en
association avec l'éditeur SPSS deux
nouvelles solutions d'analyse comportemantale
(sortie prévue avant la fin de l'année). Une levée prochaine de l'ordre de 30 millions de
francs financerait ces projets.



18

XI. Principaux outils de mesure d'audience Web


Les atouts


Les outils log


Les outils tag

Les outils

décisionnels

Types de logiciels


ERS de
Webtrends
,
Net
Audience

de Cartel
Informatique

Site Server

de Microsoft


Weboscope

de
Weborama
,

e
-
stat

d'Echo,
Webandstats

de Tableau
de bord

e
-
intelligence

de
SAS
Institute
,
Web Site
Analysis Suite

de
Hyperion

et e
-
Web Ana
lysis de
MicroStrategy


Tarifs indicatifs


Environ 15.000F


Abonnement annuel à partir
de 8.000F/an

en fonction du nombre de
pages à auditer


De 300.000F au million de F


Atout 1

Mise en oeuvre rapide,
"
indolore"


Mesure exhaustive (pas
d'effet cache)


Vision à 360° de la relation
client


Atout 2

Prise en compte de tous les
accès (bureau, domicile...)


Serveur distant chez un
tiers évite la maintenance et
les mises à jour

Expertise marketing forte,
pui
ssance analytique sur de
fortes volumétries de
données


Atout 3


Comptage relativement fiable
et robuste (sans biais)


Meilleure crédibilité des
statistiques auprès
d'annonceurs et
indépendance si on change
de serveur ou d'hébergeur

Possibilité d'intégra
tion avec
les systèmes back
-
office et
front office pré
-
existants


Atout 4

De nombreux outils de
reporting sont disponibles.


Emergence des données
qualifiantes sur l'audience
croisée aux statistiques de
trafic





Les limites


Les outils log


Les outils tag

Les outils

décisionnels

Limite 1

Problème d'exhaustivité
(requêtes les plus fréquentes
interceptées par les proxies ou
les caches des navigateurs


Contrainte technique
relative à la mise en place
des tags


Offre pré
-
packagée parfois
inad
aptée aux besoins d'un site
et de son activité


Limite 2

Difficulté à estimer le nombre de
visiteurs uniques


Attention aux données non
pertinentes (connexion
robots de recherche ou
salariés du site)

Un coût parfois prohibitif


Limite 3


Pas d'indicati
on sur le profil du
visiteur


Différence de mesure
selon les navigateurs
utilisés par les internautes


Manque de performance en ce
qui concerne les traitements
des fichiers log


Limite 4

Difficulté à mesurer la pages
réellement vue (en entier) ni
même af
fichée


Propriété des données et
des statistiques hébergées
chez le tiers.Rester vigilant



















19









ANNEXES