format WinWord (598Kb) - ULB

mustardunfInternet και Εφαρμογές Web

21 Οκτ 2013 (πριν από 3 χρόνια και 11 μήνες)

391 εμφανίσεις









BUREAUTIQUE

Un monde centré sur le document















Ph. BERTRAND

(C) V1.1.1 1998

2

CHAPITRE 1:

UN OBJET MECONNU, LE

PAPIER

................................
................

6

1.1.

La Bureautique en quelques mots

................................
................................
......

6

1.2.

Un objet apparemment simple : le papier

................................
..........................

7

1.2.1.

Papier et document électronique

................................
..........................

7

1.2.2.

La densité de stockage

................................
................................
.........

8

1.2.3.

Un support bi
-
dimensionnel

................................
................................

8

1.2.4.

Lisibilité, archivage, annotation

................................
..........................

9

1.2.5.

Le papier comme outil de structuration des échanges

.........................

9

1.2.6.

Reproduction et message lié au médium lui
-
même

...........................

10

1.2.7.

Quelques problèmes de la représentation électronique

.....................

10

1.2.8.

En conclusion

................................
................................
....................

12

1.3.

La lente évolution des représentations électroniques

................................
......

12

1.3.1.

Les premières transmissions électroniques

................................
........

12

1.3.2.

La situation jusqu’au début de l’informatisation

...............................

12

1.3.3.

L’apport des grands ordinateurs centraux

................................
..........

14

1.3.4.

L’arrivée des minis et le PARC

................................
.........................

14

1.3.5.

L’émergence des réseaux informatiques

................................
............

17

1.3.6.

L’arrivée des PCs

................................
................................
...............

18

1.3.7.

Les grandes études bureautiques
................................
........................

19

1.3.8.

Les incertitudes du début des années 1990 et Unix

...........................

20

1.3.9.

Le triomphe du PC et la domination de Microsoft

............................

21

CHAP
ITRE 2:

UN OBJET COMPLEXE, L
E DOCUMENT

................................
...

24

2.1.

Qu’est ce qu’un document

?

................................
................................
............

24

2.2.

Bases et définition d’un document

................................
................................
..

27

2.3.

Conversion de représentation, ric
hesse et appauvrissement

............................

28

2.4.

Passage d’une représentation de document à une autre

................................
...

32

2.5.

Propriétés des documents riches et des documents pauvres

............................

35

3

2.6
.

D’autres documents que les documents textuels

................................
.............

39

2.7.

Représentation objet et documents multimédias

................................
.............

40

CHAPITRE 3:

QUELQUES REPRESENTAT
IONS DE DOCUMENTS

................

44

3.1.

Les représentations intéressantes

................................
................................
.....

44

3.2.

Une représentation orientée vers la restitution

: Postscript

.............................

45

3.3.

Polices de caractère

................................
................................
.........................

49

3.4.

HTML

................................
................................
................................
..............

51

3.5.

ODA ou la recherche du format universel

................................
.......................

53

3.5.1.

Un objectif ambitieux

................................
................................
........

53

3.5.2.

Les principes de base

................................
................................
.........

54

3.5.3.

La repré
sentation de la structure logique d’un document

..................

55

3.5.4.

Les blocs, entre la description logique et la description
physique

................................
................................
.............................

56

3.5.5.

La structure physique du document

................................
...................

56

3.5.6.

Les difficultés liées à l’universalité de la norme

...............................

57

3.5.7.

Les raisons de l’échec

................................
................................
........

58

3.5.8.

ODA et les classes

................................
................................
.............

58

3.5.9.

La réduction

du nombre de traitements de texte

................................

58

3.6.

SGML, XML et XSL

................................
................................
.......................

59

3.6.1.

La standardisation des représentations riches

................................
....

5
9

3.6.2.

Le SGML

................................
................................
...........................

62

3.6.3.

XML et XSL

................................
................................
......................

65

CHAPITRE 4:

QUELQUES TYPES DE DO
CUMENTS ET LEURS
OUTILS

69

4.1.

Les classiques: le traitement de texte et les outils de dessin

...........................

69

4.2.

Le tableur

................................
................................
................................
.........

72

4.3.

La structuration de plusieurs documents

................................
.........................

76

4.4.

Décomposition d'un document en bloc

................................
............................

78

4

4.5.

Le document comme interface à des
bases de données structurées

.................

80

4.6.

Formulaires et agendas

................................
................................
....................

83

4.7.

Des documents programmes

................................
................................
............

84

4.8.

Sécurité et signature

................................
................................
.........................

86

CHAPITRE 5:

LE DOCUMENT DANS L'E
SPACE ET DANS LE TEM
PS

..........

93

5.1.

Les possibilités du document électronique

................................
......................

93

5.2.

Le courrier électronique

................................
................................
...................

95

5.3.

Répertoir
e

................................
................................
................................
......

100

5.4.

Les bases de données documentaires

................................
.............................

103

5.5.

Les systèmes d'archivage

................................
................................
...............

107

5.6.

Circulation de documents

................................
................................
..............

111

5.7.

In
ternet, intranet, extranet

................................
................................
..............

115

5.7.1.

La révolution WEB

................................
................................
..........

115

5.7.2.

INTERNET

................................
................................
......................

116

5.7.3.

Intranet

................................
................................
.............................

116

5.7.4.

Extranet

................................
................................
............................

118

5.8.

Architecture bureautique

................................
................................
...............

118

CHAPITRE 6:

INTEGRATION DE LA BU
REAUTIQUE DANS
L'ORGANISATION

................................
................................
................................

122

6.1.

L'entreprise classique orientée "papier" et la bureautiq
ue

.............................

122

6.1.1.

Introduction du traitement de texte

................................
..................

122

6.1.2.

Introduction du courrier électronique

................................
..............

123

6.1.3.

Enregistrement et archivage

................................
............................

126

6.2.

Quand l'électronique devient la référence

................................
......................

126

6.2.1.

Les principes

................................
................................
....................

126

6.2.2.

L'organisation du stockage

................................
..............................

127

6.2.3.

Les outils d'acqui
sition et de restitution

................................
..........

128

5

6.3.

Achat des produits bureautiques

................................
................................
....

130

6.4.

L'organisation de la bureautique

................................
................................
....

131

6.5.

La gestion financière

................................
................................
......................

132

6.5.1.

Les coûts bureautiques

................................
................................
.....

132

6.5.2.

Coût en matériel
................................
................................
...............

133

6.5.3.

Ressources humaines

................................
................................
.......

135

6.5.4.

Total Cost of Ownership et amortisseme
nt des PC

.........................

136

6.5.5.

La facturation interne

................................
................................
.......

138

CHAPITRE 7:

QUELQUES PRECISIONS
TECHNIQUES

................................
..

140

7.1.

Quelques notions concernant l'infrastructure réseaux

................................
...

140

7.2.

Les protocoles "peer to peer", "client
-
serveur" et réplication

.......................

141

7.3.

Les approches objet

................................
................................
.......................

143

7.4.

Les techniques de base d'intégration du monde wind
ows

.............................

146

7.5.

OLE et l'approche composant sous windows

................................
................

150

7.6.

Java, javascript et la complexité du monde WEB

................................
.........

153


6

1.1.
La Bureautiqu
e en quelques mots

La bureautique, c'est l'informatique qui s'applique à la production, le transport, le
stockage et l'impression d'un document. Une définition assez simple et qui ne
semble pas nécessiter un livre pour en traiter tous les aspects. Après to
ut, si on en
supprime l'aspect informatique, n'est ce pas que l'on fait avec le papier depuis
l'invention de l'écriture il y a quelques millénaires ?

Aussi, à priori, il semble que la bureautique doive se confiner à décrire la façon de
représenter le papie
r sous une forme électronique de 'bits' et de 'bytes', à transporter
ces 'bits' et ces 'bytes' d'un point à l'autre, à les stocker et à les reproduire en fin de la
'chaîne bureautique' sur écran ou sur papier. Un livre de bureautique devrait être
assez tec
hnique, peu excitant et en tout cas fort terre à terre...

Mais si la réalité était telle, pourquoi la sortie d'un nouveau traitement de texte (ou
d'une nouvelle version d'un traitement de texte existant) reste
-
t
-
elle un événement
majeur ? Pourquoi la créat
ion d'un nouveau produit bureautique tel qu'un tableur a
-
t
-
elle pu faire en son temps la fortune d'une firme ou d'un individu ? Pourquoi
l'arrivée de nouveaux standards de représentation de texte tel que le HTML et son
émergence sur les grands réseaux télé
matiques (INTERNET) a
-
t
-
elle été saluée
comme une révolution industrielle à ranger parmi les 'catalyseurs d'un changement
de paradigme de société' pour reprendre un jargon un peu ésotérique mais au
contenu assez correct ? Et finalement, pourquoi l'informa
tique, qui pendant 15 ans,
a été synonyme de développement d'applications ciblées sur un domaine précis a
-
t
-
elle soudain prise une voie assez différente avec l'émergence de produits standards à
intégrer entre eux, un peu comme si on était passé du stade de

construction
artisanale de 'pièces uniques' à une fabrication en grande série d'objets identiques ?

Si on analyse la définition de la bureautique, celle
-
ci ne parait, de prime abord ne
receler aucun mystère. Produire, transporter, stocker et imprimer... D
es mots
simples, centenaires qui s'appliquent à des techniques connues...

De prime abord, un document semble aussi être un concept assez clair. Un
document, un papier quoi... quelque chose qu’il est possible de lire.... enfin plus
exactement, il est possi
ble de lire ce qui est écrit sur le papier.... écrit avec de
l'encre... lire les caractères du document... ou les dessins... oui c'est cela lire les
textes... et les comprendre.... enfin s'ils sont écrits dans votre langue.... et si c'est un
domaine que vo
us pouvez comprendre, dans lequel vous avez certaines bases....

En fait, un document n'est pas un concept simple. Sous ce nom se cache une
représentation physique (originellement du papier et de l'encre) et une représentation
d'un contenu avec tout ce que

cela comprend habituellement comme couche empilée
de règles, syntactiques tout d'abord puis de plus en plus sémantiques jusqu'à
impliquer finalement tout l'environnement culturel du lecteur.

Chapitre 1:

Un objet méconnu, le papier

7

C'est à cause de cette complexité que la bureautique est comple
xe, est imaginative et
créatrice. C'est parce qu'une image digitalisée est un document. Un texte écrit au
moyen d'un traitement de texte est un document. Un ensemble de textes liés
ensemble par des 'hyperliens' est aussi un (et plusieurs) documents. Un tab
leur est un
document, un agenda électronique est un document, un formulaire électronique est
un document et à la limite l'interface à une base de donnée centralisée est aussi un
document. Un système de traduction automatique traduit des documents. Un
systè
me de reconnaissance de caractère convertit des documents en d'autres
documents. Des documents peuvent être contenus dans d'autres documents. Des
documents peuvent être des modèles et définir des règles pour créer d'autres
documents. Et finalement un roman
, un document de quelques centaines de pages,
doit
-
il être vu comme un amas de pulpe de bois spécialement traité et recouvert
d'extraits végétaux ou animaux appelés «

encre

» ou doit
-
il être défini comme une
«

super base de données

», peut
-
être un peu plus

complexe qu'une base de donnée
relationnelle, mais répondant à des principes similaires de modélisation ?

Ces considérations peuvent paraître un peu abstraites. Elles ne le sont pas. C'est à
cause de la difficulté de définir ce qu'est un document, c'est à

cause des multiples
niveaux auxquels le concept de 'document' peut être examiné que la bureautique est
difficile à maîtriser et perpétuellement en évolution. C'est à cause de cette
complexité aussi qu'il est difficile d'expliquer à un utilisateur pourquoi

le texte qu'il
reçoit par FAX ne peut pas être facilement stocké dans une base de donnée,
pourquoi un tableau dans un tableur n'a pas les mêmes propriétés qu'un tableau
représenté par une tabulation classique ou pourquoi, bien qu'ils semblent similaires à

l'impression, un document peut être utilisé pour charger une base de donnée
relationnelle alors que son frère jumeau doit être entièrement réencodé. La
bureautique est proche de l'information, elle est proche de la notion d'entropie, une
notion difficile
à comprendre correctement. C'est à une meilleure compréhension des

concepts qu'elle met en œuvre que ce livre est consacré.

1.2.
Un objet apparemment simple : le papier

1.2.1.

Papier et document électronique

Avant d'examiner les représentations électroniques des docum
ents, il est bon
d'examiner le concept de document papier que nos pères ont créé il y a
quelques milliers d'années, d'abord au départ de roseaux en Egypte, puis à
partir d'écorce de bois...

Un papier en fait est un support extraordinaire...

8

1.2.2.

La densité de s
tockage

Tout d'abord c'est un système de stockage d'une densité incroyable. Il est
fréquent de s'extasier sur la densité d'information que l'on peut écrire sur un
CD
-
ROM voire sur une simple disquette et de la comparer avec le volume
que prendrait la même
information même écrite sur du papier bible. La
comparaison n'est pourtant pas si simple. D'abord parce qu'un CD
-
ROM ou
une disquette ne peut s'utiliser qu'avec un instrument de lecture qui est, lui,
fort encombrant (et réclame de l'énergie électrique). Et

ensuite parce qu'un
CD
-
ROM ou une disquette n'est vraiment à son avantage que lorsqu'il s'agit
de représenter des informations qui sont bien structurées comme du texte
pur. Pour une représentation d'images de très haute définition par exemple, le
papier,
ce support à deux dimensions dans un monde à trois dimensions
garde assez bien d’avantage. Actuellement, cependant, l’apparition de
techniques de compression de plus en plus sophistiquées et l’utilisation de
support de stockage de plus en plus dense (DVD
-
R
OM, micro disques durs)
permettent d’avoir des densités de représentation plus fortes dans les
représentations électroniques. Néanmoins, le papier reste un bon moyen de
communication de l'information. Etant souple et léger, il peut facilement être
transpor
té à faible coût en grosse quantité.

1.2.3.

Un support bi
-
dimensionnel

Le caractère bi
-
dimensionnel du papier lui donne aussi des propriétés
extraordinaires comme celle de pouvoir être déposé dans une boîte aux
lettres (où l'espace libre en dessous d'une porte)
, c
-
à
-
d dans un endroit où le
déposant peut placer le document mais ni lui, ni une autre personne que le
destinataire ne peut le reprendre.

Grâce à son caractère quasiment bi
-
dimensionnel, le papier peut aussi être
glissé dans des enveloppes scellées qui e
n préservent la confidentialité ou
plus exactement qui permettent normalement de détecter à l'arrivée si la
confidentialité a été respectée. C’est une propriété difficile à reproduire par
d'autres moyens de communication et qui est fort importante. Ainsi,
une
conversation téléphonique 'en clair' peut être écoutée par un tiers bien équipé
intervenant sur le trajet de l'échange téléphonique. Cette écoute peut se faire
pratiquement sans laisser de trace. Si la conversation est encryptée par celui
qui parle et
décryptée par celui qui écoute, il n'y par contre aucun moyen
pour un tiers d'en connaître le contenu. L'enveloppe scellée est plus subtile.
Elle permet d'intercepter le message... mais pas sans laisser de trace. Elle
oblige donc l'indiscret à estimer le p
rix du secret, à valider aussi que le fait
que le secret soit brisé et que cela soit connu ne retire pas par définition toute
valeur à l'information.

9

1.2.4.

Lisibilité, archivage, annotation

Le papier est lisible sans instrument et inscriptible avec des instrumen
ts
rudimentaires faciles à avoir en permanence sur soi, peu coûteux et qui ne
réclament pas d'autre énergie que l'énergie humaine... Le papier peut donc
être utilisé facilement, même en l'absence d'infrastructure. Mais cela signifie
aussi que le papier est

un bon support d'archivage. Comme il ne réclame pas
d'outil de lecture, il n'est pas à craindre que dans 10 ans, dans 100 ans ou
dans 1000 ans, il ne soit impossible de reconstruire à un coût raisonnable une
machine de relecture. D'autre part, parce qu'il

est facile à lire, il permet une
identification rapide du contenu. D'un seul coup d’œil, il est donc possible de
distinguer une facture d'électricité d'un poème de Baudelaire.

Le support papier est résistant et l'information écrite avec des encres de
bonn
e qualité peut être préservée pendant quelques siècles. D'autre part, ce
support peut être plié ce qui permet de l'ajuster facilement à l'espace
physique disponible. Lorsque le support est détruit correctement, il est
possible de garantir la disparition de

l'information qu'il contenait. Ce support
(et son contenu) peut être découpé en morceau et rassemblé.

Le papier peut être facilement annoté. Comme il est très facile de le faire
circuler, un papier enrichi d'annotation peut supporter le travail en groupe.

Couplée avec la signature, l'annotation permet aussi de définir des
procédures administratives formalisées enregistrant comment un problème
répétitif doit être traité. Une forme particulière d'annotation et de signature
est l'apposition d'un cachet qui pe
ut servir à effectuer une signature 'rapide'
mais aussi à d'autres fins (l'oblitération des timbres par exemple). A noter
aussi des annotations très particulières du papier dans certains cas, tel la
coutume des garçons de café de fait de déchirer partielle
ment le ticket après
que le client aie réglé sa consommation (une sorte de signature en fait car on
peut supposer que le garçon de café peut distinguer 'sa' façon de déchirer
d'une imitation d'un client peu scrupuleux).

1.2.5.

Le papier comme outil de structurat
ion des échanges

Le papier se prête bien à la création de formulaires. Ces formulaires
permettent de structurer l'information que l'on recherche à acquérir. La
combinaison de formulaires pré
-
imprimés, de copies carbone et la signature
manuelle a été pendan
t un siècle la façon traditionnelle de garantir un accord
entre plusieurs parties, chacune de ces parties possédant une preuve
pratiquement irréfutable de l'accord. Et même aujourd'hui, à l'heure où la
plupart des magasins sont reliés par liaison téléphoni
que à des ordinateurs de
validation, la signature d'un papier auto
-
copiant reste la façon la plus
courante d'effectuer un paiement au moyen d'une carte de crédit.

Le papier permet de résoudre assez facilement le problème d’authentification
des documents. D
'une part, il est très difficile pour un tiers de modifier le
contenu d'un papier sans laisser des traces de son travail. D'autre part, grâce à
l'unicité de la signature, il est difficile pour l'auteur d'une signature de la
réfuter par la suite. Ces deux c
aractéristiques, qui permettent de garantir
l'authenticité d'un texte, sont à la base de l'utilisation du papier dans tous les
documents officiels et toutes les transactions commerciales.

10

Ce support se prête bien aussi à une structuration hiérarchique. Au

moyen
d’agrafes permanentes, d’attaches trombone, de punaises, de colle, de papier
collant, de perforation, d’une reliure, le papier peut être assemblé en dossier,
livre, encyclopédie ou bibliothèque. Un livre peut être feuilleté, un dossier
survolé en ut
ilisant la puissance d'accès qu'offre la possibilité d'accéder en
trois dimensions à un objet bi
-
dimensionnel. Les tablettes d'argiles qui ont
précédé ce médium ne se prêtaient pas si bien ni à la structuration ni à un
accès aussi rapide...

1.2.6.

Reproduction et

message lié au médium lui
-
même

Le papier est facilement reproductible. Hormis pour leur caractère
d'authentification (et la possibilité d'avoir des copies de couleur différente si
faciles à distinguer d'un seul coup d’œil dans une pile), les copies carbon
es
ont presque disparu. La photocopieuse, une invention de XEROX (une firme
dont il sera souvent question dans ce livre) a permis la grande diffusion
d'informations ponctuelles. Bien évidemment, l'imprimerie, 400 ans
auparavant, avait révolutionné la trans
mission de l'information en créant un
outil de reproduction permettant des diffusions massives à faible coût. A
noter que la photocopie permet en général de distinguer la copie de l'original.
Plus généralement, il est possible d'assurer différents 'niveaux
' de copie, avec
une identification claire de la hiérarchie de copie. Ainsi, une université va
imprimer (reproduire) en centaines d'exemplaires le formulaire de base
utilisé pour créer les diplômes qu'elle délivre. Une photocopie d'un diplôme
n'en reste pa
s moins très facile à distinguer de son original. En principe
aussi, la photocopie d'un billet de banque est facile à distinguer de
l'original…

Le papier est un support très riche. D'une part, il supporte une grande variété
de représentation, comme le text
e, les dessins ou les images de type
photographique. Il peut revêtir des aspects très différents et se prêter à la
projection à de larges audiences sur des panneaux ou via des techniques de
projections (diapositives, transparents utilisés par rétro
-
project
ion). Le
support est lui
-
même signifiant ; un rapport annuel de société, sur papier
glacé polychrome, ne véhicule pas la même image qu'un 'médium' annonçant
ses capacités à faire venir l'amour, l'argent et le bonheur sur une feuille
volante photocopiée dép
osée dans une boîte aux lettres. Et une lettre d'amour
touchée par son (sa) bien
-
aimé(e) a souvent plus de valeur que le même texte
envoyé par INTERNET.

Certains types de supports spécialisés sont d'autre part extraordinaires
puisqu'ils peuvent en une frac
tion de secondes, capter en parallèle une image
couleur. De façon générale d'ailleurs, le parallélisme de traitement que
permet une feuille de papier est largement exploité que ce soit dans
l'imprimerie, la photographie ou la xérographie.

1.2.7.

Quelques problème
s de la représentation électronique

Tout cela parait évident. Pourtant, chacune de ces propriétés est importante
et son absence ou la difficulté parfois de la simuler dans un environnement
informatique, pose souvent des difficultés presque insurmontables

dans le
domaine bureautique.

11

La densité d'information par exemple... En laissant de coté la question de la
densité du support de stockage, il est clair que l'informatique est
particulièrement faible pour représenter visuellement un document. Même
un écran

de 1024 sur 1024 est pauvre comparé à la richesse d'une page
correctement imprimée (et que dire de la comparaison entre un 'bureau
électronique' sur un tel écran par rapport à un ensemble de feuilles plus ou
moins rangées sur un vrai bureau du monde réel)
. A cause de ce problème,
de la fatigue visuelle liée à la consultation d'un écran, du volume d'un écran
et de l'absence de manipulation tridimensionnelle, la lecture d'un document
se fait encore aujourd'hui (et se fera encore pendant de nombreuses années)

essentiellement sur papier.

L'informatique est aussi particulièrement faible pour transporter de façon
électronique un volume d'information correspondant au papier. Bien sûr le
délai de transport peut être plus faible par les moyens électroniques et une
s
tructuration adéquate du contenu permet de réduire très fort la quantité
d'information à transporter. Mais le débit (throughput) moyen du transport
par papier est de plusieurs ordres de grandeur plus important que celui du
transport électronique avec les r
éseaux télématiques existants. Et les
utilisateurs réguliers d'INTERNET savent que la liaison télématique est
excellente pour avoir rapidement une quantité limitée d'information mais
exécrable lors qu'il s'agit de rapatrier quelques images à haute définiti
on...

Les problèmes d'authentification et de confidentialité sont bien compris dans
le monde électronique et des solutions existent. Mais ces solutions sont
beaucoup plus lourdes et complexes que la simple signature manuscrite. En
plus, elles exigent d'êtr
e patiemment expliquées afin que leurs utilisateurs se
convainquent de leur fiabilité. Elles ne sont pas non plus aussi souples que
les techniques papier et les avatars du chips 'Clipper' aux Etats
-
Unis il y a
quelques années, ou les règles complexes et so
uvent absurdes qui régissent la
diffusion des algorithmes de cryptographie montre que dans ce domaine, la
représentation électronique pose des problèmes spécifiques que ne pose pas
la représentation «papier».

Bien sûr, la reproduction d'une représentation

électronique est très facile.
Tellement facile même, qu'il est difficile de protéger un document contre la
copie illégale. Cette reproduction est anonyme et le document recopié est
absolument identique à l'original. Par contre, la plupart des recopiages
i
nformatiques sont "séries" et non "parallèles" conduisant à des temps de
reproduction prohibitifs pour des copies en très grande série. Ce n'est qu'avec
l'avènement du CD
-
ROM que l'industrie électronique a résolu ce problème.

Le CD
-
ROM a aussi contribué à
résoudre le problème de longévité des
enregistrements. Les média magnétiques n'ont en effet pas une longévité
importante et ils doivent être recopiés tous les 10 ans. A condition de trouver
un équipement capable de relire les anciens formats... Par contre,

parfois, ces
médiums magnétiques ont trop de mémoire... les destructions d'information
sont en effet très souvent 'logiques' et non 'physiques', ce qui veut dire qu'il
est possible en analysant un disque dur d'un PC de retrouver des traces de
documents co
mpromettant pourtant détruits...

12

Le problème de volatilité des mémoires électronique est aussi bien connu,
qu'il s'agisse du document électronique perdu à cause d'un crash disque, d'un
«bug» du traitement de texte, d'une panne de courant ou d'une fausse
ma
nœuvre (comme l'écrasement d'une information par une autre, suite à une
méprise).

Quant à la représentation simultanée d'objets différents tels que le texte ou
les photos sur un même support, ce n'est que récemment que la
représentation électronique a pri
s définitivement l'avantage sur le papier au
prix d'une complexité assez impressionnante.

1.2.8.

En conclusion

Bien entendu, le support électronique a des propriétés fabuleuses qui
expliquent sa popularité croissante, mais ce chapitre montre bien les
obst
acles qui sont sur la voie d’un bureau «sans papier». Certains de ces
obstacles, en particulier ceux relatifs à la taille et à la fidélité des moyens
d'imagerie (écrans, imprimantes) ou ceux liés aux capacités en terme de
bande passante des réseaux télémat
iques sont encore là pour longtemps...

1.3.
La lente évolution des représentations électroniques

1.3.1.

Les premières transmissions électroniques

La première transmission électronique (ou plus exactement électrique)
d'information a eu lieu au milieu du XIXème siècle,
avec l'invention du
télégraphe électrique. Avant cela, des systèmes de transmission optique
avaient été mis au point (télégraphe optique). Ceux
-
ci nécessitaient des
opérateurs humains à chaque relais, opérateurs lents et sujets à erreur. Le
télégraphe élec
trique et son code, le code Morse, optimisé pour permettre
une transmission rapide, permettait une transmission presque instantanée
(une fois les circuits établis) sur de grandes distances...

A la fin du XIXème siècle, apparut le téléphone, en fait la vers
ion analogique
de ce système digital qu'était le télégraphe. Et comme tout système
analogique (jusqu'à une époque récente), il permettait d'effectuer une
meilleure balance entre la fidélité de la transmission et l'utilisation de la
bande passante. Dès le d
ébut du XXème siècle, on songea à utiliser le
téléphone pour transmettre des documents, avec l'invention du Bélinographe,
l'ancêtre du FAX. Mais, la faible précision des capteurs de lumière, la
difficulté de synchroniser parfaitement émetteur et récepteur
et surtout
l'absence de standards internationaux rendirent cette invention une simple
curiosité pendant plusieurs dizaines d'années.

1.3.2.

La situation jusqu’au début de l’informatisation

Pendant des années, jusqu'à la fin de la seconde guerre mondiale, la
burea
utique comme telle n'existe pas et les techniques de bureau restent
figées pendant près de 50 ans.

13

Après la 2ème guerre mondiale, une étape importante est franchie, non pas
grâce à une évolution technique soudaine mais simplement comme résultat
de la mise
sur pied d'une organisation nouvelle

; cette étape est l'invention du
TELEX. Basé essentiellement sur le même principe que le télégraphe, le
TELEX permet l'envoi de documents contenant un jeu de caractères très
limité. Cette transmission est instantanée et

surtout elle a une valeur légale,
les machines TELEX étant construites pour être les seules à pouvoir émettre
et recevoir des messages et les authentifiant de façon indélébile. Cette
authentification est liée au terminal TELEX qui garde une trace des envo
is et
des réceptions. En enfermant le terminal TELEX dans une enceinte
contrôlée, on peut s'assurer que seules les personnes autorisées possèdent la
signature de société que celui
-
ci représente. On s'assure aussi que le courrier
entrant, nécessairement imp
ortant puisque pouvant engager une société pour
des montants importants (ou susceptible d'être utilisé lors de conflit
contractuel) suit un chemin correct au sein de l'entreprise. Le réseau TELEX,
qui est maintenant souvent remplacé par le FAX ou des résea
ux plus
spécialisés (transfert de fond) comptait environ 1.500.000 abonnés dans le
monde dans le milieu des années 80 dont 150.000 abonnés en FRANCE.

C'est bien sûr à cette époque aussi qu'est inventé cette 'machine à tout faire'
qu'est l'ordinateur. Mais
bien entendu, en 1944, il sert plus à calculer les
trajectoires que doivent utiliser les obus émis par un canon anti
-
aérien pour
atteindre une cible mobile rapide (comme un avion) que pour taper une
invitation à un cocktail mondain...

... et le MTBF (Mean

Time Between Failure) de ces premiers ordinateurs
n'est que de 10 minutes.

Pourtant, déjà à cette époque, un visionnaire, Vanover BUSH, décrit
l'utilisation de l'ordinateur comme outil pour gérer un bureau, à une époque
où les plus optimistes prévoient qu
e 5 ou 6 ordinateurs seront suffisants pour
l'ensemble de la planète.

Ensuite, pendant des années, rien ne se passe dans le domaine de la
bureautique... les ordinateurs grossissent pour obéir à une loi qui prétend que
le coût d'un ordinateur ne croit que
comme la racine carrée de la puissance,
et que donc il faut construire des machines de plus en plus grosses.

14

1.3.3.

L’apport des grands ordinateurs centraux

Ces machines, d'abord exclusivement orientées 'traitement par lot' sont
progressivement dotées d'un systè
me d'exploitation (Operating System)
permettant l'utilisation simultanée par plusieurs lots en parallèle. Puis elles
deviennent utilisables à partir de terminaux interactifs orientés «lignes» et
ensuite de terminaux dits intelligents «pleine page» (full sc
reen). Malgré
leurs caractères de système de «temps partagé» (time sharing), ces systèmes
ne sont pas très puissants et surtout, ils ne supportent pas trop les
interruptions. Le mode de fonctionnement est donc de préparer un jeu de
données (une ligne ou un

écran), de l'envoyer à l'ordinateur, puis de recevoir
la réponse. Même si cet environnement parait peu propice à l'introduction
d'une bureautique au sens actuel du terme, c'est sur de tels équipements que
naissent les premiers éditeurs
-
formateurs ; les te
xtes à produire sont frappés
'au kilomètre', par ligne ou par écran et des caractères de mise en page y sont
introduits. Ces caractères indiquent par exemple qu'il faut à un moment
sauter une ligne ou modifier une indentation. L'éditeur permet d’introduire

le
texte et son marquage défini par ces caractères de mise en page. Le
formateur interprète ensuite le marquage et produit un texte correctement
mis en page... s'il n'y a pas eu d'erreurs dans le marquage. A noter qu'à
l'époque, il n'y a guère de support
généralisé pour les graphiques ou les
dessins ni pour les polices de caractères (le traitement de dessins pour des
applications spécialisées tel le dessin industriel de plans est possible via
l'utilisation de terminaux spéciaux contenant une mémoire d'écra
n).

Parallèlement à ces développements en matière de production de documents,
les gros ordinateurs offrent souvent des services rudimentaires de messagerie
interpersonnelle. Chaque utilisateur qui possède une identification possède
une boîte aux lettres da
ns la machine. Il peut envoyer des messages simples à
d'autres utilisateurs présents sur la même machine (en général, les firmes
n'ont à cette époque qu'un seul ordinateur important pour toute l'entreprise).

1.3.4.

L’arrivée des minis et le PARC

Vers les années

1970, DIGITAL inverse la tendance à construire des
ordinateurs de plus en plus gros en lançant la ligne des mini
-
ordinateurs (tel
les PDPs). Ces ordinateurs, plus petits, supportent quelques utilisateurs et
sont orientés dès le début vers des applications

'temps réel' et multi
-
processus. Leur mode de fonctionnement est beaucoup plus orienté vers le
traitement 'caractère par caractère'. Des éditeurs plus interactifs deviennent
donc possibles.

Ces éditeurs permettent, à chaque introduction d’un nouveau
carac
tère dans un texte, de générer un action de mise en page spécifique.

Sur le plan des concepts, les années 1970 sont aussi une période très riche.
C'est à cette période en effet que XEROX, à la pointe de l'innovation
technologique, invente les concepts et l
es techniques clef de la Bureautique
dans son PARC (Palo Alto Research Center). Parmi ceux
-
ci on retrouve :

15



Le concept de fenêtrage, d'écrans 'bit
-
map' (c
-
à
-
d contenant des points et
non des caractères) et de souris. Ces éléments permettent d'imaginer une

interaction avec l'ordinateur via l'intervention de l'utilisateur sur un monde

'virtuel' représenté à l'écran et non via un langage de commande plus ou
moins ésotérique.



Le concept de réseaux locaux et plus généralement d'interconnexion à
haute vitesse de

plusieurs ordinateurs. Cette interconnexion est
indispensable si l'on souhaite passer d'un modèle basé sur l'existence d'un
ordinateur unique dans l'entreprise à un modèle basé sur l'existence de
multiples ordinateurs plus petits mais plus interactifs. Le
s réseaux locaux
de type 'ETHERNET' sont extrêmement rapides pour l'époque (4Mbits
puis 10Mbits) et leur mode de fonctionnement permet une très grande
décentralisation. Ils sont d'abord pensés pour permettre l'échange de
documents, mais la révolution la pl
us importante qu'ils vont introduire
sera d'introduire l'approche 'client
-
serveur' de construction des systèmes
informatiques.



Les imprimantes à laser. Jusqu’alors, les imprimantes (à chaîne, à
marguerite, à boule) sont toutes basées sur l’utilisation d’un
e matrice
physique pour imprimer les caractères. Cela signifie qu’un changement de
police de caractère au sein d’un document n’est pratiquement possible que
si la tête de frappe contient les différentes polices utilisées. Cela signifie
aussi qu’il est prat
iquement impossible d’imprimer des dessins (sur les
gros ordinateurs, on imprime des dessins grâce à des algorithmes de
surfrappe de caractères. On peut ainsi produire des ‘posters’ assez jolis,
mais bien entendu, cette technique donne des résultats très g
rossiers. Les
dessins industriels sont eux produits sur des tables traçantes, très précises
mais très lentes). Les imprimantes matricielles, fort utilisées au cours des
années 1980, vont permettre la production de dessins mais leur résolution
est trop faib
le pour reproduire des dessins de précision ou pour permettre
l'utilisation de polices de caractères différentes. L'imprimante à laser, avec
sa qualité équivalente à celle des meilleures machines à écrire électrique,
son excellente résolution et sa bonne v
itesse va résoudre le problème de
production de documents en tout cas noir et blanc. Seule, l'apparition des
techniques à jets d'encre vers la fin des années 1980 va remettre en cause
sa suprématie.



Les langages d'impression. Pour commander les imprimantes

à laser, il
faut un langage de commande beaucoup plus souple que ce qui est
nécessaire pour commander un autre type d'imprimante. Aussi, au lieu de
définir un langage de commande, l'idée naît de créer un véritable langage
de programmation orienté 'impress
ion'. Le langage le plus populaire
deviendra 'Postscript' inventé par ADOBE.

16



Les langages orientés objet (et en particulier le langage 'Smalltalk'). Il
peut paraître bizarre de mentionner un langage de programmation comme
une contribution majeure à l'éta
blissement des concepts bureautique.
Pourtant, 'Smalltalk' va populariser le concept d'orientation objet. Ce
concept va jouer ensuite un rôle de plus en plus grand dans l'organisation
des outils bureautiques et ce livre explique en détail le modèle de
repr
ésentation proposé par l'approche objet.



Les jeux de caractère 16 bits. Dans le courant des années 1970, on a
utilisé des jeux de caractères à 5 bits (code de type télégraphique), à 6
bits, à 7 bits (le code ASCII) et à 8 bits (le code ASCII étendu). Ces j
eux
de caractères ont chacun correspondu à des compromis différents entre la
taille mémoire nécessaire pour représenter un texte et l'exigence de
représenter des jeux de caractères de plus en plus riches. A cette époque
aussi, la relation entre l'unité de
stockage d'une machine (le 'mot'
informatique donnant l'unité de stockage nécessaire pour une instruction
machine élémentaire) et le nombre de bits nécessaires pour représenter un
caractère est parfois des plus étrange. Ainsi, il existe des machines dont l
e
"mot" fait 36 bits, exploitables soit comme un ensemble de 5 caractères
de 7 bits, soit comme des demi
-
mots de 18 bits… XEROX, dès le début,
estime que tous les caractères de toutes les langues doivent pouvoir être
représentés et utilise dès lors un cod
e 16 bits dans ses produits
bureautiques.



Les traitements de texte interactifs. Bien que le concept soit en fait le fruit
d'un ensemble de réflexions, les chercheurs du PARC sont certainement
parmi les premiers à insister sur l'importance du 'WYSIWYG' (Wha
t You
See Is What You Get).

Tous ces concepts aboutiront, début 1980, à l'introduction de la station 8010
'Star' conçue fin des années 1970, révolutionnaire, chère et à l'architecture
fort fermée. Cette station inspirera énormément la conception du 'Mac In
tosh'

de APPLE.

17

Fin 1970, WANG lance son premier traitement de texte. D'autres firmes
suivront et dans le début des années 1980, il y aura un marché bien
développé de traitements de texte 'stand alone', basés sur des machines
dédicacées stockant les textes

sur disquettes. Parmi les firmes proposant de
tels équipements, outre WANG, on trouve PHILIPS, OLIVETTI, NCR. Ces
machines sont souvent dédicacées à un seul utilisateur. Parfois, elles peuvent
être utilisées par plusieurs utilisateurs simultanément. A cet
te époque, on
assiste donc à l'apparition de 'pool d'encodage' utilisés afin d'optimiser
l'utilisation de ces machines encore fort chères et à l’apprentissage complexe.

C'est bien sûr à cause de la facilité de révision des textes que ces
équipements se rép
andent dans les entreprises. Cette bureautique de première
génération va se développer pendant toutes les années 1980 et faire la
fortune de WANG qui prend le leadership de ce marché et se diversifie dans
la bureautique au sens le plus large. Ainsi, WANG i
ntroduit sa propre
technologie réseau, basé sur une approche à large bande ('broadband')
permettant de transporter des textes mais aussi de la vidéo ou des liaisons
téléphoniques. Cette technologie paraît même un moment devoir remplacer
ETHERNET et toutes
les autres technologies en bande de base qui n'utilisent
qu'un faible portion du spectre du câble coaxial qu'elles utilisent. Mais à
l’usage, elle se révèle trop complexe, trop coûteuse (surtout en terme
d’investissement d’étude) et surtout elle reste prop
re à WANG et est donc
difficilement utilisable avec d’autres types d’équipement.

Toutes ces firmes de la première génération (y compris XEROX) ont
d’ailleurs des architectures de produits qui sont propres au fabriquant et qui
sont donc «fermées». Tant que
le marché reste un marché de volume moyen,
cette fermeture permet de générer des marges bénéficiaires importantes.
L'arrivée du monde PC, avec ses productions à très fortes quantités et à très
faibles marges, va bouleverser la structure de ce marché et la
plupart des
acteurs de la première génération bureautique vont devoir le quitter ou
s'enfermer dans des produits de niche.

1.3.5.

L’émergence des réseaux informatiques

Un autre domaine important qui se développe dans le domaine des années
1970 est celui des téléc
ommunications. Il a déjà été question de la création
d'ETHERNET dont la spécification définitive date de l'année 1980 avec la
publication de la norme DIX (Digital, Intel et Xerox).

Dès 1973, la défense américaine crée le réseau ARPANET, basé sur la
spécif
ication d'un protocole appelé TCP/IP (Transport Control Protocol
-
Internet Protocol). Ce réseau et ce protocole continueront à se développer et
au cours du temps, d'extension en modification de statut, ARPANET
deviendra INTERNET. Quand à TCP/IP, après des a
nnées de conflits avec
les protocoles propriétaires d'IBM (SNA: System Network Architecture), de
DEC (DECNet) et surtout après des années de discussion sur le choix entre
standards officiels (norme de l'ISO (International Standard Organisation) ou
CCITT (C
omité Consulatatif International du Télégraphe et du Téléphone))
et standards 'de facto' (c
-
à
-
d TCP/IP), il finira par s'imposer définitivement
comme le seul protocole d'interconnexion dans le début des années 1990.

18

Les années 1976
-
1980 sont particulièreme
nt riches dans le domaine des
télécommunications. La norme X25 est définie en 1976 et sera la base pour
les réseaux publics à commutation par paquets. Les normes X3, X28 et X29
la complètent et permettent l'utilisation du réseau à partir de terminaux en
mo
de ligne reliés au réseau téléphonique. Début des années 1980, c'est aussi
la définition des protocoles VIDEOTEX. Faute d'un accord entre les
différents pays européens, il y aura 3 normes VIDEOTEX en Europe et le
réseau VIDEOTEX ne démarrera vraiment qu'en

France (Minitel).

L'ISO définit en 1976 le modèle OSI (Open System Interconnexion) en 7
couches, qui restera la référence notamment terminologique en matière de
réseau. Pour des raisons essentiellement politiques (indépendance vis
-
à
-
vis
des constructeurs

informatiques pour les couches de protocoles non
contrôlées par les administrations des postes, toutes puissantes en Europe à
cette époque), l'ISO se lance aussi dans la définition des protocoles pour les
différentes couches du modèle OSI... en ignorant l
e monde TCP/IP. Cette
définition, qui anticipe sur les produits, deviendra un 'travail stratégique'
pour toute une série de constructeurs d'ordinateurs européens coincés entre le
monde IBM d'une part et le monde des mini et des micro
-
ordinateurs d'autre
pa
rt, et qui espèrent ainsi que les administrations publiques généreront un
marché de 'produits normés' pour lequel ils auront un avantage compétitif.

L'incohérence du travail de normalisation (il y aura 5 classes de protocoles
pour la couche de transport (
couche 4)) et l'antagonisme 'constructeurs
-
PTT'
se matérialisant autour de l'aspect 'orienté connexion' ou 'hors connexion'
pour la couche réseau (ce problème de la structure de la couche 3 ne sera
jamais résolu) ainsi que le refus effectif des administrat
ions publiques de
payer plus cher leur acquisition pour obtenir des produits normés (mais qui
n'interopèrent pas !) conduiront à l'échec de cette approche sauf dans certains
marchés de niche.

1.3.6.

L’arrivée des PCs

Vers le milieu des années 1980, les premiers P
C font leur apparition avec
essentiellement le PC d'IBM (dont le système d'exploitation a été développé
par une petite firme appelée MICROSOFT) et le Mac Intosh d'APPLE (qui
succède à l'Apple II après l'échec du Lisa). Ce sont des PCs utilisant des
disquet
tes capables d'enregistrer quelques centaines de kilobytes.
Immédiatement, ces machines, qui ont des écrans 'bit
-
map' capables de
représenter des dessins, des graphiques ou des textes avec polices de
caractères, deviennent les concurrents des traitements d
e texte spécialisés.
Certains programmes, tels Wordstar et Wordperfect sur PC deviennent des
standards. Le Mac Intosh, avec son ergonomie révolutionnaire et son
intégration entre toutes les applications devient la référence en bureautique.
C'est sur cette
plateforme que MICROSOFT développe la version 'à
fenêtrage' de son traitement de texte 'Word'. Le Mac Intosh aurait pu devenir
la plateforme universelle bureautique mais la politique de fermeture
d'APPLE qui garde le monopole de la fabrication des machines
, du système
d'exploitation (et qui essaie d'imposer son propre système de réseau local) va
permettre au marché PC de se développer, un peu anarchiquement...

19

Début 1980, a lieu aussi une invention qui va révolutionner aussi l'usage du
PC et qui va élarg
ir la définition du concept de bureautique: le tableur. Celui
-
ci permet à des non
-
informaticiens de programmer des calculs et d'effectuer
des simulations. Le tableur va soutenir l'expansion du monde PC grâce à la
dominance de LOTUS (qui remplace 'Visicalc'

de l'inventeur du tableur
VISICORP). Il va aussi briser l'égalité "informatique = programmeurs
spécialisés".

Tous ces développements conduisent à l'effondrement du marché
bureautique spécialisé en quelques années et conduisent à la fortune de
MICROSOFT, A
PPLE et NOVELL (qui crée un système de réseau
spécialisé orienté PC).

1.3.7.

Les grandes études bureautiques

Du point de vue conceptuel, la fin des années 1980 est l'époque des grandes
études bureautiques basées sur des démarches classiques utilisant des
diagramm
es de flux et des analyses des besoins et inspirées des approches
utilisées pour construire les grands systèmes d'information de l'entreprise.
Alors que les produits s'engagent résolument dans une approche "bottom
-
up"
assez anarchique, ces réflexions sont
résolument "top
-
down" essayant de
partir du "business", d'en déduire les besoins et ensuite les solutions. Le
résultat de ces études est souvent très globalisant et vise à informatiser tout
le circuit papier de l'entreprise. Le concept de "paper
-
less" offi
ce est très
populaire et soutient ces études.

Ces approches vont toutes se solder par des échecs dont les causes les plus
importantes sont les suivantes :



Les moyens nécessaires pour implémenter les solutions préconisées ne
sont pas encore disponibles. Ai
nsi, en matière de réseau, les réseaux
interentreprises sont peu performants et les réseaux locaux intra
-
entreprises sont morcelés ou inexistants. La capacité de stockage sur
disque est trop chère pour y laisser des documents en permanence et la
résolution

des écrans est trop faible que pour pouvoir manipuler des
dessins.



Ces approches imitent les démarches suivies pour créer les systèmes
d'information classiques utilisés par exemple pour gérer la comptabilité
ou la gestion de stock. Ces systèmes d’informat
ion classiques sont
développés par l'entreprise. Ils sont créés par décomposition hiérarchique,
ce qui permet d'identifier des modules élémentaires qui peuvent alors être
construits spécifiquement de façon à pouvoir travailler entre eux. Par
opposition, da
ns le monde bureautique, les modules sont à cette époque
fournis par des firmes différentes et ils n'ont pas été construits pour
fonctionner ensemble. Ce problème d'intégration, qui va être le grand
thème bureautique dans le début des années 1990 n'est pas

encore compris
fin des années 1980. Et les études bureautiques concluent à la faisabilité
de certaines approches bureautiques sur base de l'existence des modules
élémentaires (traitement de texte, tableurs, courrier électronique) sans
s'apercevoir qu'il e
st pratiquement impossible de faire travailler ces
différents produits ensemble.

20



Par sa nature décentralisée, la bureautique amène les entreprises dans des
domaines qu'elles maîtrisent moins : utilisation de réseaux, installation
massive d'équipements, dis
tribution de logiciels à un grand nombre de
stations, gestion de bases de données non structurées. La plupart des
études de cette époque sous
-
estiment les difficultés qu'entraîne la maîtrise
de ces nouveaux domaines.



Plus généralement, la définition de l'a
rchitecture à mettre en place n'est
pas claire. Certains concepts clef, comme l'orientation objet et surtout les
architectures «client
-
serveur» ne sont pas encore fort connus. En leur
absence, les architectures bureautiques proposées se basent surtout sur
des
assemblages hétéroclites de solutions peu fiables.

1.3.8.

Les incertitudes du début des années 1990 et Unix

L'échec de ces approches va conduire à une période difficile. Le parc des PC
explose au sein des entreprises, ceux
-
ci étant achetés de façon anarchique

parce que leur prix unitaire est situé en dessous des seuils de contrôle. Ces
PCs sont utilisés pour rendre les services bureautiques de base (traitement de
texte, tableur) et génèrent des gains de productivité immédiats. Mais les
problèmes liés à cette c
roissance anarchique apparaissent aussi :
obsolescence rapide des équipements, difficulté d'assurer un minimum de
gestion (sauvegarde des données, résolution de problèmes techniques) et
surtout manque d'intégration conduisant à des multiples resaisies de l
a même
information (traitements de texte différents, absence de communication entre
logiciels bureautiques différents).

Techniquement, 1990 est une période de grande incertitude technique. Le
monde Mac Intosh, toujours aussi convivial, est toujours aussi f
ermé, ce qui
rend cette solution plus chère et surtout plus difficile à intégrer avec les
systèmes non Mac Intosh, comme les systèmes d'information existants de
l'entreprise. Le monde PC s’essouffle ; les interfaces PC sont peu
conviviales, les limitations

techniques du DOS deviennent insupportables,
l'annonce par MICROSOFT et IBM de l'arrivée imminente d'OS/2 paralyse
le développement de nouvelles applications et surtout les gestionnaires de la
bureautique au sein de l'entreprise ne supportent plus le cara
ctère hétéroclite
de l'environnement qui rend impossible leur travail d’aide de l’utilisateur.

C'est à cette époque que UNIX parait soudain être la solution à tous ces
problèmes. Basés sur un système d'exploitation éprouvé et sans grandes
limitations (en t
out cas vis
-
à
-
vis de DOS), il est multitâche (ce qui facilite la
résolution des problèmes d'intégration) et multi
-
utilisateur et il peut donc
supporter les approches 'mini' de la première génération bureautique. C'est
un système d'exploitation 'source' c'e
st à dire facilement portable sur de
nouvelles machines. Et son principal problème dans le passé, l'absence de
système de fenêtrage est en train de se résoudre avec l'arrivée de X
-
WINDOW. Ce système de fenêtrage révolutionnaire est dès le départ orienté
'r
éseau' et il permet de construire des 'terminaux X', qui peuvent être gérés
comme des terminaux classiques.

21

L'échec de UNIX comme «desktop» (c
-
à
-
d équipement de support de
l’utilisateur final) sera dû à l'absence d'accord sur une standardisation des
interf
aces de haut niveau pour accéder au système de fenêtrage. La guerre
entre les 2 standards proposés (MOTIF et OPEN LOOK) et l'existence de 2
grands dialectes UNIX bloqueront le développement des applications. La
technologie 'X' s’avérera être gourmande en b
ande passante réseau.
L'absence de systèmes d'administration communs pour gérer des machines
provenant de vendeurs différents rendra illusoire l'indépendance vis
-
à
-
vis du
fournisseur. Et l'arrivée de MS
-
WINDOWS 3.x brisera définitivement cette
approche.

1.3.9.

L
e triomphe du PC et la domination de Microsoft

MS
-
WINDOWS 3.x va s'imposer rapidement comme la plateforme
universelle bureautique (et plus généralement comme le 'desktop' universel),
principalement à cause de la stratégie de MICROSOFT qui va synchroniser
l
e démarrage de cette version du système d'exploitation avec le lancement de
2 applications bureautiques qui en exploitent les propriétés : Word et Excel
(rejoint plus tard par d'autres produits tels Powerpoint et MS
-
Access). Les
concurrents de MICROSOFT, e
n général orienté OS/2, vont être pris au
dépourvu et leurs applications vont prendre plusieurs mois de retard avant
d'être mises sur le marché (ces premières versions sont d'ailleurs
généralement d'assez mauvaise qualité).

MS
-
WINDOWS étant multitâche (non

préemptif), il va permettre de
résoudre les problèmes d'intégration. MICROSOFT introduit aussi des
mécanismes standards qui facilitent l'interopérabilité des applications tels
DDE, OLE1, OLE2 et l'usage généralisé des DLL (ces termes sont expliqués
plus l
oin dans ce livre). Comme il applique ces nouveaux mécanismes au
sein de ses propres produits et que ceux
-
ci sont populaires, il crée ainsi un
'cercle vertueux' qui oblige pratiquement tout le marché à s'aligner sur ses
spécifications malgré la tentative d
e créer des architectures concurrentes (tel
OpenDoc).

22

MICROSOFT devient progressivement l'entreprise dominante du marché
bureautique, suivi essentiellement par LOTUS et WORDPERFECT. Pour
faciliter la résolution des problèmes d'intégration, MICROSOFT lance
le
concept de 'suites', ensemble d'applications indépendantes mais conçues pour
fonctionner ensemble et offrant une interface utilisateur harmonisée. Le
marché s'oriente alors résolument vers cette approche et les 3 acteurs
dominant du marché définissent c
hacun leur suite ('Office' pour
MICROSOFT, 'Smartsuite' pour LOTUS et 'PerfectOffice' pour
WORDPERFECT). Le problème pour ces 2 derniers intervenants est que
leur suite est basée sur des produits développés par des compagnies
indépendantes ultérieurement r
achetées et que l'intégration et l'harmonisation
des interfaces se révèlent plus difficiles pour eux dans un monde dont ils ne
maîtrisent pas les règles. L'arrivée de Windows 95 et l'apparition simultanée
de Office pour Windows 95, le rachat de LOTUS par I
BM, l'achat puis la
revente de WORDPERFECT par NOVELL laisse présager une situation de
quasi
-
monopole de MICROSOFT sur le 'desktop' pour les prochaines années
avec sans doute une certaine concurrence de LOTUS. Le poids d'IBM et sa
supériorité dans le domai
ne du 'Groupware' (avec son produit 'NOTE') lui
permet en effet de préserver une part de marché.

En ce qui concerne les télécommunications, le début des années 1995 a vu
l'émergence universelle de TCP/IP comme protocole réseau grâce à
l'explosion du phénom
ène INTERNET. INTERNET, dont les origines
lointaines datent de 1973 a vu pendant des années son nombre d'utilisateurs
doubler tous les ans... et comme dans toute croissance exponentielle, cela
signifie que brutalement INTERNET est passé d'un état 'connu se
ulement par
les initiés' à un état 'indispensable pour chacun'. Deux événements ont
contribué à soutenir l'expansion ces dernières années ; d'abord la décision,
début des années 1990 de permettre à des organisations commerciales
d'accéder au réseau (aupara
vant, il s'agissait surtout d'un réseau orienté
'recherche'), et ensuite l'apparition du WWW (World Wide Web) qui a
permis un accès convivial aux documents présents sur le réseau. Chaque
année, le monde INTERNET s'enrichit aussi de concept (Applet, JAVA)
m
ais dans ce domaine aussi, après un début assez peu réussi, MICROSOFT
semble s'imposer, au moins au niveau des outils 'Desktop'.

Enfin, un domaine prépare sa croissance dès que les conditions adéquates
seront réunies : celui des serveurs bureautiques. Il s
'agit essentiellement des
systèmes permettant de stocker des documents et de faciliter leur recherche.
Pendant longtemps, seul Unix semblait capable de supporter ces serveurs. Ce
qui obligeait à porter les logiciels sur chaque plateforme Unix différente.
L
'émergence de 'NT' (de MICROSOFT encore...) a résolu ce problème.
L'apparition aussi de systèmes à grande capacité de stockage à faible coût
devrait aussi contribuer à développer ces systèmes. Ces serveurs peuvent
supporter des systèmes de gestion électron
ique de documents (GED). Ils
peuvent supporter des librairies de documents HTML (le langage du
WWW). Ils peuvent aussi servir de relais entre un monde orienté 'document'
familier à la plupart des personnes et le monde orienté 'base de donnée' des
informati
ciens et des gestionnaires spécialisés.

23

Sur le plan des concepts, les techniques d'intégration entre différents
logiciels sur le 'desktop' sont maintenant bien maîtrisées. Ces techniques ont
été étendues pour pouvoir être utilisées à travers un réseau. L'é
mergence de
nouveaux concepts tel le 'workflow' ou le 'groupware' (définis souvent de
façon assez floue) montre la nécessité de maîtriser maintenant les relations
complexes entre les différents utilisateurs de la bureautique ainsi que
l'interaction entre b
ureautique et systèmes d'information. Même si les
concepts dans ce domaine sont encore flous et les produits encore pauvres, il
semble bien que le concept clé dans toutes ces approches soit le concept de
document.

24

2.1.
Qu’est ce q
u’un document

?

Comme cela a été brièvement mentionné dans l'introduction, si on essaie de définir
un document, on devrait obtenir une multitude de réponses différentes. Partant du
niveau de représentation le plus élémentaire (on dira le niveau de richesse

de
représentation le plus faible) vers le niveau de représentation le plus sophistiqué, on
pourrait avoir les descriptions suivantes dans le cas d'un document composé
simplement de texte :



Un document peut être vu comme un ensemble de pages, chaque page é
tant un
ensemble de point soit noir soit blanc. C'est la représentation 'bitmap' du
document, telle qu'elle est finalement générée par l'imprimante 'laser' ou 'deskjet'
qui doit imprimer le papier. C'est aussi la représentation qui sera fournie par un
scan
ner. Cette représentation supporte du texte mais aussi des photos, des dessins
ou des tableaux. Elle est supportée par les logiciels de dessins orientés 'bitmap'
(tel que 'Paintbrush') ou par des logiciels de retouche photo.



Un document textuel peut aussi
être vu un ensemble de pages, chaque page étant
un ensemble de courbes. Chaque courbe obéit à une équation qui la définit et est
associée à une position sur la page, à un facteur d'échelle (taille) et à une
orientation. Cette représentation est capable de
représenter les textes mais aussi
les dessins ou les tableaux. Elle est utilisée par les logiciels de dessin vectoriel et
par des formats de représentation tel que 'Postscript' décrit plus loin dans ce livre.



Un document textuel peut être aussi vu comme un

ensemble de pages, chaque
page étant un ensemble de caractères individuels. Chaque caractère est tiré d'un
alphabet et associé à une position sur la page, une police de caractère, un facteur
d'échelle et une orientation. Cette représentation 'caractère i
ndividuel' ne permet
bien sûr que de représenter du texte ou des tableaux (si l'alphabet contient
quelques caractères spéciaux).



Un document textuel peut aussi être vu comme un ensemble de pages, chaque
page étant un ensemble de segments de texte. Chaque s
egment contient un certain
nombre de caractères, chaque caractère appartenant à une même police de
caractère, ayant le même facteur d'échelle et la même orientation que les autres
caractères du segment. Un segment est associé à une position dans la page,
une
orientation et une politique en matière d'espacement des caractères qu'il contient
(à moins que cette politique ne soit associée aux polices de caractère). Cette
représentation, similaire à celle du mode 'bloc' décrit plus loin est celle du 'texte
fixe

simple' dans certains générateurs de rapport ou dans certains outils de dessin.



Assez proche de la représentation précédente, la représentation en mode ligne où
la page est divisée en lignes équidistantes, chaque ligne contenant une suite de
caractères (
ayant leur propre police et leur propre taille) et définissant certains
comportements globaux tel que le fait d'être ajusté à gauche, à droite, centré ou
justifié. Le mode ligne a été particulièrement populaire avec des éditeurs de
programmes où tous les c
aractères avaient la même police, et éventuellement la
même taille.

Chapitre 2:

UN OBJET COMPLEXE, LE DOCUMENT

25



Un mode de représentation original, variante du mode 'segmenté' serait de prévoir
que chaque segment contient exclusivement un mot tiré d'un ensemble de mots.
Chaque mot peut être identif
ié simplement par un nombre identifiant sa place
dans l'index des mots. Chaque segment contiendra aussi alors dans ce cas
l'information nécessaire pour signaler si le mot est écrit en majuscule, minuscule
(avec éventuellement la première lettre en majuscul
e). Cette représentation a l'air
peu réaliste mais elle est cependant utilisée par certains systèmes de recherche
documentaire.



Un document peut aussi être vu comme un ensemble de blocs, chaque bloc
contenant du texte formé d'une suite de caractères. Le bl
oc est un peu similaire au
segment mais il doit aussi contenir les règles pour effectuer le passage à la ligne
en respectant la césure des mots. Au sein d'un bloc, on pourra aussi avoir des
'suites de caractères', chaque suite représentant un ensemble de c
aractères qui ont
la même police et la même taille. Les blocs peuvent être placés arbitrairement
dans une page. Cette représentation est celle du texte dans beaucoup de logiciels
de dessin.



La notion de bloc est à la base d'un bon nombre de variations que
l’on retrouve
dans beaucoup de traitements de texte disponibles sur le marché. Ainsi, on peut
décider que les blocs doivent être alignés de façon séquentielle sur les pages et
définir les règles de coupures d'un bloc par un saut de page. Chaque bloc devien
t
alors un container pour recevoir un titre, un paragraphe ou un item de liste.
Chaque bloc peut avoir ses propres règles de mise en page définissant le défaut
pour les polices de caractères et les tailles des caractères à l'intérieur du bloc. Le
bloc défi
ni aussi si le texte est aligné à gauche, à droite, centré ou justifié et
quelles sont les indentations par rapport aux frontières du bloc (la première ligne
pouvant avoir une indentation particulière). Il est aussi possible de définir un type
associé à ch
aque bloc et ainsi de définir les séquences 'naturelles' de blocs. Ces
blocs sont souvent appelés "styles".



En prolongeant l'idée des styles jusqu'à son point extrême, on peut définir les
types de blocs possibles comme par exemple les chapitres (et leur ti
tre), les
paragraphes et les listes, les phases et les mots et définir une grammaire rigide
liant l'enchaînement des blocs. Ces blocs deviennent alors une hiérarchie où un
chapitre est par exemple formé d'un titre (lui
-
même formé de mots), suivi d'une
suit
e de paragraphe, chaque paragraphe comprenant une suite de phrases et/ou de
listes. Certains éléments peuvent être récursifs comme les chapitres (divisés en
sous
-
chapitres) ou les listes (divisées si nécessaire en sous
-
listes). La mise en
page peut être dé
finie par des variables (par exemple 'retrait = 1 cm') ou par des
instructions (par exemple 'reculer le pointeur de 1cm') associée à chacun des
types de bloc et le texte ne se définit plus que par une description ne faisant plus
référence du tout à la mise

en page.

26



Une autre prolongation de cette même idée consiste à rattacher chaque document
à une classe de document décrivant les types de blocs existants et leur
enchaînement possible. Les classes de document forment alors une hiérarchie où
les classes trè
s générales (c
-
à
-
d peu contraignante sur la structure du document)
sont proches de la racine de la hiérarchie et les classes les plus particulières
représentent des documents très structurés (type formulaires). Par exemple la
classe la plus générale (la ra
cine de la hiérarchie) définira juste un document
comme une suite de bloc, une de ses filles sera une lettre type (qui contiendra
comme bloc l'adresse, la date, la formule de politesse et la signature) et une fille
de la lettre type sera par exemple une le
ttre d'excuse pour le fait de ne pouvoir
assister à une présentation (où il y aura un bloc identifiant le nom de la
présentation et la date où elle doit avoir lieu).



Cette structuration peut être telle que certains documents peuvent alors voir le
contenu
de certains blocs provenir de relations stockées dans une base
relationnelle. Ainsi, la date de la présentation peut n'être que l'expression d'une
relation liant la présentation à sa date et stockée dans une base relationnelle. Si la
structuration est très

forte, le document peut n'être que l'association d'un
identificateur de type de document et du contenu d'un jeu de table relationnelle
(référencée par le type du document). Communément, ce type de document
s'appelle 'rapport' dans le monde relationnel.



Il

sera peut
-
être aussi possible un jour d'exprimer chaque phrase d'un texte dans
un langage formalisé représentant la sémantique de la phrase (sous forme de
relations et d'actions). On aurait ainsi une représentation abstraite indépendante
de la langue qu'i
l 'suffira' d'imprimer en convertissant la représentation abstraite
dans un ensemble de phrases dans une langue donnée, puis de là dans une
représentation sur papier. Un rêve qui n'est sans doute pas pour demain.

A la lumière des exemples, on comprend mieu
x pourquoi le traitement des
documents est quelque chose de complexe. Certaines représentations sont mieux
adaptées à certains types de traitement. Ainsi, un analyseur de grammaire doit, si
possible, avoir accès à la notion de phrase ou de mot. Il en est d
e même d'un
programme de traduction automatique. Un traitement de texte doit avoir accès à la
notion de césure des mots, alors qu'un outil de coloriage pourrait se satisfaire d'une
représentation 'bit
-
map'.

Encore, les exemples donnés se rapportent
-
ils tou
s à un 'type' de document très
simple, à savoir un document contenant seulement du texte. Il y a aussi des
documents qui contiennent de la voix, des photos, qui donnent accès à des tableaux
dynamiques (tableurs).

Pour terminer, et sans faire trop d'analyse

à ce stade, on peut aussi remarquer qu'il
semble y avoir 'un ordre' dans la définition des documents. Un texte formé de 'blocs',
peut être converti en segments, puis en lignes et finalement en pixels. Les
transformations inverses semblent plus difficiles.


27

2.2.
Bases et définition d’un document

On voit donc qu'il n'y a pas une définition d'un document mais bien toute un
ensemble de définition. Toutes ces définitions suivent cependant les mêmes
principes.

Tout d'abord, une définition d'un document se fait en fon
ction d'une base (le terme
'base' a été choisi volontairement par analogie avec l'utilisation de ce même terme en
mathématique). Cette 'base' définit les éléments qui vont servir à exprimer les
documents. Le document est en effet représenté en créant un ce
rtain nombre de ces
éléments de base et en donnant les valeurs correctes aux paramètres qu'ils
supportent.

Pour chacune des descriptions au chapitre précédent, on donc peut décrire la base et
les paramètres dont les valeurs définissent le document:



Dans l
a description 'bitmap', la base comprend la page et le point. Un document
est représenté par un certain nombre de pages, chaque page comprenant un
certain nombre de points (noir), chaque point ayant (au minimum) une position
par rapport à la page soit 2 co
ordonnées. Les paramètres de la page sont donc le
numéro de page et les paramètres de chaque point sont sa coordonnée



Dans la description 'courbe', la base comprend aussi la page ainsi qu'un certain
nombre de courbes, parmi lesquelles en général le segment

de droite, l'ellipse
(dont un cas particulier est le cercle), le polygone (qui pourrait être construit à
partir de droites mais qui, en temps qu'élément fermé, contient un 'intérieur' et un
'extérieur' comme l'ellipse). Il y a aussi souvent une courbe tel
le une courbe de
'Bézier' capables de s'ajuster à une série de points. Chacune de ces courbes a des
paramètres qui lui sont propres (longueur d'un segment de droite, foyer d'une
ellipse, nombre, orientation et longueur des segments d'un polygone, points de

passage d'une courbe de Bézier) ainsi que des paramètres généraux tels que la
position, l'orientation et l'échelle. Le document s'exprime en créant un certain
nombre de ces éléments et en fournissant les valeurs des paramètres.



La description 'caractère'
utilise comme base la notion de caractère. A chaque
caractère est associé un nombre qui représente la 'valeur' du caractère ainsi qu'une
référence à une autre notion de base à savoir la notion de police de caractère.
Celle
-
ci définit la forme du caractère
selon sa valeur et ne fait, en général, pas
partie du document. Chaque caractère possède aussi une position, une orientation,
un facteur d'échelle. Un document est décrit en créant une série de caractères et
en donnant les valeurs des paramètres (police, p
osition...). Le 'caractère' est utilisé
comme base pour de nombreuses autres descriptions.



Les descriptions segmentées ou par blocs, utilisent évidemment ces éléments
comme éléments de base. Un document est représenté en définissant les blocs
adéquats, en
donnant les paramètres nécessaires tels que la position ou les règles
en matière de coupures de pages. Dans ces blocs sont définis par exemple les
segments qui contiennent eux
-
mêmes les caractères.

28



La représentation par mot n'utilise pas le caractère comme

élément de base mais
bien le mot. Chaque mot est défini dans l'index (l’ensemble des mots) en fonction
de caractères, mais ceci n'est pas une caractéristique du document (l'index n'est
pas défini dans le document). Le mot sera donc identifié par un nombre

qui
identifie sa place dans l’index (qui sera par exemple alphabétique).



De la même façon, dans une représentation qui fait intervenir une base
relationnelle, le document est souvent constitué d'un 'masque' (lui
-
même défini de

diverses façons) et des 'cha
mps'. Chaque champ est défini par une extraction
d'une base relationnelle c'est à dire par le contenu d'une colonne pour une ligne
d'une table relationnelle. Cette extraction est définie par une requête dans la base.
Cette requête doit retourner une seule
valeur (texte ou nombre le plus souvent).
D’autres approches sont possibles. Ainsi on peut définir un document comme une
extraction d'une base relationnelle donnant la valeur de plusieurs champs et
plusieurs lignes. Cette extraction est définie par une req
uête ‘SQL’ et des
instructions de mise en page précisant comment présenter les lignes et les
colonnes.



Dans une description sémantique générale, tout le problème est bien sûr de
définir une série d'éléments de base capables de représenter de façon général
e
n'importe quelle phrase ayant une signification, indépendamment du langage.

Ces exemples permettent de mieux comprendre la relation entre les différentes
descriptions. Cette relation peut être mieux appréhendée en examinant le processus
de conversion d'
un type de description à un autre. Ce processus de conversion est
particulièrement important si on se rappelle que le seul type de représentation qui est
imprimable sur le papier avec les imprimantes actuelles (ou qui peut être affichée
sur un écran) est l
a représentation 'pixel'.

Il est à signaler que la définition d'un élément de base ne fait pas partie du
document. Un document ne comprend pas la définition d'un 'point' s'il est 'pixel' ou
d'une courbe de Béziers s'il est orienté 'courbe'. Ces définitions

sont externes ; elles
peuvent être physiques (visuelles) dans le cas d'un point ou se faire en terme d'une
autre représentation en général moins complexe. On a ainsi un emboîtement de
définition d'éléments de base dont la racine est le point pour les docu
ments visuels
statiques, le point et le temps pour le document visuel dynamique et l'intensité
sonore et le temps pour le document sonore.

2.3.
Conversion de représentation, richesse et appauvrissement

On peut classer les différents types de conversion selon l
a correspondance qu'il y a
entre les éléments de base du système à convertir (la source) et les éléments de base
du système résultat de la conversion (la cible). Selon le cas, on pourra avoir :



Les processus de conversion monoélement. Dans ce type de conve
rsion, à chaque
élément de la base de la source, on peut définir une conversion dont la
complexité dépendant plus ou moins de l’environnement.



Les processus de conversion multiélément. Dans ce type de conversion, la
conversion d’un élément de la source n’
a pas de signification. La conversion ne
peut se faire que si on considère plusieurs éléments de la source pour aboutir à la
génération d'un ou plusieurs éléments de la cible.

29

Un processus de conversion monoélément sera par exemple la conversion d’un
cara
ctère en pixel. Un exemple de conversion multiélément sera par exemple la
conversion inverse veillant à partir d’un ensemble de pixels à reconstituer un
caractère. De façon générale, l'inverse d'un processus de conversion monoélément
est un processus de co
nversion multiélément.

Un processus de conversion multiélément est en général beaucoup plus complexe à
mettre en œuvre de façon automatique parce qu'il n'est pas facile de définir quels
sont les éléments à prendre en compte pour faire la conversion. De pl
us, dans la
plupart des cas, toutes les combinaisons possibles d’éléments que l’on peut
rencontrer ne sont pas convertibles. Enfin, dans certain cas, certaines combinaisons
d’éléments sont ambiguës (ont plusieurs conversions possibles), surtout s’il existe

une incertitude sur l’existence ou non de certains éléments et sur la valeur de leurs