Le logiciel d’aide vocal - PROJET ORALTITUDE - Annexe 13

parakeetaromaticSoftware and s/w Development

Nov 17, 2012 (4 years and 6 months ago)

339 views

PROJET ORALTITUDE

Annexe 13

:

Le logiciel d’aide vocal


Couverture fonctionnelle du didacticiel

Le logiciel sous sa forme finale et commercialisée doit comprendre les composants
et fonctionnalités suivants

:

-

Une base d’extraits vocaux réels pré
-
enregistr
és (par ex. documents
électroniques sonores), suffisamment conséquente pour couvrir les
exemples et contre
-
exemples nécessaires à la pro
gression de l’usager ―
contre
-
partie informatique de la base d’exemples et contre
-
exemples
acoustiques

habituellement dispensés directement par le formateur;

-

Un procédé d’animation graphique illustrant, sur un personnage de
synthèse, les positions et mouve
ments de l’appareil phonatoire

― contre
-
partie informatique de la base d’exemples et contre
-
exemples visuels
habituellement dispensés directement par le formateur

;

-

Un procédé d’analyse acoustique fine de la production vocale de l’usager,
en vue du choix d
e la séquence d’exemples et contre
-
exemples appropriée,
et de la validation individuelle et globale des étapes parcourues par
l’usager ― simulation du formateur dans son rôle de suivi pédagogique et
de validation de la progression

de l’usager.

Ces composa
nts et fonctionnalités doivent être assemblés en un logiciel devant
remplir les critères d’ergonomie et de pédagogie nécessaires à la bonne
progression de l’usager. Il est prévu de décliner ce logiciel selon deux modèles
pédagogiques

:

-

le mode autonome ―
où la progression de l’usager ne s’opère que par son
interaction avec le seul support informatique multimédia,

-

le mode semi
-
assisté ― impliquant l’intervention asynchrone et délocalisée
de formateurs via l’Internet en vue d’affiner l’orientation pédagogiqu
e de
l’usager au cours et/ou au terme de sa progression.

2. Solution technique envisagée

2.1 Pré
-
enregistrement de documents sonores électroniques

Il est prévu, et actuellement en cours de réalisation, de constituer une base de
documents sonores électroniq
ues. Cela implique l’usage d’un matériel
professionnel d’acquisition acoustique et numérisation.

Cela implique aussi le transfert et stockage des données sonores sous leur forme
finale, prête à la consommation par le logiciel. A cet égard, les supports de

données et fonctionnalités offerts par le produit EMU spécialisé dans la gestion et
l’analyse de base de données de parole (
http://www.shlrc.mq.edu.au/emu/
) a
retenu notre attention. Une étude d’opportunité

concernant son adoption au sein
du projet et logiciel Oraltitude est actuellement en cours, dans le contexte du
développement du prototype d’Oraltitude.

2.2 Acquisition de la production vocale de l’usager

Les spécifications du microphone et de la carte so
n installés sur l’ordinateur
personnel de l’usager auront une influence significative sur le comportement du
logiciel, même s’il est prévu de concevoir ce dernier en vue de l’accommodation de
la plus large diversité des dispositifs d’acquisition sonore emp
loyés. Néanmoins, à
l’attention des usagers désireux d’une qualité opératoire optimale, une liste de
matériels appropriés sera recommandée. Les extraits vocaux de l’usagers seront
stockés sur le même support que les extraits sonores de la base d’exemples.

2.3 Animations graphiques

Il est prévu de constituer une base électronique vidéo d’exemples de positions et
mouvements de l’appareil phonatoire d’un formateur. Ces documents seront
ensuite numérisés en vue de l’animation d’un personnage de synthèse
reprodu
isant à l’écran lesdits positions et mouvements. Les techniques et outils
appropriés sont actuellement à l’étude.

2.4 Analyse acoustique

L’analyse acoustique des extraits sonores de l’usagers s’opèrera au moyen de la
définition et de l’implémentation d’att
ributs acoustiques extraits du signal de
parole ou de sa représentation temps
-
fréquence, en relation avec les principes et
exercices de la méthode Oraltitude. L’opportunité de l’utilisation du produit EMU
susnommé est actuellement à l’étude dans le context
e du développement du
prototype d’Oraltitude, de même que l’utilisation de techniques avancées de
traitement de la parole de type analyse par noyau temps
-
fréquence (ou
ondelettes), modèles de Markov cachés et/ou réseaux de neurones artificiels.

2.5 Plate
-
f
ormes de développement et de production

Dans un souci de diminution des coûts et de conservation de la liberté des choix
techniques, le projet Oraltitude privilégie l’emploi de produits sous licence libre
(ou open source), tant au niveau des composants int
égrés dans le logiciel
Oraltitude (e.g. EMU

:
http://www.shlrc.mq.edu.au/emu/
) qu’au niveau des
infrastructures de développement (e.g. NetBeans

:
www.netbeans.org
) ou

d’opération (e.g. JBoss

:
www.jboss.org
).