
Sommaire
Une petite histoire de la synthèse vocale
Comment faire parler son PC en français ?
Comment utiliser la synthèse vocale ?
Pour aller plus loin
Tout le monde s'émerveille des nouvelles possibilités offertes par les PC connectés à Internet mais bien peu utilisent une possibilité intégrée : la synthèse vocale. Le but de cet article est de vous faire découvrir comment vous pouvez très simplement transformer votre PC en dame de compagnie pour écouter textes et journaux favoris. Cet article est destiné aux utilisateurs de Windows XP. Les utilisateurs de Linux peuvent utiliser festival.
Pour contrôler la lecture de cette page
Le traitement de la voix se compose de deux fonctions : la reconnaissance de la parole et la synthèse vocale. La reconnaissance de la parole sera abordée dans un autre article (à venir).
La synthèse vocale [text-to-speech] consiste à transformer un texte en voix. Elle s'est développée à partir de 1965. Les premiers systèmes utilisaient des règles pour reconstituer le spectre sonore de la voix. L'avantage était de nécessiter peu de place en mémoire. L'inconvénient était de fournir une voix mécanique souvent associée à celle d'un robot. A partir de 1985, le système de règles a été complété par des bases de données de sons qui permettent d'améliorer l'intonation et l'accent tonique. La taille de ces bases de données (10 à 100 Mo) posait un problème pour les premiers PC. L'amélioration des performances et de la taille mémoire permet maintenant d'utiliser ces systèmes sur le PC de Monsieur Tout le Monde.
Un système de synthèse vocale est intégré en standard dans Windows XP. Pour l'utiliser, il suffit de faire démarrer, panneau de configuration, voix. Dans le panneau qui s'affiche, entrer un texte puis cliquer sur "Tester la voix". Comme vous pouvez le constater, Microsoft Sam parle avec un excellent accent anglais. Il est surprenant de constater que la version française de Microsoft ne parle qu'en anglais !
Comment installer gratuitement des voix françaises ? C'est possible et très simple.
Il faut d'abord installer le logiciel Microsoft reader (3.6Mo) gratuit (ça existe !) en version française. Ensuite, il faut installer les voix françaises (5.6 Mo). En retournant dans le panneau de configuration de la voix, vous avez deux nouvelles voix, celles de Pierre et de Virginie que vous pouvez tester. La diction n'est pas fameuse et l'accent plutôt canadien. En cherchant bien sur le site de Microsoft, on trouve la voix de Virginie que l'on peut télécharger ici. Elle vaut les 22 Mo à télécharger car la diction et l'accent tonique sont parfaits. Je vous suggère donc de configurer Scansoft Virginie comme voix par défaut.
Il faut trouver des logiciels qui exploitent cette possibilité.
Pour développer vos applications de synthèse et de reconnaissance vocale, vous pouvez télécharger le Speech SDK 5.1 de Microsoft (attention 300 Mo). Les interfaces sont accessibles en Visual basic et sont plutôt simples d'emploi.
Jean-Paul Figer
© Jean-Paul Figer,1995-2005
Lorsque je n'écris pas des articles sur l'informatique, je travaille à Capgemini. Les opinions exprimées dans ces articles n'engagent que moi et ne représentent pas forcément la position de Capgemini.
Pour être informé des nouveaux articles de ce site, vous pouvez vous inscrire (et vous désinscrire) ici.