En Linux, uno de las aplicaciones más socorridas para la conversión de texto a voz es Festival, una gran herramienta de código libre. En Ubuntu, festival se encuentra en los repositorios, aunque al intentar utilizar algún comando me encontré con un problema de configuración del dispositivo de sonido, así que anoto por aquí cómo echar a andar Festival por si llego a necesitarlo de nuevo ;).
Instalar Festival
# aptitude install festival
Configurar Festival para que use ESD o PulseAudio
Para hacer que Festival utilice ESD o PulseAudio como salida, se utiliza el comando (Parameter.set ‘Audio_Method ‘esdaudio), se puede ejecutar dentro de la línea de comandos de Festival:
$ festival
festival> (Parameter.set 'Audio_Method 'esdaudio)
O colocando el comando en el archivo de configuración ~/.festivalrc (este cambio tendrá efecto solo para el usuario en turno, para hacerlo global se debe hacer en /etc/festival.scm, checar enlace anterior).
Probando Festival
Un texto rápido en inglés:
$ festival
Festival Speech Synthesis System 1.96:beta July 2004
Copyright (C) University of Edinburgh, 1996-2004. All rights reserved.
For details type `(festival_warranty)'
festival> (SayText "Hello world" )
#
festival> (quit)
En español
Necesitamos instalar el paquete festvox-ellpc11k que contiene el sintetizador de castellano (voz masculina).
Después ejecutamos festival indicándole el idioma a usar
$ festival --language spanish
Festival Speech Synthesis System 1.96:beta July 2004
Copyright (C) University of Edinburgh, 1996-2004. All rights reserved.
For details type `(festival_warranty)'
festival> (SayText "Hola mextronics")
#
Y para no entrar a la línea de comandos de Festival, podemos indicarle que convierta lo que encuentra en stdin con el parámetro –tts:
$ echo "Hola mundo" | festival --language spanish --tts
Dejar una contestacion