Cómo instalar el software de texto a voz eSpeak en Ubuntu 20.04
eSpeak es un sintetizador de voz de software para inglés y otros idiomas, eSpeak es un software gratuito y de código abierto (FOSS) que se puede ejecutar en la mayoría de las plataformas, incluidas Linux, Windows y MacOS. eSpeak fue desarrollado por Paul «Joe» Hazeldine basado en el código base del proyecto eCAVE, que a su vez se derivó de X-SPEAK 1.0 por Bill Berry en 1995, ¡lo que hace que eSpeak tenga más de 20 años!
eSpeak es un software portátil, lo que significa que eSpeak se puede mover de una computadora a otra. eSpeak es un programa muy liviano, eSpeak no necesita mucha CPU. Solo necesita 5 Mb de RAM para funcionar sin problemas.
Algunas distribuciones basadas en Ubuntu, como Linux Mint y Elementary, usan eSpeak de forma predeterminada, pero otras distribuciones basadas en Ubuntu no instalan eSpeak, por lo que es posible que desee consultar esta guía si eSpeak no se instaló con su sistema.
La última versión de eSpeak en el momento de escribir este artículo es la 1.48.03, mientras que las nuevas versiones se lanzan regularmente, lo que no debería dañar nada a menos que rompa la compatibilidad con versiones anteriores o introduzca algún error que deba corregirse de inmediato.
Este artículo cubre la instalación de eSpeak en Ubuntu 20.04, que es la distribución de Linux más utilizada y popular.
Requisito previo
- Un servidor o escritorio Ubuntu, eSpeak necesita al menos Ubuntu 12.04 o posterior para instalarlo. eSpeak se basa en el proyecto eCAVE que se basó en X-SPEAK, eCAVE se reescribió en C++ y esa versión requiere al menos Ubuntu 12.04 para funcionar correctamente.
- Una contraseña de root está configurada en su máquina y conexión a Internet. La instalación de eSpeak requiere una conexión a Internet para descargar el paquete de eSpeak desde el sitio web de eSpeak.
Empezando
En primer lugar, debe actualizar su servidor a la última versión. Abra una terminal y ejecute los siguientes comandos para actualizar su sistema:
sudo apt-obtener actualización
En un sistema Ubuntu/Debian, este comando debe ejecutarse cada vez antes de la instalación de cualquier paquete desde los repositorios en línea. Este comando sincronizará la lista local de paquetes de su sistema (disponible en el directorio /etc/apt) con la lista disponible en el servidor en http://archive.ubuntu.com u otros servidores. Para utilizar completamente un repositorio para instalar nuevos paquetes, debe ejecutar este comando después de cada reinicio.
sudo apt-get -y upgrade
Este comando encontrará todos los paquetes obsoletos y realizará una actualización completa. Sin embargo, no instalará las últimas. Está diseñado para que su sistema esté lo más actualizado posible.
Además, si obtiene errores durante las actualizaciones de paquetes con el comando apt-get, use sudo apt-get -f install. Intentará solucionar el problema y continuar con la instalación de actualizaciones. Si no puede, te dirá cómo resolverlos manualmente.
sudo apt-get -f install
Salida de muestra:
Instalar eSpeak
Por defecto, eSpeak está disponible en los repositorios de Ubuntu. Puede instalarlo ejecutando el siguiente comando en su terminal:
sudo apt-get install espeak -y
Este comando descargará e instalará un paquete llamado «espeak», que es una versión real del motor eSpeak TTS. Después de ejecutar los comandos mencionados anteriormente, ha instalado con éxito un nuevo motor de voz para su sistema.
Salida de muestra:
Puede verificar la versión instalada de eSpeak usando el siguiente comando:
hablar –versión
Salida de muestra:
De forma predeterminada, espeak se instala en todo el sistema con el prefijo /usr, lo que significa que cualquiera que tenga acceso a esta instalación puede ejecutarlo. Si desea restringir el acceso para que solo un usuario en particular pueda usar este software, la instalación debe realizarse con –prefix=/home/username/.
Utilice eSpeak para la conversión de texto a audio
El comando eSpeak se puede utilizar para convertir texto en voz. Puede dar cualquier archivo de texto como entrada o ingresar los textos en el terminal para la conversión. Pronunciemos la línea «Hola, esto es una muestra» y grabémosla en el archivo de audio sample.mp4.
espeak «Hola, esto es una muestra» -w sample.mp4 -g 60 -p 70 -s 100 -v en-us
Aquí, el parámetro -w especifica el nombre del archivo de salida que debería ser un archivo de audio. También puede ser un .mp3 o cualquier otro formato como ogg, vorbis, etc.
A esto le sigue el parámetro -g que controla el tono de la voz y su valor no debe ser superior a 90 para evitar voces agudas que suenen como ‘robóticas’ o ‘artificiales’.
El parámetro -p controla la pausa entre palabras y su valor debe ser inferior a 10 para evitar pausas indebidas. El valor predeterminado es 2, lo que significa que habrá dos segundos de silencio después de cada palabra.
El parámetro –s controla la velocidad del habla y se puede ajustar para cambiar la velocidad de lectura del texto.
El parámetro -v controla la selección de voz que necesita una entrada de un usuario y toma el sufijo en, es (para acento europeo) o fi para acentos en inglés, español o finlandés, respectivamente.
Ahora puede reproducir el archivo sample.mp4 para escuchar el texto hablado en cualquier reproductor multimedia mp3 de su elección, como mplayer o vlc. Puede ingresar tantas líneas de texto como desee y grabarlas todas en una sola sesión de terminal.
Hay muchas otras formas de usar eSpeak para leer textos. La opción –help sugerirá otras formas de usarla.
hablar –ayuda
Salida de muestra:
Quitar eSpeak
Use el siguiente comando para eliminar eSpeak:
sudo apt-get remove espeak
Escriba y y presione enter cuando se le solicite eliminar eSpeak con dependencias. Este comando eliminará el paquete espeak y todas sus dependencias de su sistema.
Nota:
1. Si instaló espeak en todo el sistema, también eliminará el motor eSpeak de su sistema y usará la voz predeterminada.
2. Si no puede usar sudo apt-get remove espeak. Dará como resultado un error que dice que este u otros paquetes requieren el paquete ‘espeak’ y no podrá desinstalarlo, es mejor usar la opción de actualización.
sudo apt-get -y upgrade –remove espeak
Instale Gspeaker para la conversión de texto a voz basada en GUI
Gspeak es otro popular software de texto a voz para Linux. Fue escrito en Python y utiliza el motor espeak TTS para la conversión real. Proporciona una interfaz de usuario simple que se utiliza para controlar todas las configuraciones relacionadas con la selección de voz, opciones generales, etc.
Puedes instalarlo con cualquier administrador de paquetes. Escriba el siguiente comando en la terminal para instalar GSpeaker:
apt-get install gespeaker -y
Una vez que esté instalado, puede iniciarlo desde su tablero de Unity. Se iniciará la interfaz gráfica de usuario de Gspeak que le ayuda a controlar su motor de voz.
Así es como se ve la interfaz de usuario de Gespeaker:
Hay pestañas separadas para cada opción.
La pestaña ‘configuración básica’ le permite configurar todas las opciones generales del motor TTS, como la velocidad de la voz, el tono, etc. También puede configurar otras configuraciones, como los tiempos de espera y la configuración de audio.
La pestaña de voces le permite seleccionar la voz entre las voces instaladas.
La pestaña de historial le permite almacenar sus conversiones de texto a voz personalizadas que se pueden reutilizar en cualquier momento posterior.
La pestaña de reversión restaura la configuración anterior después de cambiar la configuración de voz. Esta pestaña solo funciona cuando cambia la configuración guardada existente. El botón Guardar será gris.
Puede leer más sobre la opción Gespeaker en la sección de ayuda de gespeaker a la que se puede acceder desde la pestaña «Ayuda».
Quitar Gespeaker
Si no está utilizando Gespeaker, elimínelo para liberar espacio en el disco. Escriba el siguiente comando en la terminal:
apt-get autoremove gespeaker -y
También puede eliminar Gespeaker a través del centro de software de Ubuntu. Abra el centro de software y busque «gespeaker». Haga clic en el icono y seleccione la opción de eliminar en el menú del lado derecho.
Conclusión
Este tutorial le mostró cómo instalar eSpeak y Gespeaker en una máquina con Ubuntu. Puede usar cualquiera de estos software TTS para leer textos en voz alta, depende de usted cuál elegir.
Si no le gustan estos dos, hay muchos otros motores de texto a voz disponibles para Linux. Te recomiendo que consultes las alternativas de espeak en la pagina wiki. Siempre es útil tener más de un motor de voz instalado en su máquina.