Síntesis de voz basada en modelos markovianos ocultos

  • -

Síntesis de voz basada en modelos markovianos ocultos

2012

 Descargar versión PDF

ProfesoresDr. John Goddard Close y Fabiola Margarita Martínez Licona

Resumen: La síntesis de voz es la producción artificial del habla humana, y un sintetizador de habla es el sistema computacional que lo realiza. Usualmente el sintetizador de habla se encuentra como la parte final (back-end) de un sistema del texto-a-habla (TTS). Para ir del texto al habla en un TTS, el back-end tiene que producir una forma de onda sintetizada de la voz usando información lingüistica del texto. Hay varias arquitecturas que se han utilizado para lograr la onda sintetizada: síntesis articulatoria, síntesis de formantes, síntesis concatenativa, y síntesis basada en modelos markovianos ocultos (HMM). Mientras que los sistemas comerciales actuales usualmente usan síntesis concatenativa, en los últimos años la síntesis basada en HMM (también conocido como síntesis basada en parámetros estadísticos) ha ido ganando importancia por el potencial que ofrece. Previamente los HMM han jugado un papel importante en el reconocimiento automático del habla (RAH).Los HMM son empleados para modelar y generar información sobre el espectro, la frecuencia fundamental, y la duración del habla. La información parametrizada es suficiente para generar la forma de onda correspondiente. Una ventaja que presenta el modelo es que usa poco espacio de almacenamiento comparado con la síntesis concatenativa. Este proyecto pretende desarrollar un sistema de síntesis de voz basada en HMM para el español.

Objetivo general

  • Desarrollar un sistema de síntesis de voz basada en HMM para el español

Objetivos específicos

  • Conocer y aplicar técnicas para procesamiento de la señal de voz.
  • Conocer información básica sobre la fonética, prosodia, y la lingüistica del español
  • Conocer los HMM y su la aplicación a la síntesis de voz
  • Aplicar los sistemas HTS y HTK a la síntesis basada en HMM

Ultima actualización 14/08/2022 por pcyti