Sistema de Conversão Texto-Fala
Em síntese de fala, desde 1998, o grupo de pesquisas do LINSE vem desenvolvendo algumas versões de sistemas de Conversão Texto-Fala. Esse projeto de pesquisa tem sido financiado pela Dígitro Tecnologia Ltda. e pelo Ministério de Ciência e Tecnologia (CNPq). A abordagem utilizada nesses sistemas é a síntese concatenativa. Para a criação do banco de unidades a serem concatenadas, tem-se previamente a gravação de um corpus de texto por um locutor profissional, atendendo as necessidades de unidades lingüísticas do português brasileiro.
Nosso primeiro sistema de síntese de fala era composto de um conjunto de unidades fixas a partir do qual a fala era sintetizada. O repertório de unidades para esse sistema era constituído principalmente de trifones e de alguns polifones. Para a concatenação dessas unidades, levavam-se em conta os segmentos homorgânicos (fonemas que têm o mesmo ponto de articulação, diferenciando-se por outros traços), técnica que reduziu de 30.000 para aproximadamente 7.000 o número de unidades necessárias à concatenação da fala (Veja, em PRIMEIRA VERSÃO, algumas elocuções de nosso primeiro sistema de síntese de fala).
Atualmente, nosso sistema de síntese de fala, chamado ORADOR, baseia-se em unidades de tamanho variável, podendo essas unidades constituírem-se de apenas um fonema ou até de unidades maiores como sílabas, palavras, sintagmas e frases curtas (Veja em NOVA VERSÃO, elocuções de nosso sistema atual de síntese de fala). |