Informações do Trabalho
Titulo
INVESTIGAÇÃO DO ESFORÇO NECESSÁRIO NAS ETAPAS DO TREINAMENTO DE MODELOS ACÚSTICOS E DE LINGUAGEM PARA TRANSCRIÇÃO DE ÁUDIO E SEU IMPACTO NA ACURÁCIA DE MODELOS
Subtítulo
Autor
MARCOS VALADÃO GUALBERTO FERREIRA
Orientador
JAIRO FRANCISCO DE SOUZA
Resumo
Reconhecimento de fala é um tema recorrente nas áreas de Recuperação de Informação e web. A possibilidade do computador processar sinais de áudio e gerar transcrições textuais criam uma série de aplicações para estas informações. Os sistemas de reconhecimento de fala utilizam modelos estatísticos, que são construídos através de treinamento supervisionado, e regras de estruturas de linguagem. O maior desafio desses sistemas é treinar os modelos acústicos e de linguagem com o objetivo de maximizar a acurácia do texto transcrito . Este treinamento é um processo caro pois necessita de uma base de arquivos consideravelmente grande e bem processada e demanda o cumprimento de diversas tarefas, tudo isto para encontrar uma modelagem satisfatória. A abordagem proposta neste trabalho tem como objetivo explorar as tarefas pertinentes no treinamento de modelos acústicos e de linguagem com o objetivo de encontrar quais delas mais influenciam na acurácia final do modelo e direcionar melhor o tempo, empenho e desenvolvimento de melhorias. Através dos experimentos realizados neste trabalho, conclui-se que o investimento no processamento da base utilizada no treinamento de modelos resultou no melhor ganho, com relação a WER (Word Error Rate), e possibilitou a criação de um sistema de reconhecimento de fala robusto e com possibilidades de aplicações.
Ano:
2017
Palavras-Chave
Reconhecimento automático de fala, treinamento de modelos, modelos acústicos, modelos de linguagem
Obter PDF
Obter arquivos extras
Obter Bibtex