Processo automático de reconhecimento de texto em imagens de documentos de identificação genéricos.

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Romero, Rodolfo Valiente
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
OCR
Link de acesso: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-05032018-151842/
Resumo: Existe uma busca crescente por métodos de extração de texto em imagens de documentos. O uso de imagens digitais tem se tornado cada vez mais frequente em diversas áreas. O mundo moderno está cheio de texto, que os seres humanos usam para identificar objetos, navegar e tomar decisões. Embora o problema do reconhecimento de texto tenha sido amplamente estudado dentro de determinados domínios, detectar e ler texto em documentos de identificação, continua sendo um desafio aberto. Apresenta-se uma arquitetura que integra os diferentes algoritmos de localização, extração e reconhecimento aplicados à extração de texto em documentos de identificação genéricos. O método de localização proposto usa o algoritmo MSER junto com uma melhoria do contraste e a informação das bordas dos objetos da imagem, para localizar os possíveis caracteres. A etapa de seleção desenvolveu-se mediante a busca de heurísticas, capazes de classificar as regiões localizadas como textuais e não-textuais. Na etapa de reconhecimento é proposto um método iterativo para melhorar o desempenho do OCR. O processo foi avaliado usando as métricas precisão e revocação e foi realizada uma prova de conceito do sistema em um ambiente real. A abordagem proposta é robusta na detecção de textos oriundos de imagens complexas com diferentes orientações, dimensões e cores. O sistema de reconhecimento de texto proposto apresenta resultados competitivos, tanto em precisão e taxa de reconhecimento, quando comparados com outros sistemas. Mostrando excelente desempenho e viabilidade de sua implementação em sistemas reais.