Análise de qualidade e tempo de processamento de algoritmos de binarização para documentos textuais

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: BERNARDINO, Rodrigo Barros
Orientador(a): LINS, Rafael Dueire
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Engenharia Eletrica
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/30613
Resumo: A binarização de imagens digitais é uma técnica amplamente utilizada, uma vez que documentos monocromáticos necessitam de menor espaço de armazenamento e banda de transmissão em redes de computadores. Além disso, a binarização é etapa usual em muitos processos complexos de processamento de imagens, tais como a transcrição automática de documentos. Esta dissertação de mestrado propõe uma metodologia para análise da qualidade das imagens resultantes de algoritmos de binarização baseada em imagens sintéticas. Tais imagens são geradas a partir de um conjunto de imagens binárias de referência com a adição de características extraídas de documentos reais, tais como textura do papel e escrita, interferência frente-verso, etc. As imagens sintéticas são, então, binarizadas e comparadas com as imagens de referência. Quanto mais próximo no número de pixels brancos e pretos da imagem de referência, considera-se melhor o desempenho do algoritmo. Os tempos de processamento também são coletados. Um total de 2:083:200 documentos representativos do universo de documentos textuais foram sintetizados e binarizados. Visando uma ampla divulgação, os resultados obtidos foram disponibilizados numa plataforma web, na qual o usuário escolhe os parâmetros, a plataforma gera o documento sintético e apresenta os resultados para cada algoritmo testado.