Análise de qualidade e tempo de processamento de algoritmos de binarização para documentos textuais
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Engenharia Eletrica |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufpe.br/handle/123456789/30613 |
Resumo: | A binarização de imagens digitais é uma técnica amplamente utilizada, uma vez que documentos monocromáticos necessitam de menor espaço de armazenamento e banda de transmissão em redes de computadores. Além disso, a binarização é etapa usual em muitos processos complexos de processamento de imagens, tais como a transcrição automática de documentos. Esta dissertação de mestrado propõe uma metodologia para análise da qualidade das imagens resultantes de algoritmos de binarização baseada em imagens sintéticas. Tais imagens são geradas a partir de um conjunto de imagens binárias de referência com a adição de características extraídas de documentos reais, tais como textura do papel e escrita, interferência frente-verso, etc. As imagens sintéticas são, então, binarizadas e comparadas com as imagens de referência. Quanto mais próximo no número de pixels brancos e pretos da imagem de referência, considera-se melhor o desempenho do algoritmo. Os tempos de processamento também são coletados. Um total de 2:083:200 documentos representativos do universo de documentos textuais foram sintetizados e binarizados. Visando uma ampla divulgação, os resultados obtidos foram disponibilizados numa plataforma web, na qual o usuário escolhe os parâmetros, a plataforma gera o documento sintético e apresenta os resultados para cada algoritmo testado. |