Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: ARRUDA, Alisson Werner Arruda de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/10481
Resumo: Binarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).