Detalhes bibliográficos
Ano de defesa: |
2013 |
Autor(a) principal: |
Mesquita, Rafael Galvão de |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/12357
|
Resumo: |
Esta dissertação apresenta um novo algoritmo para binarização de imagens de documentos que sofrem de alguns tipos de degradação. O método proposto é baseado na ideia de que pela diferença absoluta entre um documento e seu background é possível enfatizar regiões de texto ao mesmo tempo em que regiões degradadas são atenuadas. Assim, para simular o background de uma imagem de documento este trabalho busca inspiração em alguns aspectos do sistema visual humano e na maneira como percebemos objetos distantes. O algoritmo proposto utiliza a noção de acuidade visual humana definida por Snellen para avaliar o quão longe uma imagem de documento deve estar de um observador de forma que a região de texto e pequenos detalhes não sejam mais percebidos, restando assim somente seu background. Para simular o modo como percebemos uma imagem distante, duas operações morfológicas de fechamento são aplicadas em série, e, em seguida, a imagem é redimensionada de forma que ela corresponda ao tamanho da imagem que seria formada na retina de um observador. Finalizando, um esquema composto pelo algoritmo de agrupamento kmeans e pelo método de limiarização de Otsu também é proposto como parte do algoritmo. O método proposto foi testado em duas bases de imagens de documentos (uma pretencente à competição DIBCO – Document Image Binarization Contest - e outra pertencente ao projeto ProHist) contendo diversos tipos de degradação. Foram realizados quatro experimentos quantitativos e o método proposto obteve o melhor resultado em dois deles. Além disso, este trabalho também propõe uma melhoria no modo de avaliação da binarização de imagens de documentos proposta pelos organizadores da DIBCO, de forma selecionar o método de melhores resultados no caso geral. |