Localização de textos em imagens de cenas por meio de operadores morfológicos

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Alves, Wonder Alexandre Luz
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124905/
Resumo: A extração de informações textuais em imagens e vídeo é um problema importante em visão computacional que está presente em muitas aplicações, tais como a localização de endereços em cartão postal, localização do número do licenciamento em placa veicular, indexção de conteúdo baseado em imagens e vídeo, sistema de apoio a deficientes visuais, entre outras. Tal problema pode ser subdividido em cinco subproblemas: (1) detecção, (2) localização, (3) rastreamento, (4) extração e realce, (5) reconhecimento. O foco desse trabalho é explorar o segundo subproblema, istoé, o problema de localização de textos, cujo objetivo principal élocalizar dentro da imagem de entrada as regiões cmo presença de textos. Em especial, é tratado o problema de localização de texto para uma categoria de imagens conhecida como imagens de cena. Nesta categoria de imagens os textos presentes são considerados partes integrantes de uma cena e estão presentesquase sempre de maneira acidental a não proposital. Devido a esse fator, a ocorrência de texto nessas imagens pode diferir significativamente quanto à sua inclinação, seu tamanho, seu estilo de fonte, sua iluminação e também pode estar parcialmente ocluso. Dadas essas considerações, esse trabalho tem como objetivo principal apresentar um novo método para localização de texto para imagens de cenas, o qual consiste de duas grandes etapas (uma seguida da outra): extração de regiões de texto candidatas e classificação de regiões de texto. Na primeira etapa, um conjunto de regiões de texto candidatas é extraído da imagem de entrada por meio de uma combinação robusta de operadores morfológicos e, na segunda etapa, é extraído de cada região de texto candidata um conjunto de atributos para depois classificá-la em região de texto ou não-texto.