Localização de textos em imagens de cenas por meio de operadores morfológicos

Alves, Wonder Alexandre Luz

Localização de textos em imagens de cenas por meio de operadores morfológicos

Detalhes bibliográficos
Ano de defesa:	2010
Autor(a) principal:	Alves, Wonder Alexandre Luz
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Computação Gráfica
Link de acesso:	https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124905/
Resumo:	A extração de informações textuais em imagens e vídeo é um problema importante em visão computacional que está presente em muitas aplicações, tais como a localização de endereços em cartão postal, localização do número do licenciamento em placa veicular, indexção de conteúdo baseado em imagens e vídeo, sistema de apoio a deficientes visuais, entre outras. Tal problema pode ser subdividido em cinco subproblemas: (1) detecção, (2) localização, (3) rastreamento, (4) extração e realce, (5) reconhecimento. O foco desse trabalho é explorar o segundo subproblema, istoé, o problema de localização de textos, cujo objetivo principal élocalizar dentro da imagem de entrada as regiões cmo presença de textos. Em especial, é tratado o problema de localização de texto para uma categoria de imagens conhecida como imagens de cena. Nesta categoria de imagens os textos presentes são considerados partes integrantes de uma cena e estão presentesquase sempre de maneira acidental a não proposital. Devido a esse fator, a ocorrência de texto nessas imagens pode diferir significativamente quanto à sua inclinação, seu tamanho, seu estilo de fonte, sua iluminação e também pode estar parcialmente ocluso. Dadas essas considerações, esse trabalho tem como objetivo principal apresentar um novo método para localização de texto para imagens de cenas, o qual consiste de duas grandes etapas (uma seguida da outra): extração de regiões de texto candidatas e classificação de regiões de texto. Na primeira etapa, um conjunto de regiões de texto candidatas é extraído da imagem de entrada por meio de uma combinação robusta de operadores morfológicos e, na segunda etapa, é extraído de cada região de texto candidata um conjunto de atributos para depois classificá-la em região de texto ou não-texto.

Localização de textos em imagens de cenas por meio de operadores morfológicos

Registros relacionados