Detalhes bibliográficos
Ano de defesa: |
2010 |
Autor(a) principal: |
Alves, Wonder Alexandre Luz |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124905/
|
Resumo: |
A extração de informações textuais em imagens e vídeo é um problema importante em visão computacional que está presente em muitas aplicações, tais como a localização de endereços em cartão postal, localização do número do licenciamento em placa veicular, indexção de conteúdo baseado em imagens e vídeo, sistema de apoio a deficientes visuais, entre outras. Tal problema pode ser subdividido em cinco subproblemas: (1) detecção, (2) localização, (3) rastreamento, (4) extração e realce, (5) reconhecimento. O foco desse trabalho é explorar o segundo subproblema, istoé, o problema de localização de textos, cujo objetivo principal élocalizar dentro da imagem de entrada as regiões cmo presença de textos. Em especial, é tratado o problema de localização de texto para uma categoria de imagens conhecida como imagens de cena. Nesta categoria de imagens os textos presentes são considerados partes integrantes de uma cena e estão presentesquase sempre de maneira acidental a não proposital. Devido a esse fator, a ocorrência de texto nessas imagens pode diferir significativamente quanto à sua inclinação, seu tamanho, seu estilo de fonte, sua iluminação e também pode estar parcialmente ocluso. Dadas essas considerações, esse trabalho tem como objetivo principal apresentar um novo método para localização de texto para imagens de cenas, o qual consiste de duas grandes etapas (uma seguida da outra): extração de regiões de texto candidatas e classificação de regiões de texto. Na primeira etapa, um conjunto de regiões de texto candidatas é extraído da imagem de entrada por meio de uma combinação robusta de operadores morfológicos e, na segunda etapa, é extraído de cada região de texto candidata um conjunto de atributos para depois classificá-la em região de texto ou não-texto. |