[en] HANDWRITTEN DIGITS RECOGNITION BY NEURAL NETWORKS

Detalhes bibliográficos
Ano de defesa: 2006
Autor(a) principal: MARIA ANGELICA PEREIRA FREIXINHO
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: MAXWELL
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=9017&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=9017&idi=2
http://doi.org/10.17771/PUCRio.acad.9017
Resumo: [pt] Esta dissertação investiga a utilização de Redes Neurais Artificiais (RNAs) na área de reconhecimento de caracteres, em particular de dígitos manuscritos. Nesta investigação foram utilizadas amostras reais de dígitos isolados e de códigos postais brasileiros relativos e vários escritores. O trabalho consiste de quatro partes principais: o estudo das metodologias de reconhecimento e da semântica e estrutura de representação de caracteres; o desenvolvimento das etapas de pré-processamento dos dígitos; o desenvolvimento das RNAs para o reconhecimento de dígitos manuscritos; e o estudo de casos. No estudo sobre a metodologia de reconhecimento de caracteres fez-se um levantamento preliminar das diversas aplicaões de sistemas OCR (Optical Character Recognition). Enfatizou-se a classificação dos diversos tipos de semânticas existentes de acordo com a aplicação específica, bem como a estrutura geral de um sistema OCR. O estudo também consistiu da análise e apresentação de modelos convencionais e de sistemas inteligentes na implementação da etapa de classificação dos sistemas OCR. O desenvolvimento do pré-processamento dos dígitos envolveu um extenso estudo bibliográfico de diversas metodologias para cada uma de suas etapas. Foram estudados os algoritmos mais empregados nas etapas de pré- processamento de um sistema. OCR: conversão de níveis de cinza para representação binária ( thresholding), filtragem, segmentação e normalização. A partir desse estudo, foram selecionados e desenvolvidos determinados tipos de algoritmos para o pré-processamento. No desenvolvimento de RNAs para o reconhecimento de dígitos manuscritos fez-se uma investigação de diversas metodologias, incluindo as arquiteturas e os algoritmos de aprendizado mais empregados. Neste estudo, constatou-se a predominância do uso do algoritmo de retropropagação do erro (BackPropagation) para o treinamento das redes nas aplicações de reconhecimento de caracteres manuscritos. As arquiteturas propostas neste trabalho foram escolhidas de acordo com dois tipos de aplicados de reconhecimento: reconhecimento de dígitos manuscritos isolados e reconhecimento automático de código postal. No estudo de casos, as RNAs foram modeladas para fazer o reconhecimento automático de código postal. Este estudo consistiu de um conjunto de implementações com o objetivo de testar o desempenho de um sistema OCR baseado em redes neurais. Foram feitos testes com dois tipos de sistemas de reconhecimento por redes neurais: redes totalmente conectadas e redes parcialmente. Para os dois casos foram utilizados amostras reais colhidas de 73 escritores. Os resultados obtidos com os dois tipos de redes foram comparados e comprovaram a superioridade das RNAs com arquitetura parcialmente conectada no reconhecimento de dígitos altamente ruidosos. Comparações também foram feitas com outras técnicas convencionais de reconhecimento, obtendo-se resultados, em muitos casos, superiores.