Detecção de rasuras em símbolos com aprendizado Bayesiano de programas (BPL)

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Costa, Raphael Davis de Oliveira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
BPL
DTW
Link de acesso: http://www.teses.usp.br/teses/disponiveis/45/45134/tde-07112019-221533/
Resumo: Avanços significativos no reconhecimento de manuscritos rasurados e na recuperação de textos degradados tem sido obtidos através do uso de técnicas de aprendizado de máquina. No entanto, o grande número de exemplos necessários na etapa de treinamento pode comprometer o uso prático de tais métodos. Este trabalho descreve um modelo de aprendizado para a classificação de dígitos rasurados denominado de \"aprendizado por um tiro\'\', pois que permite uma caracterização mais próximo ao de um ser humano. O termo \"aprendizado por um-tiro\'\' especifica que o aprendizado de um novo conceito é obtido pelo reconhecimento dos principais traços característicos de um objeto, palavra ou símbolo dado um conhecimento a priori relativamente pequeno sobre um novo objeto ainda não identificado. Deste modo, este pré conceito sobre sua caracterização admite a construção de classificadores que realizem a predição a partir de uma imagem de teste como entrada com um conjunto reduzido de imagens de treinamento. Este projeto cria um método que busca classificar imagens rasuradas de manuscritos a partir de um conjunto reduzido de imagens de treinamento sem rasura. Todo o pré-ajuste calculado através dessas imagens são separados por amostras chamadas de \"programas\'\', ou seja, uma composição do conhecimento a priori de todos os traços e sub-traços existentes na imagem, componentes estas que atribuem variabilidades locais e globais que poderão ser reconhecidas estatisticamente por Inferência Bayesiana. Destacamos aqui que o modelo consegue predizer dígitos e símbolos independentemente das rasuras pré-dispostas no conjunto de imagens de testes, onde este conhecimento a priori é inexistente dentro do conjunto de imagens de treinamento. Apresentamos em nossos resultados uma análise que, dado o ajuste inicial aplicado pelo aprendizado Bayesiano de Programas (BPL), nos permitiu utilizar características locais (traços) retiradas de cada símbolo para mensurar o custo referente entre todos os traços de uma imagem de teste e os traços em cada classe representado como imagem de treinamento. Para a obtenção do custo, utilizamos da métrica de deformação dinâmica aplicado em séries temporais (DTW). Finalmente, realizamos a predição para cada grupo de execuções considerando três conjuntos de dados: no primeiro com o grupo de imagens de teste rasuradas, no qual se obteve uma média global de acertos de 76%; no segundo conjunto com imagens de testes sem rasura (com diferença nos traços entre teste e treinamento), obtivemos uma média de 90% para com os acertos; e o terceiro conjunto usando o Omniglot. Tais reajustes adquiridos com poucos exemplos vislumbram futuras aplicações mais complexas em manuscritos degenerados ainda não digitalizados.