Recuperação da trajetória online de caracteres latinos utilizando deep learning
Ano de defesa: | 2020 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , , , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Ponta Grossa |
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/5230 |
Resumo: | Estudos sobre a recuperação de trajetória de manuscritos ganharam espaço na área da pesquisa de reconhecimento de textos manuscritos offline. O motivo está no uso de recursos de reconhecimento online, criando técnicas para simular a escrita da palavra manuscrita e inserindo as coordenadas simuladas dos pixels em sistemas que reconhecem palavras de modo online. O princípio dessas técnicas é encontrar um traçado ordenado de modo similar àquele feito por uma pessoa durante a escrita; esse processo é conhecido como recuperação da trajetória de manuscritos (handwriting trajectory recovery - HTR). Vários trabalhos apresentaram o uso de grafos para realizar a HTR, esqueletizando os caracteres e traçando o caminho correto do grafo, sendo este grafo o esqueleto do caractere. Entretanto, estudos recentes caracterizam o uso das redes neurais artificiais de aprendizagem profunda (deep learning) para realizar a HTR. A vantagem de se utilizar as redes de deep learning é usufruir da sua capacidade de generalização para atingir taxas de acertos melhores na recuperação dessas trajetórias. Apesar destes trabalhos apresentarem resultados promissores, seus resultados são dificilmente comparados entre si, uma vez que utilizam métricas de avaliação diferentes uma das outras. Baseado nesses fatores, o presente trabalho tem como objetivo apresentar uma proposta para realizar a HTR de caracteres latinos do dataset IRONOFF através do uso de redes deep learning, além de apresentar um novo modelo de avaliação chamada de SWO (Segmentation-sliding Window-Ordering), para avaliar a sequência de coordenadas preditas pelas redes de deep learning. Comparada com as métricas existentes na literatura, a avaliação SWO mostrou-se ser mais eficaz tanto quantitativamente, quanto qualitativamente, sendo capaz de verificar se a sequência dos traços e o formato geométrico do caractere foram recuperados. Este trabalho também identifica que a variação na quantidade de pontos de coordenadas por caractere (/) afeta no desempenho das redes de deep learning para o problema da HTR, evidenciando uma abordagem para melhorar as taxas de avaliação. Os experimentos são conduzidos a partir da transformação da informação online em offline. Esses dados passam pelo processo de normalização e data augmentation. Cinco configurações de redes são implementadas e passam pelo processo de treinamento, validação e testes. Alcança-se como melhores resultados as taxa de 95, 31% de acurácia na predição de trajetória de caracteres single-stroke e 92, 93% de acurácia na predição de trajetória de caracteres multi-strokes, apresentando dessa maneira bons resultados para o problema de HTR. |