Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras

Detalhes bibliográficos
Autor(a) principal: Abreu, Douglas Vinicius de
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/6004
Resumo: Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.
id UTFPR-12_5ad1d1cbdb85c8e9f699ddde6d2ca0f3
oai_identifier_str oai:repositorio.utfpr.edu.br:1/6004
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavrasScript recognition from handwritten documents : document, line and word-level approachSistemas de reconhecimento de padrõesEscrita - IdentificaçãoComputaçãoPattern recognition systemsWriting - IdentificationComputer scienceCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOScript recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.Universidade Tecnológica Federal do ParanáCampo MouraoBrasilDepartamento Acadêmico de ComputaçãoCiência da ComputaçãoUTFPRGonçalves, Diego BertoliniKawamoto, André Luiz SatoshiAlencar, Aretha BarbosaGonçalves, Diego BertoliniAbreu, Douglas Vinicius de2020-11-09T19:10:10Z2020-11-09T19:10:10Z2019-11-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/6004porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-11-09T19:10:10Zoai:repositorio.utfpr.edu.br:1/6004Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-09T19:10:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
Script recognition from handwritten documents : document, line and word-level approach
title Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
spellingShingle Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
Abreu, Douglas Vinicius de
Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_full Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_fullStr Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_full_unstemmed Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
title_sort Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
author Abreu, Douglas Vinicius de
author_facet Abreu, Douglas Vinicius de
author_role author
dc.contributor.none.fl_str_mv Gonçalves, Diego Bertolini
Kawamoto, André Luiz Satoshi
Alencar, Aretha Barbosa
Gonçalves, Diego Bertolini
dc.contributor.author.fl_str_mv Abreu, Douglas Vinicius de
dc.subject.por.fl_str_mv Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Sistemas de reconhecimento de padrões
Escrita - Identificação
Computação
Pattern recognition systems
Writing - Identification
Computer science
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.
publishDate 2019
dc.date.none.fl_str_mv 2019-11-28
2020-11-09T19:10:10Z
2020-11-09T19:10:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
http://repositorio.utfpr.edu.br/jspui/handle/1/6004
identifier_str_mv ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/6004
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
Brasil
Departamento Acadêmico de Computação
Ciência da Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Campo Mourao
Brasil
Departamento Acadêmico de Computação
Ciência da Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850497920289210368