Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2019 |
| Tipo de documento: | Trabalho de conclusão de curso |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
Resumo: | Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process. |
| id |
UTFPR-12_5ad1d1cbdb85c8e9f699ddde6d2ca0f3 |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/6004 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavrasScript recognition from handwritten documents : document, line and word-level approachSistemas de reconhecimento de padrõesEscrita - IdentificaçãoComputaçãoPattern recognition systemsWriting - IdentificationComputer scienceCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOScript recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process.O reconhecimento de estilos de escrita ou reconhecimento de script é uma etapa necessária para automatizar o reconhecimento de sistemas de Reconhecimento Óptico de Caracteres (OCR). A tarefa de reconhecimento de estilos de escrita em documentos manuscritos é desafiadora devido à similaridade entre alguns estilos de escritas. Nosso principal objetivo neste trabalho é analisar e avaliar o desempenho de técnicas robustas em onze diferentes estilos de escrita. Além do desempenho, analisamos o impacto ao se trabalhar com reconhecimento em nível de documentos,linhas e palavras. Foram utilizados os descritores de texturas Padrões Binários Locais (LBP), Quantização Local de Fase (LPQ) e Características Robustas Aceleradas (SURF) em conjunto com o classificador Maquina de Vetores de Suporte (SVM). Os experimentos foram realizados em uma base de dados com onze classes, de forma a alcançarmos taxas de acerto similares às apresentadas na literatura. A melhor taxa de acerto foi de 97,73% utilizando o descritor de textura SURF trabalhando a nível de documento, nos níveis de linhas e palavras o melhor desempenho foi de 96% e 94,37%, respectivamente, utilizando o descritor LPQ. Por meio dos experimentos realizados, concluímos que o melhor desempenho se aplica ao nível de documentos seguido por linhas e palavras. Observamos também que a melhora no desempenho de aplicações de reconhecimento de estilo de escritas não está relacionado somente com a quantidade de amostras utilizadas no processo de treinamento.Universidade Tecnológica Federal do ParanáCampo MouraoBrasilDepartamento Acadêmico de ComputaçãoCiência da ComputaçãoUTFPRGonçalves, Diego BertoliniKawamoto, André Luiz SatoshiAlencar, Aretha BarbosaGonçalves, Diego BertoliniAbreu, Douglas Vinicius de2020-11-09T19:10:10Z2020-11-09T19:10:10Z2019-11-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/6004porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-11-09T19:10:10Zoai:repositorio.utfpr.edu.br:1/6004Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-09T19:10:10Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras Script recognition from handwritten documents : document, line and word-level approach |
| title |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| spellingShingle |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras Abreu, Douglas Vinicius de Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| title_full |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| title_fullStr |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| title_full_unstemmed |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| title_sort |
Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras |
| author |
Abreu, Douglas Vinicius de |
| author_facet |
Abreu, Douglas Vinicius de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Gonçalves, Diego Bertolini Kawamoto, André Luiz Satoshi Alencar, Aretha Barbosa Gonçalves, Diego Bertolini |
| dc.contributor.author.fl_str_mv |
Abreu, Douglas Vinicius de |
| dc.subject.por.fl_str_mv |
Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
Sistemas de reconhecimento de padrões Escrita - Identificação Computação Pattern recognition systems Writing - Identification Computer science CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
Script recognition is a necessary step in automating the recognition of Optical Character Recognition (OCR) systems. The task of script recognition in handwritten documents is challenging due to the similarity between some of these styles. Our main objective in this paper is to analyze and evaluate the performance of robust techniques in eleven different script recognition. In addition to performance, we analyzed the impact of working with document, line, and word-level recognition. The Local Binary Patterns (LBP), Local Phase Quantization (LPQ), and Speeded Up Robust Features (SURF) texture descriptors were used in conjunction with the Support Vector Machine (SVM) classifier. The experiments were performed in a database with eleven classes, in order to achieve hit rates similar to those presented in the literature. The best hit rate was 97.73% using the document-level SURF texture descriptor. In line and word levels the best performance was 96% and 94.37%, respectively, using the LPQ descriptor. Through our experiments, we find that the best performance applies to the document level, followed by lines and words. We also noted that the performance improvement of handwriting recognition applications is not only related to the amount of samples used in the training process. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-11-28 2020-11-09T19:10:10Z 2020-11-09T19:10:10Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
| identifier_str_mv |
ABREU, Douglas Vinicius de. Reconhecimento de estilos de escrita em documentos manuscritos: uma abordagem em nível de documentos, linhas e palavras. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Campo Mourão, 2019. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/6004 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao Brasil Departamento Acadêmico de Computação Ciência da Computação UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Campo Mourao Brasil Departamento Acadêmico de Computação Ciência da Computação UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850497920289210368 |