Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto
| Main Author: | |
|---|---|
| Publication Date: | 2017 |
| Format: | Bachelor thesis |
| Language: | por |
| Source: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| Download full: | http://repositorio.utfpr.edu.br/jspui/handle/1/12524 |
Summary: | The advent of Artificial Intelligence has provided the advance and the creation of solutions applied to the most diverse areas. Within Natural Language Processing this has not been different, in the last five years, the studies of algorithms for vector representation and semantic retrieval of words have shown great advances. Also called word embeddings, these algorithms add benefits that earlier methods did not provide. Aiming at the need to further study these new algorithms, such as Skip-Gram, Glove and CBOW, and at the same time, noting the importance of the automation of lexical simplification for the benefit of Portuguese learners, dyslexics, aphasia, among others, this work proposes the development of a lexical simplifier using these representations. This simplifier also used a Artificial Neural Network and some dictionaries to create simplifications. There were three main contributions observed in the experiments carried out: a simplifier capable of assisting a proficient speaker in the lexical simplification process, an artificial neural network structure with a tendency to automated learning and the extrinsic comparison of the algorithms. The algorithm Wang2vec Continuous Bag-of-Words performed the best results for the lexical simplification activity during this work’s experiments. |
| id |
UTFPR-12_727f0a7dd1cdf77cf2c575be44b48c38 |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/12524 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de textoExtrinsic comparison of word embedding algorithms in text lexical simplificationComputação semânticaProcessamento de linguagem natural (Computação)Inteligência artificialSemantic computingNatural language processing (Computer science)Artificial intelligenceCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe advent of Artificial Intelligence has provided the advance and the creation of solutions applied to the most diverse areas. Within Natural Language Processing this has not been different, in the last five years, the studies of algorithms for vector representation and semantic retrieval of words have shown great advances. Also called word embeddings, these algorithms add benefits that earlier methods did not provide. Aiming at the need to further study these new algorithms, such as Skip-Gram, Glove and CBOW, and at the same time, noting the importance of the automation of lexical simplification for the benefit of Portuguese learners, dyslexics, aphasia, among others, this work proposes the development of a lexical simplifier using these representations. This simplifier also used a Artificial Neural Network and some dictionaries to create simplifications. There were three main contributions observed in the experiments carried out: a simplifier capable of assisting a proficient speaker in the lexical simplification process, an artificial neural network structure with a tendency to automated learning and the extrinsic comparison of the algorithms. The algorithm Wang2vec Continuous Bag-of-Words performed the best results for the lexical simplification activity during this work’s experiments.O advento das áreas de Inteligência Artificial tem proporcionado o avanço e a criação de soluções aplicadas às mais diversas áreas. Com o Processamento de Linguagem Natural isso não está sendo diferente, nos últimos cinco anos as pesquisas sobre os algoritmos de representação vetorial e captura semântica das palavras obtiveram grandes resultados. Chamados também de word embeddings, esses algoritmos agregam benefícios que métodos anteriores não disponibilizavam. Visando a necessidade de maior estudo sobre esses novos algoritmos, como Skip-Gram, Glove e CBOW e, ao mesmo tempo, observando a importância da automatização de simplificação léxica em benefício de pessoas em aprendizagem do português, disléxicos, portadores de afasia, entre outros, desenvolveu-se neste trabalho um simplificador léxico utilizando-se dessas representações. Esse simplificador utilizou-se também de Rede Neural Artificial e alguns dicionários para criar simplificações. Nos experimentos realizados, gerou-se três contribuições, sendo elas: um simplificador capaz de auxiliar um falante proficiente no processo de simplificação léxica, uma estrutura de rede neural com tendência ao aprendizado automatizado e a comparação extrínseca dos algoritmos. Como melhor algoritmo, nas observações realizadas, o Wang2vec CBOW obteve os melhores resultados para a atividade de simplificação léxica.Universidade Tecnológica Federal do ParanáMedianeiraBrasilGraduação em Ciências da ComputaçãoUTFPRCandido Junior, ArnaldoGavioli, AlanCandido Junior, ArnaldoAikes Junior, JorgeSales, Alisson Mariano de2020-11-16T13:09:48Z2020-11-16T13:09:48Z2017-11-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfSALES, Alisson Mariano de. Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto. 2017. 67 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2017.http://repositorio.utfpr.edu.br/jspui/handle/1/12524porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-11-16T13:09:48Zoai:repositorio.utfpr.edu.br:1/12524Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-16T13:09:48Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto Extrinsic comparison of word embedding algorithms in text lexical simplification |
| title |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| spellingShingle |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto Sales, Alisson Mariano de Computação semântica Processamento de linguagem natural (Computação) Inteligência artificial Semantic computing Natural language processing (Computer science) Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| title_full |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| title_fullStr |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| title_full_unstemmed |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| title_sort |
Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto |
| author |
Sales, Alisson Mariano de |
| author_facet |
Sales, Alisson Mariano de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Candido Junior, Arnaldo Gavioli, Alan Candido Junior, Arnaldo Aikes Junior, Jorge |
| dc.contributor.author.fl_str_mv |
Sales, Alisson Mariano de |
| dc.subject.por.fl_str_mv |
Computação semântica Processamento de linguagem natural (Computação) Inteligência artificial Semantic computing Natural language processing (Computer science) Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
Computação semântica Processamento de linguagem natural (Computação) Inteligência artificial Semantic computing Natural language processing (Computer science) Artificial intelligence CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
The advent of Artificial Intelligence has provided the advance and the creation of solutions applied to the most diverse areas. Within Natural Language Processing this has not been different, in the last five years, the studies of algorithms for vector representation and semantic retrieval of words have shown great advances. Also called word embeddings, these algorithms add benefits that earlier methods did not provide. Aiming at the need to further study these new algorithms, such as Skip-Gram, Glove and CBOW, and at the same time, noting the importance of the automation of lexical simplification for the benefit of Portuguese learners, dyslexics, aphasia, among others, this work proposes the development of a lexical simplifier using these representations. This simplifier also used a Artificial Neural Network and some dictionaries to create simplifications. There were three main contributions observed in the experiments carried out: a simplifier capable of assisting a proficient speaker in the lexical simplification process, an artificial neural network structure with a tendency to automated learning and the extrinsic comparison of the algorithms. The algorithm Wang2vec Continuous Bag-of-Words performed the best results for the lexical simplification activity during this work’s experiments. |
| publishDate |
2017 |
| dc.date.none.fl_str_mv |
2017-11-23 2020-11-16T13:09:48Z 2020-11-16T13:09:48Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SALES, Alisson Mariano de. Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto. 2017. 67 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2017. http://repositorio.utfpr.edu.br/jspui/handle/1/12524 |
| identifier_str_mv |
SALES, Alisson Mariano de. Comparação extrínseca de algoritmos de word embedding na simplificação léxica de texto. 2017. 67 f. Trabalho de Conclusão de Curso (Graduação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2017. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/12524 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira Brasil Graduação em Ciências da Computação UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira Brasil Graduação em Ciências da Computação UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850497824917028864 |