Aplicação de programação genética na análise de sentimentos
Main Author: | |
---|---|
Publication Date: | 2018 |
Format: | Master thesis |
Language: | por |
Source: | Repositório Institucional da UFG |
dARK ID: | ark:/38995/001300000v83c |
Download full: | http://repositorio.bc.ufg.br/tede/handle/tede/9211 |
Summary: | A Web é comumente utilizada como plataforma para debates, opiniões, avaliações, etc. Esses dados permitiram que a área de Análise de Sentimentos (AS) se desenvolvesse para extrair informações e conhecimentos que possam ser utilizados em diferentes aplicações. Entre os desafios da AS, destacam-se a criação de classificadores com boa eficácia. Normalmente, os modelos de classificação gerados são heurísticas específicas, manualmente definidas e pouco adaptáveis a diferentes contextos. Assim, o presente trabalho propõe a geração automatizada de classificadores de sentimentos híbridos – utilizando técnicas de Aprendizado de Máquina (AM) e dicionários léxicos – com o uso da Programação Genética (PG). Com isso, espera-se reduzir o custo de geração dos classificadores e aumentar o poder de predição para cada domínio analisado. A intenção é que esses classificadores sejam competitivos com os algoritmos clássicos empregados na área de AS, generalizáveis, adaptáveis ao contexto e capazes de determinar a relevância de cada um dos dicionários léxicos ao domínio aplicado. Além disso, a ideia é que seja possível a agregação de outras técnicas de AM para a geração de soluções híbridas ainda mais eficazes. Para validar a proposta, foi utilizado o benchmark SemEval 2014 e os resultados mostram que a abordagem de geração automatizada com a PG é promissora, pois os modelos gerados são competitivos e, algumas vezes, superiores aos de outros trabalhos da literatura. A combinação dos classificadores em um comitê mostrou-se eficaz ao aumento do poder de predição do sistema, obtendo resultados superiores à utilização das técnicas individualmente. Por fim, destaca-se a capacidade de customização dos modelos de acordo com o contexto abordado e a possibilidade de transferência de conhecimento dos usuários por meio das funções utilizadas pela PG. |
id |
UFG-2_fd049decfb609097e4308a463c5f1b51 |
---|---|
oai_identifier_str |
oai:null:tede/9211 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
oai:repositorio.bc.ufg.br:tede/1234 |
spelling |
Aplicação de programação genética na análise de sentimentosApplying genetic programming to sentiment analysisAnálise de sentimentosMineração de opiniõesProgramação genéticaClassificadoresSentiment analysisOpinion miningGenetic programmingClassifiersCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOA Web é comumente utilizada como plataforma para debates, opiniões, avaliações, etc. Esses dados permitiram que a área de Análise de Sentimentos (AS) se desenvolvesse para extrair informações e conhecimentos que possam ser utilizados em diferentes aplicações. Entre os desafios da AS, destacam-se a criação de classificadores com boa eficácia. Normalmente, os modelos de classificação gerados são heurísticas específicas, manualmente definidas e pouco adaptáveis a diferentes contextos. Assim, o presente trabalho propõe a geração automatizada de classificadores de sentimentos híbridos – utilizando técnicas de Aprendizado de Máquina (AM) e dicionários léxicos – com o uso da Programação Genética (PG). Com isso, espera-se reduzir o custo de geração dos classificadores e aumentar o poder de predição para cada domínio analisado. A intenção é que esses classificadores sejam competitivos com os algoritmos clássicos empregados na área de AS, generalizáveis, adaptáveis ao contexto e capazes de determinar a relevância de cada um dos dicionários léxicos ao domínio aplicado. Além disso, a ideia é que seja possível a agregação de outras técnicas de AM para a geração de soluções híbridas ainda mais eficazes. Para validar a proposta, foi utilizado o benchmark SemEval 2014 e os resultados mostram que a abordagem de geração automatizada com a PG é promissora, pois os modelos gerados são competitivos e, algumas vezes, superiores aos de outros trabalhos da literatura. A combinação dos classificadores em um comitê mostrou-se eficaz ao aumento do poder de predição do sistema, obtendo resultados superiores à utilização das técnicas individualmente. Por fim, destaca-se a capacidade de customização dos modelos de acordo com o contexto abordado e a possibilidade de transferência de conhecimento dos usuários por meio das funções utilizadas pela PG.The Web is commonly used as a platform for debates, opinions, evaluations, etc. These data allowed the area of Sentiment Analysis (SA) to develop to extract information and knowledge that can be used in different applications. Among the challenges of SA we can highlight the creation of classifiers with good efficacy. Typically, the classification models are generated using specific heuristics, manually defined and not adaptable to different contexts. Thus, this work proposes the automated generation of hybrid SA classifiers - with Machine Learning (ML) techniques and lexical dictionaries - using Genetic Programming (GP). It is expected to reduce the cost of generating the classifiers and increase the predictive power for each domain analyzed. The goal is that these classifiers will be competitive with the classical ML algorithms used in SA, generalizable, adaptable to the context and able to determine the relevance of each lexical to the applied domain. In addition, the aim is allow to aggregate other ML techniques to create even more effective hybrid solutions. In order to validate the proposal, SemEval 2014 benchmark was used. The results show that the approach with GP is promising since the generated models are competitive, and sometimes better, with other researches. The ensemble proved to be effective in increasing the predictive power of the system, obtaining better results than the use of the techniques individually. Finally, we highlight the ability of models customization according to the context approached and the possibility of knowledge transfer of the users through the functions used by GP.Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPqUniversidade Federal de GoiásInstituto de Informática - INF (RG)BrasilUFGPrograma de Pós-graduação em Ciência da Computação (INF)Silva, Nádia Félix Felipe dahttp://lattes.cnpq.br/7864834001694765Camilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/6776569904919279Silva, Nádia Félix Felipe daCamilo Junior, Celso GonçalvesRosa, Thierson CoutoCovões, Thiago FerreiraFernandes, Deborah Silva AlvesBordin Junior, Airton2019-01-09T11:18:52Z2018-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfBORDIN JUNIOR, A. Aplicação de programação genética na análise de sentimentos. 2018. 142 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2018.http://repositorio.bc.ufg.br/tede/handle/tede/9211ark:/38995/001300000v83cporhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFG2019-01-09T11:18:52Zoai:null:tede/9211Repositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342019-01-09T11:18:52Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)false |
dc.title.none.fl_str_mv |
Aplicação de programação genética na análise de sentimentos Applying genetic programming to sentiment analysis |
title |
Aplicação de programação genética na análise de sentimentos |
spellingShingle |
Aplicação de programação genética na análise de sentimentos Bordin Junior, Airton Análise de sentimentos Mineração de opiniões Programação genética Classificadores Sentiment analysis Opinion mining Genetic programming Classifiers CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Aplicação de programação genética na análise de sentimentos |
title_full |
Aplicação de programação genética na análise de sentimentos |
title_fullStr |
Aplicação de programação genética na análise de sentimentos |
title_full_unstemmed |
Aplicação de programação genética na análise de sentimentos |
title_sort |
Aplicação de programação genética na análise de sentimentos |
author |
Bordin Junior, Airton |
author_facet |
Bordin Junior, Airton |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, Nádia Félix Felipe da http://lattes.cnpq.br/7864834001694765 Camilo Junior, Celso Gonçalves http://lattes.cnpq.br/6776569904919279 Silva, Nádia Félix Felipe da Camilo Junior, Celso Gonçalves Rosa, Thierson Couto Covões, Thiago Ferreira Fernandes, Deborah Silva Alves |
dc.contributor.author.fl_str_mv |
Bordin Junior, Airton |
dc.subject.por.fl_str_mv |
Análise de sentimentos Mineração de opiniões Programação genética Classificadores Sentiment analysis Opinion mining Genetic programming Classifiers CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
Análise de sentimentos Mineração de opiniões Programação genética Classificadores Sentiment analysis Opinion mining Genetic programming Classifiers CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
A Web é comumente utilizada como plataforma para debates, opiniões, avaliações, etc. Esses dados permitiram que a área de Análise de Sentimentos (AS) se desenvolvesse para extrair informações e conhecimentos que possam ser utilizados em diferentes aplicações. Entre os desafios da AS, destacam-se a criação de classificadores com boa eficácia. Normalmente, os modelos de classificação gerados são heurísticas específicas, manualmente definidas e pouco adaptáveis a diferentes contextos. Assim, o presente trabalho propõe a geração automatizada de classificadores de sentimentos híbridos – utilizando técnicas de Aprendizado de Máquina (AM) e dicionários léxicos – com o uso da Programação Genética (PG). Com isso, espera-se reduzir o custo de geração dos classificadores e aumentar o poder de predição para cada domínio analisado. A intenção é que esses classificadores sejam competitivos com os algoritmos clássicos empregados na área de AS, generalizáveis, adaptáveis ao contexto e capazes de determinar a relevância de cada um dos dicionários léxicos ao domínio aplicado. Além disso, a ideia é que seja possível a agregação de outras técnicas de AM para a geração de soluções híbridas ainda mais eficazes. Para validar a proposta, foi utilizado o benchmark SemEval 2014 e os resultados mostram que a abordagem de geração automatizada com a PG é promissora, pois os modelos gerados são competitivos e, algumas vezes, superiores aos de outros trabalhos da literatura. A combinação dos classificadores em um comitê mostrou-se eficaz ao aumento do poder de predição do sistema, obtendo resultados superiores à utilização das técnicas individualmente. Por fim, destaca-se a capacidade de customização dos modelos de acordo com o contexto abordado e a possibilidade de transferência de conhecimento dos usuários por meio das funções utilizadas pela PG. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-12-14 2019-01-09T11:18:52Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
BORDIN JUNIOR, A. Aplicação de programação genética na análise de sentimentos. 2018. 142 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2018. http://repositorio.bc.ufg.br/tede/handle/tede/9211 |
dc.identifier.dark.fl_str_mv |
ark:/38995/001300000v83c |
identifier_str_mv |
BORDIN JUNIOR, A. Aplicação de programação genética na análise de sentimentos. 2018. 142 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2018. ark:/38995/001300000v83c |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/9211 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás Instituto de Informática - INF (RG) Brasil UFG Programa de Pós-graduação em Ciência da Computação (INF) |
publisher.none.fl_str_mv |
Universidade Federal de Goiás Instituto de Informática - INF (RG) Brasil UFG Programa de Pós-graduação em Ciência da Computação (INF) |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
grt.bc@ufg.br |
_version_ |
1837198265293996032 |