Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto

Detalhes bibliográficos
Autor(a) principal: SILVA, Gabriel Henrique Daniel da
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPE
dARK ID: ark:/64986/001300001043m
Texto Completo: https://repositorio.ufpe.br/handle/123456789/54067
Resumo: Os serviços de atendimento ao consumidor (SACs) são canais de comunicação entre uma empresa e seus consumidores, possibilitando que os clientes tirem dúvidas, deem sugestões, solicitem informações e registrem reclamações. Com o advento da Internet e das redes sociais, grande parte do contato é feito online através de canais descentralizados que geram uma enorme quantidade de informação textual a ser analisada. Consumidores insatisfeitos e que não se sentem priorizados tendem a se afastar e tomar ações que possam influenciar negativamente na imagem da empresa. Nesse contexto, este trabalho de mestrado propõe um processo para auxiliar as empresas a lidar com essa grande quantidade de reclamações que ficam expostas na Web através do processamento automático dos textos das reclamações. A solução proposta se baseia em uma estratégia de extração automática das reclamações postadas pelos consumidores em sites específicos, seguida de classificação e ranqueamento dessas reclamações, a fim de priorizar as críticas consideradas mais relevantes (i.e., com maior potencial de prejuízo) no momento. O processo proposto foi implementado em três etapas distintas. Inicialmente, foi desenvolvido um módulo para criação do corpus que realiza um scrapping para extração das reclamações a partir de sites na Web. O código foi desenvolvido em Python com o auxílio do framework Selenium. O site escolhido para o protótipo inicial foi o “ReclameAQUI”. A partir dos dados extraídos, foi criado um corpus contendo reclamações que foram etiquetadas manualmente por pessoas com experiência no domínio de atendimento ao consumidor, também foi realizado um pré-processamento textual. A seguir, foi desenvolvido um classificador de texto baseado em Aprendizagem de Máquina usando o corpus etiquetado. Foram realizados diversos experimentos buscando encontrar a combinação de melhor desempenho dentre as opções disponíveis. A configuração que utiliza TF-IDF para transformação de texto, K-Fold Cross Validation no treinamento e Regressão Logística teve o melhor resultado, com acurácia de 82,22%, F-measure de 82,39% e área sob a curva ROC de 0,8881. Por fim, o protótipo implementado também realiza o ranqueamento das reclamações prioritárias, oferecendo ainda a possibilidade de exportação das reclamações de forma ordenada.
id UFPE_9aa9cece5cf5f601d40d967a8e5c6d44
oai_identifier_str oai:repositorio.ufpe.br:123456789/54067
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em textoInteligência computacionalSACExtração de informaçãoAprendizagem de máquinaClassificaçãoOs serviços de atendimento ao consumidor (SACs) são canais de comunicação entre uma empresa e seus consumidores, possibilitando que os clientes tirem dúvidas, deem sugestões, solicitem informações e registrem reclamações. Com o advento da Internet e das redes sociais, grande parte do contato é feito online através de canais descentralizados que geram uma enorme quantidade de informação textual a ser analisada. Consumidores insatisfeitos e que não se sentem priorizados tendem a se afastar e tomar ações que possam influenciar negativamente na imagem da empresa. Nesse contexto, este trabalho de mestrado propõe um processo para auxiliar as empresas a lidar com essa grande quantidade de reclamações que ficam expostas na Web através do processamento automático dos textos das reclamações. A solução proposta se baseia em uma estratégia de extração automática das reclamações postadas pelos consumidores em sites específicos, seguida de classificação e ranqueamento dessas reclamações, a fim de priorizar as críticas consideradas mais relevantes (i.e., com maior potencial de prejuízo) no momento. O processo proposto foi implementado em três etapas distintas. Inicialmente, foi desenvolvido um módulo para criação do corpus que realiza um scrapping para extração das reclamações a partir de sites na Web. O código foi desenvolvido em Python com o auxílio do framework Selenium. O site escolhido para o protótipo inicial foi o “ReclameAQUI”. A partir dos dados extraídos, foi criado um corpus contendo reclamações que foram etiquetadas manualmente por pessoas com experiência no domínio de atendimento ao consumidor, também foi realizado um pré-processamento textual. A seguir, foi desenvolvido um classificador de texto baseado em Aprendizagem de Máquina usando o corpus etiquetado. Foram realizados diversos experimentos buscando encontrar a combinação de melhor desempenho dentre as opções disponíveis. A configuração que utiliza TF-IDF para transformação de texto, K-Fold Cross Validation no treinamento e Regressão Logística teve o melhor resultado, com acurácia de 82,22%, F-measure de 82,39% e área sob a curva ROC de 0,8881. Por fim, o protótipo implementado também realiza o ranqueamento das reclamações prioritárias, oferecendo ainda a possibilidade de exportação das reclamações de forma ordenada.The customer service management (SCMs) are communication channels between a company and their customers. It allows their customers to ask questions, make suggestions, request information and register complaints. With the advent of the internet and social networks, a major part of that contact is now made online by multiple channels which generate a huge quantity of text information to be handled. Dissatisfied customers may cut ties and take actions that can cause negative influence on a company’s image. In this context, this paper proposes a process to help companies to handle the huge amount of complaints which are displayed on the web by automatically processing those complaints. The proposed solution is based on a strategy for automatic extraction of open customer’s complaints at specific websites, followed by classification and ranking of those complaints to prioritize the ones considered most relevant (i.e., with most potential waste) at the time. The proposed process has three distincts modules. The first module was responsible for creating a corpus by making a scrapper to extract the complaints from websites. The code was made in Python with the Selenium Framework. The choosed website for the initial prototype is “ReclameAQUI”. The extracted data was manually labeled by humans with experience with customer service. The second module was responsible for pre-processing the text. The last module develops a machine learning based text classifier using the labeled corpus. A few experiments were carried out to search for the best performance between the available options. The one usings TF-IDF for text transformation, K-Fold Cross Validation on training and Logistic Regression obtained the best result with 82.22% of accuracy, 82.39 of F-measure and 0.8881 of AUC. The implemented prototype ranks the complaints that were classified as significant. It has also the option to export the ordered complaints.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoBARROS, Flávia de Almeidahttp://lattes.cnpq.br/9247743032518953http://lattes.cnpq.br/5390541720896559SILVA, Gabriel Henrique Daniel da2023-12-13T11:42:40Z2023-12-13T11:42:40Z2023-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Gabriel Henrique Daniel da. Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.https://repositorio.ufpe.br/handle/123456789/54067ark:/64986/001300001043mporAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2024-01-05T05:30:43Zoai:repositorio.ufpe.br:123456789/54067Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212024-01-05T05:30:43Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
title Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
spellingShingle Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
SILVA, Gabriel Henrique Daniel da
Inteligência computacional
SAC
Extração de informação
Aprendizagem de máquina
Classificação
title_short Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
title_full Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
title_fullStr Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
title_full_unstemmed Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
title_sort Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto
author SILVA, Gabriel Henrique Daniel da
author_facet SILVA, Gabriel Henrique Daniel da
author_role author
dc.contributor.none.fl_str_mv BARROS, Flávia de Almeida
http://lattes.cnpq.br/9247743032518953
http://lattes.cnpq.br/5390541720896559
dc.contributor.author.fl_str_mv SILVA, Gabriel Henrique Daniel da
dc.subject.por.fl_str_mv Inteligência computacional
SAC
Extração de informação
Aprendizagem de máquina
Classificação
topic Inteligência computacional
SAC
Extração de informação
Aprendizagem de máquina
Classificação
description Os serviços de atendimento ao consumidor (SACs) são canais de comunicação entre uma empresa e seus consumidores, possibilitando que os clientes tirem dúvidas, deem sugestões, solicitem informações e registrem reclamações. Com o advento da Internet e das redes sociais, grande parte do contato é feito online através de canais descentralizados que geram uma enorme quantidade de informação textual a ser analisada. Consumidores insatisfeitos e que não se sentem priorizados tendem a se afastar e tomar ações que possam influenciar negativamente na imagem da empresa. Nesse contexto, este trabalho de mestrado propõe um processo para auxiliar as empresas a lidar com essa grande quantidade de reclamações que ficam expostas na Web através do processamento automático dos textos das reclamações. A solução proposta se baseia em uma estratégia de extração automática das reclamações postadas pelos consumidores em sites específicos, seguida de classificação e ranqueamento dessas reclamações, a fim de priorizar as críticas consideradas mais relevantes (i.e., com maior potencial de prejuízo) no momento. O processo proposto foi implementado em três etapas distintas. Inicialmente, foi desenvolvido um módulo para criação do corpus que realiza um scrapping para extração das reclamações a partir de sites na Web. O código foi desenvolvido em Python com o auxílio do framework Selenium. O site escolhido para o protótipo inicial foi o “ReclameAQUI”. A partir dos dados extraídos, foi criado um corpus contendo reclamações que foram etiquetadas manualmente por pessoas com experiência no domínio de atendimento ao consumidor, também foi realizado um pré-processamento textual. A seguir, foi desenvolvido um classificador de texto baseado em Aprendizagem de Máquina usando o corpus etiquetado. Foram realizados diversos experimentos buscando encontrar a combinação de melhor desempenho dentre as opções disponíveis. A configuração que utiliza TF-IDF para transformação de texto, K-Fold Cross Validation no treinamento e Regressão Logística teve o melhor resultado, com acurácia de 82,22%, F-measure de 82,39% e área sob a curva ROC de 0,8881. Por fim, o protótipo implementado também realiza o ranqueamento das reclamações prioritárias, oferecendo ainda a possibilidade de exportação das reclamações de forma ordenada.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-13T11:42:40Z
2023-12-13T11:42:40Z
2023-08-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Gabriel Henrique Daniel da. Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
https://repositorio.ufpe.br/handle/123456789/54067
dc.identifier.dark.fl_str_mv ark:/64986/001300001043m
identifier_str_mv SILVA, Gabriel Henrique Daniel da. Extração, classificação e priorização de reclamações de consumidores em SACs online baseados em texto. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
ark:/64986/001300001043m
url https://repositorio.ufpe.br/handle/123456789/54067
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1846272648455127040