Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Sousa, Rogério Figueredo de |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29082023-162952/
|
Resumo: |
A quantidade de dados gerados pelos usuários na Web está aumentando. Entre esses conteúdos, as opiniões são consideradas um caso especial. Esse tipo de texto geralmente inclui coloquialismos, ruídos, erros, gírias, abreviações, etc. Portanto, eles são difíceis de serem processados por máquinas e podem ser difíceis de serem lidos até por seres humanos, em alguns casos. Particularmente, para um consumidor que procura conteúdo útil e de qualidade para ajudar nas suas decisões, como escolher um produto para comprar ou um filme para assistir, esta tarefa está se tornando cada vez mais complicada, devido aos problemas mencionados anteriormente e a grande oferta de opiniões na Web. Nesse contexto, surgiu a tarefa de Modelagem e Predição da Utilidade de Opiniões, cujo principal objetivo é estudar, modelar e processar opiniões geradas por usuários, a fim de selecionar automaticamente as mais úteis e destacá-las para ajudar outros usuários. Prever a utilidade das opiniões não é uma tarefa simples. Muita informação é necessária para caracterizar a utilidade das opiniões e, além disso, a utilidade é considerada um critério subjetivo, dependente de fatores extra-textuais, como a necessidade de informações do próprio leitor e o tempo disponível para leitura e avaliação de opiniões suficientes. Muitos trabalhos foram realizados desde a origem da área, mas, para a língua portuguesa, poucos avanços foram realizados até o momento. Este trabalho de doutorado teve como objetivo investigar e propor métodos para a tarefa de classificação automática da utilidade de opiniões para a língua portuguesa, utilizando informações linguísticas e de metadados disponíveis. Para atingir esse objetivo, um córpus de dois domínios, aplicativos para smartphones e filmes, foi coletado e anotado. Avaliou-se qualitativamente e quantitativamente uma ampla gama de atributos e técnicas que pudessem caracterizar a utilidade das opiniões e, dessa forma, foram descobertos fatores relevantes para a discriminação das opiniões úteis das não úteis. Nesta tese de doutorado, foram discutidos os principais desafios da área de pesquisa, e foi estabelecido um benchmark para a tarefa na língua portuguesa. Além disso, desenvolveu-se um novo método baseado em grafos que pode ser usado como alternativa para classificação da utilidade de opiniões. Por fim, elaboramos um método que pode classificar com excelente acurácia as opiniões de aplicativos e com boa acurácia as opiniões de filmes. |