Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Silva, Túlio Ferreira Leite da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/8/8139/tde-18052021-175948/
Resumo: Uma realidade em que internet móvel 5G estará disponível em qualquer lugar do planeta bate à porta. Se a tecnologia anterior (4G) foi diretamente responsável pela possibilidade da revolução causada por Waze, Uber e iFood, ainda não somos capazes de prever o cenário dos próximos anos. A única certeza que temos: haverá muito texto para processar. Nossa contribuição com esta pesquisa, portanto, é a de fornecer atualização a uma proposta dos anos 1980 de utilização da semiótica como ferramenta de representação do conhecimento a ser utilizado por inteligências artificiais no processamento de linguagem natural (PLN). Assim, partimos das contribuições heurísticas fornecidas pela Escola de Paris e de novidades propostas pelo francês Claude Zilberberg, criador da hipótese tensiva. Por meio desse aparato teórico, apresentamos uma análise da estrutura das avaliações de restaurante na plataforma TripAdvisor e propomos um modelo de classificação para colaborar como pré-processamento para a análise de sentimentos. A partir de um corpus manualmente anotado com essa nova proposta, utilizamos elementos do estado da arte em inteligência artificial para PLN (deep learning) e implementamos um sistema automático de classificação. O modelo, desenvolvido para fazer as vezes de prova de conceito, alcança mais de 90% de acurácia. Entretanto, não são poucas as evidências de que esteja havendo sobreajuste (overfitting). Novas pesquisas estão em andamento para sanar este ponto, ainda assim, todo o aparato teórico não é afetado pelos problemas técnicos. Mais do que isso, ainda debatemos neste trabalho formas de vencer tais dificuldades por meio da classificação de mais corpus.