Um sistema de perguntas e respostas com aprendizado por reforço profundo para perguntas complexas utilizando textos e tabelas.

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: José, Marcos Menon
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-01032024-105105/
Resumo: A geração de respostas a questões é um dos principais tópicos atuais em processamento de linguagem natural, podendo ser utilizado em diversas aplicações distintas. Este projeto propõe uma arquitetura original para resolver questões de domínio aberto e multi-hop entre textos e tabelas, utilizando o conjunto de dados OTT-QA para validação e treinamento. Para responder tais questões, é necessário buscar informações em um grande corpus percorrendo vários trechos e tabelas, pois a resposta não pode ser encontrada diretamente; é preciso raciocinar usando diferentes passagens. Uma das soluções mais comuns é recuperar as informações de forma sequencial, onde um texto encontrado ajuda na busca do próximo. Como diferentes modelos podem ter diferentes funções nessa busca iterativa de informações, um desafio é como coordená-los, visto que não há dados rotulados do caminho a ser seguido. Portanto, optou-se por utilizar um modelo treinado por meio de aprendizado por reforço para escolher entre diferentes ferramentas de última geração de forma sequencial até que, ao final, opte por chamar um bloco responsável pela geração da resposta. A nossa arquitetura atingiu F1-score de 19,03, um valor compatível com sistemas iterativos semelhantes da literatura.