Construção automática de resumos gráficos utilizando processamento de linguagem natural

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Santos, Vinicius dos lattes
Orientador(a): Souza, Érica Ferreira de lattes
Banca de defesa: Souza, Érica Ferreira de, Scannavino, Katia Romero Felizardo, Watanabe, Willian Massami, Vijaykumar, Nandamudi Lankalapalli, Junior, Arnaldo Candido
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Programa de Pós-Graduação: Programa de Pós-Graduação em Informática
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/3282
Resumo: Contexto: Estudos secundários, tais como Revisões Sistemáticas da Literatura (RSL) e Mapeamentos Sistemáticos (MS), têm sido cada vez mais utilizados na Engenharia de Software (ES) uma vez que permitem a identificação de evidências disponíveis relacionadas com um tópico de pesquisa. Uma das principais atividades do processo de condução de um estudo secundário é a seleção dos estudos primários, que envolve, em um primeiro momento, a leitura dos resumos dos estudos candidatos. No entanto, com o crescente número de publicações científicas, agregado à baixa qualidade dos seus resumos, torna essa atividade cada vez mais difícil para os pesquisadores. Algumas soluções têm sido propostas para atenuar o problema, entre elas, a utilização dos resumos gráficos baseados em Mapas Conceituais (MC). No entanto, estes resumos são criados de forma manual. Objetivo: este trabalho possui dois objetivos: (i) entender o uso dos MCs na Ciência da Computação, bem como identificar as principais técnicas para geração de MCs a partir do Processamento de Linguagem Natural (PLN); e (ii) propor uma abordagem para a construção automática de resumos gráficos baseados em MCs por meio de técnicas de PLN. Método: inicialmente foram conduzidos dois mapeamentos sistemáticos da literatura para entender o uso dos MCs na ciência da computação e identificar as principais práticas para construção de MCs a partir de PLN. Em seguida, foi definida uma abordagem para construção de resumos gráficos baseados em MCs. Por fim, foram conduzidas avaliações com o objetivo de verificar a qualidade dos MCs gerados. Resultado: O experimento piloto realizado apresentou que os MCs construídos pela iniciativa demonstraram um bom desempenho em termos de extração de conceitos e abrangência ao representar o conteúdo do resumo. Conclusão: Os resultados preliminares apresentados demonstram que a iniciativa proposta pode gerar proposições válidas e representar resumos gráficos por meio de MCs, tornando-se um importante instrumento para sumarizar uma estrutura complexa de informações textuais, contribuindo para a identificação das informações mais importantes de um artigo.