Detalhes bibliográficos
Ano de defesa: |
2017 |
Autor(a) principal: |
Aguiar, Luís Henrique Gonçalves de |
Orientador(a): |
Guelpeli, Marcus Vinícius Carvalho |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
UFVJM
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Link de acesso: |
https://acervo.ufvjm.edu.br/items/7035e341-09db-479e-90ff-26af7be1c7e4
|
Resumo: |
Considerando a grande quantidade de informações textuais disponíveis atualmente, principalmente na web, está se tronando cada vez mais difícil o acesso e a assimilação desse conteúdo para o usuário. Nesse contexto, torna-se necessário buscar tarefas capazes de transformar essa grande quantidade de dados em conhecimento útil e organizado. Uma alternativa para amenizar esse problema, é reduzir o volume de informações disponíveis a partir da produção de resumos dos textos originais, por meio da sumarização automática (SA) de textos. A sumarização automática de textos consiste na produção automática de resumos a partir de um ou mais textos-fonte, de modo que o sumário contenha as informações mais relevantes deste. A avaliação de resumos é uma tarefa importante no campo da sumarização automática de texto, a abordagem mais intuitiva é a avaliação humana, porém é onerosa e improdutiva. Outra alternativa é a avaliação automática, alguns avaliadores foram propostos, sendo a mais conhecida e amplamente usada é a medida ROUGE (Recall-Oriented Understudy for Gisting Evaluation). Um fator limitante na avaliação da ROUGE é a utilização do sumário humano de referência, o que implica em uma restrição do idioma e domínio, além de requerer um trabalho humano demorado e oneroso. Diante das dificuldades encontradas na avaliação de sumários automáticos, o presente trabalho apresenta o modelo Cassiopeia como um novo método de avaliação. O modelo é um agrupador de textos hierárquico, o qual consiste no uso da sumarização na etapa do pré-processamento, onde a qualidade do agrupamento é influenciada positivamente conforme a qualidade da sumarização. As simulações realizadas neste trabalho mostraram que a avaliação realizada pelo modelo Cassiopeia é semelhante a avaliação realizada pela ferramenta ROUGE. Por outro lado, a utilização do modelo Cassiopeia como avaliador de sumários automáticos evidenciou algumas vantagens, sendo as principais; a não utilização do sumário humano no processo de avaliação, e a independência do domínio e do idioma. |