Detalhes bibliográficos
Ano de defesa: |
2021 |
Autor(a) principal: |
Berlanga Neto, Paulo |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-18102021-210029/
|
Resumo: |
Simplificação de texto (ST) é um processo de transformação da linguagem natural para redução de sua complexidade e aumento de sua compreensão. No cerne deste problema, está a necessidade de uma preservação semântica adequada em conjunto com a melhoria da inteligibilidade. No campo de processamento de linguagem natural, abordagens recentes para a tarefa de simplificação automática de textos têm visto este processo de maneira holística ou abrangente. Muitas das ideias aplicadas são emprestadas pela tarefa de tradução automática, considerando que a simplificação pode ser vista como uma ação de tradução monolíngue entre um texto complexo e simples. Ao ponderar ainda que textos considerados complexos podem conter uma parcela de sentenças simples em sua composição, estudos recentes têm endereçado aspectos específicos da linguagem no âmbito de sentenças. Nesta pesquisa, visitamos a tarefa de simplificação automática de sentenças, apresentando características de abordagens recentes e propondo a construção de um pipeline computacional próprio para o aprendizado artificial do método split-and-rephrase. Este método busca particionar uma sentença singular de entrada em duas ou mais sentenças reescritas de saída que juntas mantêm o significado equivalente, com a concepção de que sentenças mais curtas beneficiam a compreensão na leitura humana e aprimoram o desempenho de tarefas relacionadas em processamento de linguagem natural. |