Modelagem construcional de anáforas pronominais na FrameNet Brasil: contribuições para o mapeamento computacional da referência

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Santos, Bárbara Dias lattes
Orientador(a): Torrent, Tiago Timponi lattes
Banca de defesa: Lacerda, Fabiane Amaral da Cunha lattes, Vieira, Márcia Machado
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Juiz de Fora (UFJF)
Programa de Pós-Graduação: Programa de Pós-graduação em Letras: Linguística
Departamento: Faculdade de Letras
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://doi.org/10.34019/ufjf/di/2022/00392
https://repositorio.ufjf.br/jspui/handle/ufjf/15270
Resumo: O trabalho apresentado nesta dissertação se insere nos estudos desenvolvidos pela FrameNet Brasil (FN-Br). Por meio dos pressupostos teóricos da Semântica de Frames (FILLMORE, 1982) e da Gramática de Construções de Berkeley (KAY; FILLMORE, 1999), este trabalho tem como objetivos (i) fornecer o tratamento linguístico-computacional das construções anafóricas pronominais no português brasileiro; (ii) discutir a aplicação do modelo do Constructicon em métodos de extração de informação. Para atingir esses objetivos, o trabalho conta com uma metodologia dividida em: apresentação do corpus de análise, cadastramento de construções, análise de ocorrências, modelagem e experimento de reconhecimento de construções. Assim, este trabalho propõe uma representação linguística e computacional das construções anafóricas pronominais demonstrativas, possessivas, reflexivas, relativas, indefinidas, nominativas, oblíquas e de tratamento. Por meio da análise de dados em dois corpora General e Natural Language Generation, constatamos a diversidade dos padrões anafóricos pronominais em língua portuguesa. A partir disso, modelamos computacionalmente as construções por tipo de anáfora e definimos os elementos que compõem a estrutura: o antecedente e o pronome. Depois, limitamos morfossintática e semanticamente os elementos que constituem as estruturas por meio de constraints baseados em Universal Dependencies (UDs), ordem de constituintes e frames. Por fim, implementamos um sistema de reconhecimento de construções anafóricas pronominais e de seus antecedentes a partir das construções modeladas no Constructicon e quantificamos os dados obtidos. Os resultados apontam para o mapeamento correto dos elementos antecedentes pela aplicação do modelo em contextos que o antecedente localiza-se próximo ao pronome anafórico. Por outro lado, o modelo não obteve o resultado esperado em contextos que os antecedentes são sintagmas nominais complexos, entidades nomeadas, elipses ou estão localizados fora do limite da sentença. Tais limitações estão relacionadas a três fatores: às deficiências do modelo propriamente dito, à base de dados da FN-Br que não processa entidades nomeadas e, por fim, ao funcionamento do parser UD - que processa itens lexicais em uma sentença por vez. Os resultados reforçam a necessidade de ampliação da cobertura do Constructicon da FN-Br.