The information unit of topic: a crosslinguistic, statistical study based on spontaneous speech corpora

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Frederico Amorim Cavalcante
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Minas Gerais
Brasil
FALE - FACULDADE DE LETRAS
Programa de Pós-Graduação em Estudos Linguísticos
UFMG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/33673
Resumo: Realizada nos quadros da Language into Act Theory (L-AcT), esta tese constitui um estudo estatístico e interlinguístico da unidade informacional de Tópico (TOP), cuja função é fornecer um domínio cognitivo para a interpretação do Comentário (COM), ou seja, a unidade informacional que veicula a força ilocucionária. Foram examinados dados de corpora de fala espontânea do italiano (IT), do português europeu (PE) e brasileiro (PB) e do inglês americano (IA), todos compilados segundo os princípios da L-AcT, contendo, portanto, variedade de situações comunicativas, segmentação prosódica e alinhamento texto-som ao nível do enunciado. Alguns desses corpora também possuem anotação informacional, especificamente os minicorpora do IT, PB e IA. Destes, os dois últimos passaram por uma revisão como parte da preparação dos dados pare este estudo. Realizou-se uma discussão das abordagens mais relevantes sobre estrutura informacional em geral, dedicando atenção especial ao termo tópico e as diferentes acepções que apresenta dependendo do quadro teórico considerado. Um teste kappa foi conduzido para estabelecer o grau de acordo entre anotadores numa tarefa de identificação de TOP utilizando-se dados dos corpora C-ORAL-BRASIL II. Fez-se uso da Análise de Dados Funcionais (FDA, da sigla em inglês) e da Análise de Componentes Principais Funcionais (F-PCA, idem) para verificar se as formas prosódicas de TOP propostas em estudos anteriores são separáveis bem como para propor modelos estatísticos para cada uma das formas. Além disso, utilizou-se a Análise de Variância (ANOVA) para verificar se as durações das sílabas nucleares e não nucleares de TOP são significativamente diferentes. Os resultados deste estudo mostram que o acordo entre anotadores na identificação de TOP é substancial. Além disso, os resultados fornecem evidências estatísticas convincentes que corroboram o esquema classificatório de estudos anteriores, os quais não haviam sido validados estatisticamente. O estudo da duração, por sua vez, mostrou que as sílabas nucleares de TOP são significativamente mais longas do que as sílabas não nucleares. Finalmente, as curvas melódicas de TOP foram comparadas a curvas de Comentários Ligados (COB), os quais constituem unidades ilocucionárias que exibem sinal prosódico de continuidade. Isso também foi realizado por meio das técnicas de FDA e F-PCA, com o objetivo de mostrar que o TOP não é meramente uma unidade portadora de sinal de continuidade. A análise mostra que as curvas de f0 de TOP são separáveis das de COB e que, nos casos em que há similaridade formal, o número de sílabas nucleares e a posição dessas sílabas na unidade distinguem claramente o TOP do COB.