Detalhes bibliográficos
Ano de defesa: |
2024 |
Autor(a) principal: |
Divino, Luiza Sarmento |
Orientador(a): |
Schoffen, Juliana Roquele |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Palavras-chave em Inglês: |
|
Link de acesso: |
http://hdl.handle.net/10183/282481
|
Resumo: |
Desde a virada do milênio, percebe-se o aumento do interesse no uso da Linguística de Corpus para informar a validação de exames de língua (Cushing, 2017; 2022), havendo um aumento significativo no uso de corpora de línguas adicionais em pesquisas voltadas para avaliações de proficiência (Wisniewski, 2017). Resultados destas pesquisas são úteis para um maior entendimento das classificações de proficiência em um nível empírico (Callies; Díez-Bedmar; Zaytseva, 2014; Barker; Salamoura; Saville; 2015; Callies; Götz, 2015). O Celpe-Bras, Certificado de Proficiência em Língua Portuguesa para Estrangeiros, é um exame brasileiro que busca avaliar as práticas linguísticas em Português como Língua Adicional em contextos variados (Brasil, 2020). Com o intuito de dar seguimento a trabalhos que se debruçaram sobre os níveis de proficiência escrita avaliados no Celpe-Bras (Sirianni, 2016; Mendel, 2019; Divino, 2021; Hanauer, 2023; Schoffen; Divino, 2023; Sostruznik, 2023), esta dissertação se propõe a responder à pergunta: Como as análises lexicais realizadas com ferramentas de Linguística de Corpus podem contribuir para a descrição dos níveis de proficiência em tarefas de leitura e escrita no exame Celpe-Bras? Para isto, foi analisado um corpus não anotado de 2.293 textos produzidos por examinandos em resposta à Tarefa 4 da edição de 2015/2 do Celpe-Bras, avaliados com notas 0, 1, 2, 3, 4 e 5 (CorCel20152t4). Os objetivos específicos se dividem em três grupos: o primeiro deles diz respeito à extensão dos textos, incluindo análises das quantidades totais, médias e normalizadas de types, tokens e sentenças, bem como o cálculo Type-Token-Ratio; o segundo grupo é voltado para a relação do léxico utilizado em cada subcorpus com o material de insumo, com análises de n-grams, keywords e wordlists no Sketch Engine (Kilgarriff et al., 2004); e o terceiro grupo se refere à incidência de termos relacionados à configuração da relação de interlocução dentro do gênero do discurso proposto, com foco na ferramenta concordance do Sketch Engine. Os resultados sugerem que a extensão dos textos é um fator importante no que diz respeito à proficiência, com textos mais avançados sendo, em geral, maiores. Quanto aos termos relacionados à construção do gênero, estes são mais recorrentes conforme a nota aumenta, mas não estão presentes em 100% dos textos, confirmando que há diversas possibilidades de se cumprir adequadamente a tarefa. Os dados também desmistificam a ideia de que a cópia é realizada apenas nos níveis mais baixos: apesar da quantidade de cópias de trechos mais longos ser, proporcionalmente, mais alta nos corpora n3, n2 e n1 do que nos corpora n5 e n4, foram encontrados n-grams com cópia de fragmentos do material de insumo em todas as notas. Foi identificado ainda que o corpus n5 apresenta mais palavras diferentes das que constam no material de insumo, mas que são morfologicamente semelhantes às apresentadas neste material. Com isto, infere-se que estes examinandos conseguem transitar mais na língua portuguesa ao demonstrarem conhecer seu funcionamento. |