Elaboração de lista de palavras de acordo com regras de codificação e frequência do português brasileiro

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Rombola, Isabela Tiezi
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/214083
Resumo: A produção da escrita ocorre a partir da interação entre os processos centrais (processos cognitivo-linguísticos) e os processos periféricos (ato motor da escrita), os quais podem ser afetados pelas regras de codificação e frequência das palavras. O objetivo deste estudo foi elaborar uma lista de palavras de acordo com os critérios de codificação de frequência da Língua Portuguesa a fim de auxiliar futuras medidas de interação entre processos centrais e periféricos durante a produção da escrita. Como método, foram utilizadas palavras retiradas de um banco de dados e submetidas aos critérios: a) inclusão e exclusão de palavras do português; b) critérios relacionados às regras de codificação do Português Brasileiro; c) submissão a Juízes; d) critérios de frequência de ocorrência de palavras; e) critério do bigrama. Nos resultados, foram selecionadas 102 palavras de um total de 3.400 palavras. Em relação ao critério de codificação, 414 palavras foram classificadas, sendo 41 como natural (N), 104 dependentes de regras (A1) e 269 independentes de regras (A2). Em relação à frequência, foram selecionadas 12 palavras de alta frequência, 30 palavras de média frequência e 60 palavras de baixa frequência. Quanto à análise dos juízes, verificou-se concordância de 0,952 (Índice Kappa) entre os pares de juízes para as regras de codificação por sílabas e para a classificação das palavras. Para o estabelecimento dos pares de comparação de palavras para o Bigrama, foi necessário inserir também as palavras de média frequência, totalizando 74 pares de palavras, sendo na comparação Natural (N) – 10 pares; Codificação arbitrária (A1) – 9 pares; Codificação arbitrária (A2) – 55 pares. Após análise dos resultados, registraram-se poucas palavras de alta frequência e mais palavras de média e baixa frequência, e constatou-se a possibilidade de criação de uma lista que poderá auxiliar, posteriormente, em análises que verifiquem a interação entre o processo central e periférico. Conclui-se que foi possível elaborar uma lista, sendo de alta, média e baixa frequência e de acordo com os critérios linguísticos de codificação e frequência da Língua Portuguesa.