FRASEOLOGIA E INFORMÁTICA: CONSTITUIÇÃO DE CORPUS DE COMENTÁRIOS DO TWITTER PARA O ESTUDO DE EXPRESSÕES IDIOMÁTICAS

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: MARINA LUZ
Orientador(a): Elizabete Aparecida Marques
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Fundação Universidade Federal de Mato Grosso do Sul
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufms.br/handle/123456789/4513
Resumo: Desde las primeras investigaciones, los estudios del léxico se han vuelto hacia las necesidades comunicativas del hombre. Teniendo en cuenta que los contextos y propósitos de comunicación interfieren en la selección léxica de los individuos, se reitera la relación inseparable y continua entre lengua, sociedad y cultura (BARBOSA, 1987, p. 158), en el que primero está diseñado como un fenómeno social de “naturaleza dinámica” (BIDERMAN, 1992, p.32) capaz de perpetuar la herencia cultural de un pueblo. Ese proceso comunicativo se ve potenciado día a día por las interacciones que proponen las redes sociales, entornos virtuales de socialización que permiten una expresión espontánea y despejada del lenguaje, especialmente las locuciones. Objeto de estudio de este trabajo, las locuciones se definen como estructuras léxicas complejas, plurilexicales, indecomponibles, con sentido figurativo y cristalizadas por la tradición cultural (XATARA, 1998). En este escenario, se diseña esta investigación que, en una perspectiva general tiene como objetivo la elaboración de un corpus lingüístico de locuciones, a través de una base de datos de comentarios recolectados de la red social Twitter. Aliado a este propósito, en específico, se lleva a cabo la elaboración de códigos de computacionales para ayudar a las herramientas de software que recolectan los textos de la base de datos, así como una discusión considerando la hipótesis de que los usuarios de Twitter empleen el uso de un lenguaje más coloquial. La investigación se sustenta en las bases teóricas de la Lexicología, Fraseología, Lingüística Computacional y Lingüística de Corpus. La metodología utilizada en esta investigación es descriptiva y cuantitativa. Los resultados obtenidos ensamblan una base de datos de recopilaciones diarias de tweets, durante un período de 6 meses, de diciembre de 2020 a mayo de 2021, así como una muestra que contiene 232 locuciones, las cuáles, el 50% son somáticas. Además, los hashtags “#” con temas relacionados con reality shows y política fueron más productivos.