MulTeC: A construção de um corpus multimodal em teletandem

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Lopes, Queila Barbosa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/181353
Resumo: O teletandem (TTD), contexto de aprendizagem de línguas telecolaborativo e autônomo (TELLES, 2006), desenvolvido na Unesp há mais de 12 anos, vem promovendo oportunidade de aprendizagem de línguas estrangeiras embasada na autonomia, separação de línguas e reciprocidade, princípios basilares da aprendizagem in tandem, como discutido por Brammerts (1996). Tal contexto de aprendizagem se tornou possível pela utilização das redes telemáticas que viabilizam a aprendizagem de línguas entre aprendizes que residem em países geograficamente distantes. No TTD, os aprendizes realizam sessões orais de teletandem (SOTs) e participam de sessões de mediação. Segundo Aranha e Leone (2016; 2017) essas são macrotarefas a partir das quais ocorrem as microtarefas: produção de diários de aprendizagem, troca de textos entre os participantes, respostas aos questionários inicial e final e uso da ferramenta chat durante a SOT. Esse contexto propicia a geração de uma quantidade significativa de dados multimodais (áudio, vídeo, texto escrito) que podem ser utilizados para pesquisas diversas. O intuito desta pesquisa é a construção de um corpus com os dados produzidos por 112 pares no período de 2012 a 2015. Para a composição do corpus, foram utilizados os dados coletados e armazenados conforme descrito por Aranha, Luvizari-Murad e Moreno (2015) e para a elaboração do corpus utilizei os seguintes procedimentos: a) levantamento das características de cada grupo de teletandem; b) criação de código para identificação dos parceiros; c) criação de códigos para a nomeação dos dados; d) padronização da anonimização dos dados; e) conversão dos dados para formatos compatíveis com diferentes sistemas operacionais; e f) renomeação dos dados a partir de Chanier e Wigham (2016). O MulTeC (Multimodal Teletandem Corpus) é composto por um total de 91 questionários iniciais, 41 questionários finais, 666 diários de aprendizagem, 355 chats, 921 textos produzidos na troca de texto por brasileiros e corrigidos por estadunidenses e 581 horas de gravações em vídeos, com transcrições em andamento. Após a finalização do corpus, percebeu-se a necessidade de ampliação de dados a serem coletados, incluindo a coleta da reunião tutorial e das sessões de mediação em mídia de vídeo ou áudio.