Um texto tão singular quanto a impressão digital: o uso de sistemas inteligentes para reconhecimento de autoria

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Rocha, Marcella Andrade da
Orientador(a): Valentim, Ricardo Alexsandro de Medeiros
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/28132
Resumo: A Atribuição de Autoria, a ciência de inferir um autor para um determinado texto com base em suas características de escrita, é um problema com uma longa história e referese a tarefa de reconhecimento do autor de um texto em um grupo de autores candidatos. Neste trabalho, está sendo proposto o estudo do problema de atribuição e reconhecimento de autoria para fins de torná-lo uma ferramenta de uso na plataforma de ensino a distância do Ministério da Saúde (MS), AVASUS. Serão apresentadas as técnicas de análise de texto e extração de características estilométricas dos autores que permitem que a autoria seja determinada em índices significativamente melhores, no qual os textos são maiores que 30 caracteres. Esta dissertação tem como alvo o AVASUS, onde os estudantes fazem os cursos da plataforma, compartilham seus interesses e pensamentos em forma de mensagens nos fóruns e executam atividades que exigem textos sobre determinados temas na área da saúde. Essas produções escritas são o foco da aplicação de atribuição e reconhecimento de autoria. As técnicas estudadas como proposta são um processo de dois estágios, onde no primeiro estágio, informações estilométricas são extraídas do conjunto de dados coletados e no segundo estágio, diferentes algoritmos de classificação são treinados e técnicas de análise léxicas, semânticas ou sintáticas são aplicadas para prever os autores dos textos. O esforço é para maximizar a precisão das previsões com quantidade ideal de dados e usuários em consideração.