Aprendizado de regras de substituição para normatização de textos históricos

Detalhes bibliográficos
Ano de defesa: 2004
Autor(a) principal: Hirohashi, Alexandre
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-142722/
Resumo: As ferramentas de lingüística computacional atuais geralmente são baseadas num léxico que contém apenas palavras normatizadas, ou seja, dentro da norma ortográfica vigente. No entanto, textos históricos possuem, muitas vezes, ortografias não-normatizadas. Para viabilizar o uso de ferramentas de lingüística computacional em textos históricos, almejamos construir um normatizador automático do Português. Com esse fim, propomos neste estudo um mecanismo de transformação de palavras não normatizadas baseado em regras de substituição. Além disso, apresentamos um mecanismo que mede, indiretamente, a eficácia de regras para a sua seleção em uma fase de treinamento.