Detalhes bibliográficos
Ano de defesa: |
2004 |
Autor(a) principal: |
Hirohashi, Alexandre |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-142722/
|
Resumo: |
As ferramentas de lingüística computacional atuais geralmente são baseadas num léxico que contém apenas palavras normatizadas, ou seja, dentro da norma ortográfica vigente. No entanto, textos históricos possuem, muitas vezes, ortografias não-normatizadas. Para viabilizar o uso de ferramentas de lingüística computacional em textos históricos, almejamos construir um normatizador automático do Português. Com esse fim, propomos neste estudo um mecanismo de transformação de palavras não normatizadas baseado em regras de substituição. Além disso, apresentamos um mecanismo que mede, indiretamente, a eficácia de regras para a sua seleção em uma fase de treinamento. |