Analisador sintático estatístico orientado ao núcleo-léxico para a Língua Portuguesa

Detalhes bibliográficos
Ano de defesa: 2003
Autor(a) principal: Sousa, Fabiano de Carvalho e
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-133820/
Resumo: O desenvolvimento do Corpus Tycho Brahe do Português histórico anotado sintaticamente motivou a criação de uma ferramenta automática para a geração das árvores sintáticas das sentenças de um texto. Com este fim, utilizamos um método já desenvolvido e aplicado para a mesma tarefa aplicada ao Inglês, que utiliza um modelo estatístico orientado ao núcleo-léxico através da definição das dependências léxicas presentes na sentença. Neste trabalho, estudamos tal método aplicado à Língua Portuguesa, chegando até a implementação de dois sistemas automáticos para análise sintática. O primeiro utiliza o modelo baseado em dependências léxicas e o segundo baseia-se em regras gramaticais livre de contexto probabilísticas. Desta forma, esperamos não só auxiliar o processo de anotação sintática do corpus Tsycho mBrahe como também apresentar os primeiros resultados comparativos de acurácia do método escolhido aplicado ao Português