Estruturas de dados para representação de um léxico bilingue

Detalhes bibliográficos
Autor(a) principal: Costa, Jorge André Nogueira da
Data de Publicação: 2010
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: http://hdl.handle.net/10362/5177
Resumo: Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática
id RCAP_3032ef76616b477a2bcff3a5f3950d2f
oai_identifier_str oai:run.unl.pt:10362/5177
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Estruturas de dados para representação de um léxico bilingueCoberturaCorrespondênciaAlinhamentoTraduçãoLéxicoTrabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaAtravés do processo de tradução, vários textos importantes tornaram-se universais e disponíveis em várias línguas. A globalização torna o processo de tradução cada vez mais crítico, devido à maior quantidade de textos disponíveis online, sendo por isso importante desenvolver novos projectos nesta área. O objectivo desta dissertação foi implementar um sistema para gestão e representação de um léxico bilingue. O léxico bilingue é uma estrutura essencial em ferramentas para tradução e armazena expressões de duas línguas diferentes. A implementação do sistema é baseada em árvores de sufixos generalizadas, uma para cada linguagem representada. As árvores de sufixos são construídas usando o algoritmo de Ukkonen. Na gestão das duas árvores de sufixos definem-se ligações de correspondência entre duas expressões de línguas diferentes, que sejam adicionados ao sistema, marcando-os como tradução um do outro. Porém, a característica única do sistema é a cobertura, que pode ser monolingue ou bilingue. A cobertura monolingue verifica quais os segmentos de uma expressão que se encontram na respectiva árvore. A cobertura bilingue faz a mesma verificação para um par de expressões, analisando depois quais os diferentes pares de segmentos têm ligação de correspondência entre eles. Com este tipo de informação, o sistema torna-se muito útil a aplicações que envolvam extracção de pares de tradução e alinhamento de textos paralelos, permitindo descobrir traduções que sejam desconhecidas. No final, é feita uma comparação da eficiência das operações de cobertura com uma implementação baseada nas árvores de sufixos, contra uma implementação baseada em arrays de sufixos.Faculdade de Ciências e TecnologiaRusso, LuísLopes, José Gabriel PereiraRUNCosta, Jorge André Nogueira da2011-02-18T11:13:51Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/5177porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-22T17:08:30Zoai:run.unl.pt:10362/5177Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T16:39:26.371960Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Estruturas de dados para representação de um léxico bilingue
title Estruturas de dados para representação de um léxico bilingue
spellingShingle Estruturas de dados para representação de um léxico bilingue
Costa, Jorge André Nogueira da
Cobertura
Correspondência
Alinhamento
Tradução
Léxico
title_short Estruturas de dados para representação de um léxico bilingue
title_full Estruturas de dados para representação de um léxico bilingue
title_fullStr Estruturas de dados para representação de um léxico bilingue
title_full_unstemmed Estruturas de dados para representação de um léxico bilingue
title_sort Estruturas de dados para representação de um léxico bilingue
author Costa, Jorge André Nogueira da
author_facet Costa, Jorge André Nogueira da
author_role author
dc.contributor.none.fl_str_mv Russo, Luís
Lopes, José Gabriel Pereira
RUN
dc.contributor.author.fl_str_mv Costa, Jorge André Nogueira da
dc.subject.por.fl_str_mv Cobertura
Correspondência
Alinhamento
Tradução
Léxico
topic Cobertura
Correspondência
Alinhamento
Tradução
Léxico
description Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática
publishDate 2010
dc.date.none.fl_str_mv 2010
2010-01-01T00:00:00Z
2011-02-18T11:13:51Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/5177
url http://hdl.handle.net/10362/5177
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833596090539048960