Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue

Bibliographic Details
Main Author: Gomes, Gonçalo Nuno Ramos
Publication Date: 2010
Format: Master thesis
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10362/4863
Summary: Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática
id RCAP_0e1eea9714fb0b69b6d17dd44b36b75e
oai_identifier_str oai:run.unl.pt:10362/4863
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingueTradução automáticaAlinhamento de textos paralelosExtracção de equivalentes de traduçãoGeração automática de léxicos multilinguesLíngua pivôTrabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia InformáticaA construção automática de léxicos bilingues é indispensável para aplicações como o acesso a informação disponível em várias línguas, a tradução automática, a construção de ontologias multilingues, entre outras. Nos últimos anos tem havido alguma actividade no sentido de extrair traduções auxiliadas por léxicos bilingues existentes entre línguas com maiores recursos, X-Y e Y-Z, por exemplo, para pares de línguas com menores recursos, X-Z, utilizando uma das línguas com mais recursos (a língua Y, no caso) como língua pivô. Neste trabalho, assume-se o Português (PT) como língua pivô. Dada a existência de um léxico de traduções de palavras e de multi-palavras minimamente desenvolvido, com cerca de 200.000 entradas, entre Português e Inglês (EN), partindo da semelhança estrutural e lexical das línguas Portuguesa e Espanhola (ES), extraiu-se traduções de palavras para o par EN-ES, utilizando um corpus de textos paralelos (dois textos são paralelos se forem tradução um do outro ou ambos forem tradução de um mesmo texto fonte), existente para todas as línguas da União Europeia,detectando primeiro as palavras que possam ser cognatas (semelhantes na forma e com o mesmo significado). Considerando as entradas do léxico bilingue PT-EN, identificou-se as possíveis traduções em Inglês das palavras espanholas cognatas com palavras portuguesas previamente identificadas. Em seguida, os possíveis cognatos entre Português e Espanhol e as possíveis traduções de Espanhol em Inglês foram avaliadas adicionalmente quanto à sua semelhança nos textos da colecção em que ocorrem, recorrendo a medidas de semelhança utilizadas para estes efeitos e definindo um limiar de semelhança para a aceitação dos cognatos entre PT e ES como traduções e das traduções inferidas, entre o Espanhol e o Inglês, via o léxico bilingue PT-EN. Os resultados foram avaliados manualmente. Conseguiu-se aumentar a produtividade dos avaliadores das traduções de termos, passando-lhes traduções com um elevado grau de precisão. Discute-se, os resultados obtidos fazendo variar: o grau de semelhança entre possíveis cognatos, a medida de semelhança entre termos de línguas diferentes, distinguindo-se também o tipo de contextos em que ocorrem (textos completos paralelos, frases paralelas ou segmentos mais curtos obtidos pelo alinhamento realizado) e os limiares de aceitação utilizados.Faculdade de Ciências e TecnologiaLopes, José Gabriel PereiraRUNGomes, Gonçalo Nuno Ramos2011-01-17T16:27:04Z20102010-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10362/4863porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-22T17:08:07Zoai:run.unl.pt:10362/4863Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T16:39:11.062229Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
title Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
spellingShingle Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
Gomes, Gonçalo Nuno Ramos
Tradução automática
Alinhamento de textos paralelos
Extracção de equivalentes de tradução
Geração automática de léxicos multilingues
Língua pivô
title_short Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
title_full Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
title_fullStr Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
title_full_unstemmed Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
title_sort Suporte à extracção de traduções de termos simples ou compostos em ambiente multilingue
author Gomes, Gonçalo Nuno Ramos
author_facet Gomes, Gonçalo Nuno Ramos
author_role author
dc.contributor.none.fl_str_mv Lopes, José Gabriel Pereira
RUN
dc.contributor.author.fl_str_mv Gomes, Gonçalo Nuno Ramos
dc.subject.por.fl_str_mv Tradução automática
Alinhamento de textos paralelos
Extracção de equivalentes de tradução
Geração automática de léxicos multilingues
Língua pivô
topic Tradução automática
Alinhamento de textos paralelos
Extracção de equivalentes de tradução
Geração automática de léxicos multilingues
Língua pivô
description Trabalho apresentado no âmbito do Mestrado em Engenharia Informática, como requisito parcial para obtenção do grau de Mestre em Engenharia Informática
publishDate 2010
dc.date.none.fl_str_mv 2010
2010-01-01T00:00:00Z
2011-01-17T16:27:04Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10362/4863
url http://hdl.handle.net/10362/4863
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
publisher.none.fl_str_mv Faculdade de Ciências e Tecnologia
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833596085664219136