Export Ready — 

XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas

Bibliographic Details
Main Author: Seno, Eloize
Publication Date: 2022
Other Authors: Caseli, Helena, Inácio, Marcio, Anchiêta, Rafael, Ramisch, Renata
Format: Article
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: https://doi.org/10.21814/lm.14.1.359
Summary: O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.
id RCAP_c54d3c1c6bd421e4f20d00507a7cdd94
oai_identifier_str oai:linguamatica.com:article/359
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling XPTA: um parser AMR para o Português baseado em uma abordagem entre línguasXPTA: an AMR parser for Portuguese based on cross-lingual approachXPTA: um parser AMR para o Português baseado em uma abordagem entre línguasabstract meaning representationsemantic parsercross-lingual approachPortugueserepresentación de significado abstractoanalizador semánticoenfoque multilingüePortuguésrepresentação abstrata de significadoanalisador semânticoabordagem entre línguasPortuguêsO crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.The growing interest in automatic semantic processing, especially by researchers in Natural Language Understanding and Natural Language Generation, has lead to several researches related to the development of semantic parsers. In this context, the semantic representation formalism of AMR (Abstract Meaning Representation) has received the most attention lately, due to its relatively simple way of capturing the meaning of a sentence. The development of AMR parser is mainly based on human-produced reference corpus. However, this resource is still quite scarce for many languages such as Portuguese. For this reason, several works have explored cross-lingual approaches, which make use of corpora and parsers available for a source language, to develop semantic resources to other target languages. Given this context, this paper describes XPTA, an AMR parser for Portuguese which is based on a cross-lingual approach. XPTA makes use of an existing parser for English and several English--Portuguese bilingual resources to map the semantic knowledge available in English to equivalent meaning representation in Portuguese. An automatic evaluation of XPTA showed that the adopted approach is promising and the results obtained for Smatch (66% in the best case) suggest that the model has the potential to compete with the results presented in the literature to others idioms. In addition to the automatic analysis, a qualitative analysis of the graphs produced by the parser allowed to identify and categorize the main mistakes of the model and their possible causes.O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.Universidade do Minho e Universidade de Vigo2022-07-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttps://doi.org/10.21814/lm.14.1.359https://doi.org/10.21814/lm.14.1.359Linguamática; Vol. 14 No. 1; 49-68Linguamática; Vol. 14 Núm. 1; 49-68Linguamática; v. 14 n. 1; 49-681647-0818reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAPporhttps://linguamatica.com/index.php/linguamatica/article/view/359https://linguamatica.com/index.php/linguamatica/article/view/359/484Direitos de Autor (c) 2022 Eloize Seno, Helena Caseli, Marcio Inácio, Rafael Anchiêta, Renata Ramischinfo:eu-repo/semantics/openAccessSeno, EloizeCaseli, HelenaInácio, MarcioAnchiêta, RafaelRamisch, Renata2023-09-08T13:46:45Zoai:linguamatica.com:article/359Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T11:06:31.716179Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
XPTA: an AMR parser for Portuguese based on cross-lingual approach
XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
title XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
spellingShingle XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
Seno, Eloize
abstract meaning representation
semantic parser
cross-lingual approach
Portuguese
representación de significado abstracto
analizador semántico
enfoque multilingüe
Portugués
representação abstrata de significado
analisador semântico
abordagem entre línguas
Português
title_short XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
title_full XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
title_fullStr XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
title_full_unstemmed XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
title_sort XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas
author Seno, Eloize
author_facet Seno, Eloize
Caseli, Helena
Inácio, Marcio
Anchiêta, Rafael
Ramisch, Renata
author_role author
author2 Caseli, Helena
Inácio, Marcio
Anchiêta, Rafael
Ramisch, Renata
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Seno, Eloize
Caseli, Helena
Inácio, Marcio
Anchiêta, Rafael
Ramisch, Renata
dc.subject.por.fl_str_mv abstract meaning representation
semantic parser
cross-lingual approach
Portuguese
representación de significado abstracto
analizador semántico
enfoque multilingüe
Portugués
representação abstrata de significado
analisador semântico
abordagem entre línguas
Português
topic abstract meaning representation
semantic parser
cross-lingual approach
Portuguese
representación de significado abstracto
analizador semántico
enfoque multilingüe
Portugués
representação abstrata de significado
analisador semântico
abordagem entre línguas
Português
description O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.21814/lm.14.1.359
https://doi.org/10.21814/lm.14.1.359
url https://doi.org/10.21814/lm.14.1.359
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://linguamatica.com/index.php/linguamatica/article/view/359
https://linguamatica.com/index.php/linguamatica/article/view/359/484
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
publisher.none.fl_str_mv Universidade do Minho e Universidade de Vigo
dc.source.none.fl_str_mv Linguamática; Vol. 14 No. 1; 49-68
Linguamática; Vol. 14 Núm. 1; 49-68
Linguamática; v. 14 n. 1; 49-68
1647-0818
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833591580660858880