Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo

Bibliographic Details
Main Author: Soares, Ana Paula
Publication Date: 2014
Other Authors: Iriarte Sanromán, Álvaro, Almeida, J. J., Simões, Alberto, Costa, Ana, França, Patrícia das Dores Marques da Silva Cunha, Machado, João F., Comesaña, Montserrat
Format: Article
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/1822/30669
Summary: Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools
id RCAP_e1b19ffee7d27a2c627e716b57c72fea
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/30669
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneoProcura-PALavras (P-PAL): a new measure of word frequency for contemporary European PortugueseFrequência lexicalBases lexicaisCorpus/corporaPortuguês europeuWord frequencyLexical databasesEuropean PortugueseSocial SciencesNeste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/toolsIn this paper we present the strategies and procedures undertaken in the development of a new measure of lexical frequency of the contemporary European Portuguese – Procura-PALavras (P-PAL). Based on a corpus of over 227 million words, P-PAL offers the default frequency per million words (lemmas and wordforms), and the computation of several other objective (lexical and sublexical) and subjective word metrics. We also describe lexical entry integration and word frequency extraction. The high number of indices and lexical entries makes P-PAL an advanced and indispensable web application for the promotion and internationalization of Portuguese research. P-PAL is available at http://p-pal.di.uminho.pt/toolsFundação para a Ciência e a Tecnologia (FCT)Universidade Federal do Rio Grande do Sul (UFRGS)Universidade do MinhoSoares, Ana PaulaIriarte Sanromán, ÁlvaroAlmeida, J. J.Simões, AlbertoCosta, AnaFrança, Patrícia das Dores Marques da Silva CunhaMachado, João F.Comesaña, Montserrat20142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/30669por0102-797210.1590/S0102-79722014000100013info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T07:25:38Zoai:repositorium.sdum.uminho.pt:1822/30669Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T16:26:37.792572Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Procura-PALavras (P-PAL): a new measure of word frequency for contemporary European Portuguese
title Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
spellingShingle Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Soares, Ana Paula
Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
title_short Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_full Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_fullStr Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_full_unstemmed Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
title_sort Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
author Soares, Ana Paula
author_facet Soares, Ana Paula
Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
author_role author
author2 Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
author2_role author
author
author
author
author
author
author
dc.contributor.none.fl_str_mv Universidade do Minho
dc.contributor.author.fl_str_mv Soares, Ana Paula
Iriarte Sanromán, Álvaro
Almeida, J. J.
Simões, Alberto
Costa, Ana
França, Patrícia das Dores Marques da Silva Cunha
Machado, João F.
Comesaña, Montserrat
dc.subject.por.fl_str_mv Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
topic Frequência lexical
Bases lexicais
Corpus/corpora
Português europeu
Word frequency
Lexical databases
European Portuguese
Social Sciences
description Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools
publishDate 2014
dc.date.none.fl_str_mv 2014
2014-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/30669
url http://hdl.handle.net/1822/30669
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 0102-7972
10.1590/S0102-79722014000100013
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul (UFRGS)
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Sul (UFRGS)
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833595946908254208