Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo
Main Author: | |
---|---|
Publication Date: | 2014 |
Other Authors: | , , , , , , |
Format: | Article |
Language: | por |
Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
Download full: | http://hdl.handle.net/1822/30669 |
Summary: | Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools |
id |
RCAP_e1b19ffee7d27a2c627e716b57c72fea |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/30669 |
network_acronym_str |
RCAP |
network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository_id_str |
https://opendoar.ac.uk/repository/7160 |
spelling |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneoProcura-PALavras (P-PAL): a new measure of word frequency for contemporary European PortugueseFrequência lexicalBases lexicaisCorpus/corporaPortuguês europeuWord frequencyLexical databasesEuropean PortugueseSocial SciencesNeste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/toolsIn this paper we present the strategies and procedures undertaken in the development of a new measure of lexical frequency of the contemporary European Portuguese – Procura-PALavras (P-PAL). Based on a corpus of over 227 million words, P-PAL offers the default frequency per million words (lemmas and wordforms), and the computation of several other objective (lexical and sublexical) and subjective word metrics. We also describe lexical entry integration and word frequency extraction. The high number of indices and lexical entries makes P-PAL an advanced and indispensable web application for the promotion and internationalization of Portuguese research. P-PAL is available at http://p-pal.di.uminho.pt/toolsFundação para a Ciência e a Tecnologia (FCT)Universidade Federal do Rio Grande do Sul (UFRGS)Universidade do MinhoSoares, Ana PaulaIriarte Sanromán, ÁlvaroAlmeida, J. J.Simões, AlbertoCosta, AnaFrança, Patrícia das Dores Marques da Silva CunhaMachado, João F.Comesaña, Montserrat20142014-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfhttp://hdl.handle.net/1822/30669por0102-797210.1590/S0102-79722014000100013info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T07:25:38Zoai:repositorium.sdum.uminho.pt:1822/30669Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T16:26:37.792572Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
dc.title.none.fl_str_mv |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo Procura-PALavras (P-PAL): a new measure of word frequency for contemporary European Portuguese |
title |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
spellingShingle |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo Soares, Ana Paula Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
title_short |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_full |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_fullStr |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_full_unstemmed |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
title_sort |
Procura-PALavras (P-PAL): uma nova medida de frequência lexical do português europeu contemporâneo |
author |
Soares, Ana Paula |
author_facet |
Soares, Ana Paula Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
author_role |
author |
author2 |
Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
author2_role |
author author author author author author author |
dc.contributor.none.fl_str_mv |
Universidade do Minho |
dc.contributor.author.fl_str_mv |
Soares, Ana Paula Iriarte Sanromán, Álvaro Almeida, J. J. Simões, Alberto Costa, Ana França, Patrícia das Dores Marques da Silva Cunha Machado, João F. Comesaña, Montserrat |
dc.subject.por.fl_str_mv |
Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
topic |
Frequência lexical Bases lexicais Corpus/corpora Português europeu Word frequency Lexical databases European Portuguese Social Sciences |
description |
Neste trabalho apresentamos as estratégias e os procedimentos adoptados na constituição de uma nova medida de frequência lexical do Português Europeu contemporâneo, o Procura-PALavras (P- -PAL). Baseado num corpus de mais de 227 milhões de palavras, o P-PAL é uma aplicação web que oferece, por defeito, valores de frequência lexical para todas as suas entradas lexicais (lemas e formas) e que permite a computação de uma grande diversidade de outras medidas objectivas (lexicais e sublexicais) e subjectivas. Descrevemos ainda o processo de defi nição das suas entradas lexicais e da extracção dos respectivos valores de frequência. O elevado número de índices e de entradas lexicais tornam o P-PAL numa aplicação web avançada e indispensável à promoção e internacionalização da investigação em Portugal. O P-PAL encontra-se disponível em http://p-pal.di.uminho.pt/tools |
publishDate |
2014 |
dc.date.none.fl_str_mv |
2014 2014-01-01T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/1822/30669 |
url |
http://hdl.handle.net/1822/30669 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
0102-7972 10.1590/S0102-79722014000100013 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul (UFRGS) |
publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Sul (UFRGS) |
dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
repository.mail.fl_str_mv |
info@rcaap.pt |
_version_ |
1833595946908254208 |