O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos
Main Author: | |
---|---|
Publication Date: | 2020 |
Other Authors: | , |
Language: | por |
Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
Download full: | http://hdl.handle.net/10400.21/12337 |
Summary: | Neste trabalho propomos uma nova variante do algoritmo Expectation-Maximization para agrupar dados mistos que simultaneamente estima o número de grupos. Recorremos aos modelos demistura finita, pressupondo que os dados categoriais são modeladospor distribuições multinomiais e os métricos por distribuições gaussianas. Para estimar o número de componentes de mistura baseamo-nos no critério Minimum Message Lenght. O desempenho do algoritmo proposto, designado por EM-MML-mix, é comparado com o de outros critérios usados frequentemente para a seleção de modelos de mistura. Desta análise comparativa, realizada sobre dados simulados e sobre um conjunto de dados reais provenientes do European Social Survey, salienta-se o reduzido tempo de computação para a obtenção da solução mediante a metodologia proposta. |
id |
RCAP_1e73c1ebbd012be7e97b79f726c246e5 |
---|---|
oai_identifier_str |
oai:repositorio.ipl.pt:10400.21/12337 |
network_acronym_str |
RCAP |
network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository_id_str |
https://opendoar.ac.uk/repository/7160 |
spelling |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistosClassificação não supervisionadaAnálise de agrupamentoModelos de mistura finitaDados mistosMML - Minimum Message Lenght - criterionNeste trabalho propomos uma nova variante do algoritmo Expectation-Maximization para agrupar dados mistos que simultaneamente estima o número de grupos. Recorremos aos modelos demistura finita, pressupondo que os dados categoriais são modeladospor distribuições multinomiais e os métricos por distribuições gaussianas. Para estimar o número de componentes de mistura baseamo-nos no critério Minimum Message Lenght. O desempenho do algoritmo proposto, designado por EM-MML-mix, é comparado com o de outros critérios usados frequentemente para a seleção de modelos de mistura. Desta análise comparativa, realizada sobre dados simulados e sobre um conjunto de dados reais provenientes do European Social Survey, salienta-se o reduzido tempo de computação para a obtenção da solução mediante a metodologia proposta.Sociedade Portuguesa de EstatísticaRCIPLSilvestre, CláudiaCardoso, Margarida G. M. S.Figueiredo, Mário A. T.2020-11-04T13:39:22Z20202020-01-01T00:00:00Zbook partinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://hdl.handle.net/10400.21/12337por978-972-8890-46-9info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-02-12T09:29:47Zoai:repositorio.ipl.pt:10400.21/12337Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T20:01:14.791792Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
dc.title.none.fl_str_mv |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
title |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
spellingShingle |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos Silvestre, Cláudia Classificação não supervisionada Análise de agrupamento Modelos de mistura finita Dados mistos MML - Minimum Message Lenght - criterion |
title_short |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
title_full |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
title_fullStr |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
title_full_unstemmed |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
title_sort |
O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos |
author |
Silvestre, Cláudia |
author_facet |
Silvestre, Cláudia Cardoso, Margarida G. M. S. Figueiredo, Mário A. T. |
author_role |
author |
author2 |
Cardoso, Margarida G. M. S. Figueiredo, Mário A. T. |
author2_role |
author author |
dc.contributor.none.fl_str_mv |
RCIPL |
dc.contributor.author.fl_str_mv |
Silvestre, Cláudia Cardoso, Margarida G. M. S. Figueiredo, Mário A. T. |
dc.subject.por.fl_str_mv |
Classificação não supervisionada Análise de agrupamento Modelos de mistura finita Dados mistos MML - Minimum Message Lenght - criterion |
topic |
Classificação não supervisionada Análise de agrupamento Modelos de mistura finita Dados mistos MML - Minimum Message Lenght - criterion |
description |
Neste trabalho propomos uma nova variante do algoritmo Expectation-Maximization para agrupar dados mistos que simultaneamente estima o número de grupos. Recorremos aos modelos demistura finita, pressupondo que os dados categoriais são modeladospor distribuições multinomiais e os métricos por distribuições gaussianas. Para estimar o número de componentes de mistura baseamo-nos no critério Minimum Message Lenght. O desempenho do algoritmo proposto, designado por EM-MML-mix, é comparado com o de outros critérios usados frequentemente para a seleção de modelos de mistura. Desta análise comparativa, realizada sobre dados simulados e sobre um conjunto de dados reais provenientes do European Social Survey, salienta-se o reduzido tempo de computação para a obtenção da solução mediante a metodologia proposta. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-11-04T13:39:22Z 2020 2020-01-01T00:00:00Z |
dc.type.driver.fl_str_mv |
book part |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.21/12337 |
url |
http://hdl.handle.net/10400.21/12337 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
978-972-8890-46-9 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Sociedade Portuguesa de Estatística |
publisher.none.fl_str_mv |
Sociedade Portuguesa de Estatística |
dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
repository.mail.fl_str_mv |
info@rcaap.pt |
_version_ |
1833598449270915072 |