Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas

Bibliographic Details
Main Author: Rocha, João Pedro
Publication Date: 2023
Format: Master thesis
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10773/41898
Summary: Com certa frequência, quer-se calcular a associação entre duas variáveis categóricas dada uma tabela de contingência esparsa r × c. Nestas condições, a estatística de Pearson, utilizada em testes de independência, pode não ser adequadamente aproximada pela distribuição qui-quadrado, condicionando qualquer tipo de inferência, e consequentemente, o cálculo de intervalos de confiança para coeficientes de associação partindo da estatística de Pearson. Para solucionar o problema, na presente dissertação, recorreu-se à técnica de reamostragem bootstrap, mais especificamente, ao plano de amostragem não paramétrico desta técnica. A partir de tabelas bootstrap geradas, pôde definir-se intervalos de confiança para tentar cobrir os coeficientes de associação V de Cramér, V de Bergsma e W de Kvålseth por meio dos métodos bootstrap Basic, Percentile e Bias Corrected accelerated (BCa). Foi realizado um estudo de simulação com o objetivo de entender o desempenho dos métodos bootstrap para obter intervalos de confiança para os coeficientes de associação mencionados, dada certa tabela de contingência. O estudo consiste na avaliação de estimativas da probabilidade de cobertura e da amplitude média dos vários tipos de intervalos bootstrap para diversos casos de tabelas sintéticas e um caso real. Os resultados sugerem que, por exemplo, para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação elevada, se utilize os intervalos BCa para cobrir o coeficiente V de Cramér. Já para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação baixa, os resultados sugerem que se utilize os intervalos Percentile para cobrir o coeficiente V de Bergsma.
id RCAP_0dd68c5c5f59be32e5fc25ebe874c39c
oai_identifier_str oai:ria.ua.pt:10773/41898
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsasTabela de contingênciaEsparsidadeEstatística de PearsonV de CramérV de BergsmaW de KvålsethBootstrapIntervalo de confiançaEstudo de simulaçãoProbabilidade de coberturaCom certa frequência, quer-se calcular a associação entre duas variáveis categóricas dada uma tabela de contingência esparsa r × c. Nestas condições, a estatística de Pearson, utilizada em testes de independência, pode não ser adequadamente aproximada pela distribuição qui-quadrado, condicionando qualquer tipo de inferência, e consequentemente, o cálculo de intervalos de confiança para coeficientes de associação partindo da estatística de Pearson. Para solucionar o problema, na presente dissertação, recorreu-se à técnica de reamostragem bootstrap, mais especificamente, ao plano de amostragem não paramétrico desta técnica. A partir de tabelas bootstrap geradas, pôde definir-se intervalos de confiança para tentar cobrir os coeficientes de associação V de Cramér, V de Bergsma e W de Kvålseth por meio dos métodos bootstrap Basic, Percentile e Bias Corrected accelerated (BCa). Foi realizado um estudo de simulação com o objetivo de entender o desempenho dos métodos bootstrap para obter intervalos de confiança para os coeficientes de associação mencionados, dada certa tabela de contingência. O estudo consiste na avaliação de estimativas da probabilidade de cobertura e da amplitude média dos vários tipos de intervalos bootstrap para diversos casos de tabelas sintéticas e um caso real. Os resultados sugerem que, por exemplo, para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação elevada, se utilize os intervalos BCa para cobrir o coeficiente V de Cramér. Já para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação baixa, os resultados sugerem que se utilize os intervalos Percentile para cobrir o coeficiente V de Bergsma.Quite often, one wants to calculate the association between two categorical variables given a sparse contingency table r × c. Under these conditions, Pearson’s statistics, used in independence tests, may not be adequately approximated by the chi-square distribution, conditioning any type of inference, and consequently, the calculation of confidence intervals for association coefficients based on Pearson’s statistic. To solve the problem, in this dissertation, we used the bootstrap resampling technique, more specifically, the non-parametric sampling plan of this technique. From generated bootstrap tables, confidence intervals were defined to try to cover the association coefficients V of Cramér, V of Bergsma and W of Kvålseth by way of the Basic, Percentile and Bias Corrected accelerated (BCa) bootstrap methods. A simulation study was carried out with the objective of understanding the performance of the bootstrap methods to obtain confidence intervals for the association coefficients mentioned, given a certain contingency table. The study consists of evaluating estimates of the probability of coverage and the average amplitude of various types of bootstrap intervals for different cases of synthetic tables and a real case. The results suggest that, for example, for sparse tables with normal marginal distribution, dimension 2 × 3 and high correlation, we use the BCa intervals to cover the Cramér’s V coefficient. For sparse tables with normal marginal distribution, dimension 2 × 3 and low correlation, the results suggest using Percentile intervals to cover Bergsma’s V coefficient.2024-05-20T09:59:59Z2023-11-29T00:00:00Z2023-11-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/41898porRocha, João Pedroinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-27T01:46:43Zoai:ria.ua.pt:10773/41898Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T17:52:33.868549Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
title Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
spellingShingle Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
Rocha, João Pedro
Tabela de contingência
Esparsidade
Estatística de Pearson
V de Cramér
V de Bergsma
W de Kvålseth
Bootstrap
Intervalo de confiança
Estudo de simulação
Probabilidade de cobertura
title_short Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
title_full Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
title_fullStr Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
title_full_unstemmed Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
title_sort Intervalos de confiança bootstrap para coeficientes de associação em tabelas esparsas
author Rocha, João Pedro
author_facet Rocha, João Pedro
author_role author
dc.contributor.author.fl_str_mv Rocha, João Pedro
dc.subject.por.fl_str_mv Tabela de contingência
Esparsidade
Estatística de Pearson
V de Cramér
V de Bergsma
W de Kvålseth
Bootstrap
Intervalo de confiança
Estudo de simulação
Probabilidade de cobertura
topic Tabela de contingência
Esparsidade
Estatística de Pearson
V de Cramér
V de Bergsma
W de Kvålseth
Bootstrap
Intervalo de confiança
Estudo de simulação
Probabilidade de cobertura
description Com certa frequência, quer-se calcular a associação entre duas variáveis categóricas dada uma tabela de contingência esparsa r × c. Nestas condições, a estatística de Pearson, utilizada em testes de independência, pode não ser adequadamente aproximada pela distribuição qui-quadrado, condicionando qualquer tipo de inferência, e consequentemente, o cálculo de intervalos de confiança para coeficientes de associação partindo da estatística de Pearson. Para solucionar o problema, na presente dissertação, recorreu-se à técnica de reamostragem bootstrap, mais especificamente, ao plano de amostragem não paramétrico desta técnica. A partir de tabelas bootstrap geradas, pôde definir-se intervalos de confiança para tentar cobrir os coeficientes de associação V de Cramér, V de Bergsma e W de Kvålseth por meio dos métodos bootstrap Basic, Percentile e Bias Corrected accelerated (BCa). Foi realizado um estudo de simulação com o objetivo de entender o desempenho dos métodos bootstrap para obter intervalos de confiança para os coeficientes de associação mencionados, dada certa tabela de contingência. O estudo consiste na avaliação de estimativas da probabilidade de cobertura e da amplitude média dos vários tipos de intervalos bootstrap para diversos casos de tabelas sintéticas e um caso real. Os resultados sugerem que, por exemplo, para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação elevada, se utilize os intervalos BCa para cobrir o coeficiente V de Cramér. Já para tabelas esparsas com distribuição marginal normal, dimensão 2 × 3 e correlação baixa, os resultados sugerem que se utilize os intervalos Percentile para cobrir o coeficiente V de Bergsma.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-29T00:00:00Z
2023-11-29
2024-05-20T09:59:59Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/41898
url http://hdl.handle.net/10773/41898
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833597029812535296