Funções de covariância e robustez a outliers em processos Gaussianos
Main Author: | |
---|---|
Publication Date: | 2025 |
Format: | Master thesis |
Language: | por |
Source: | Repositório Institucional da Universidade Federal do Ceará (UFC) |
Download full: | http://repositorio.ufc.br/handle/riufc/80973 |
Summary: | In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors. |
id |
UFC-7_9cbfdd7523a53424f6f9026d6d9de14b |
---|---|
oai_identifier_str |
oai:repositorio.ufc.br:riufc/80973 |
network_acronym_str |
UFC-7 |
network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository_id_str |
|
spelling |
Funções de covariância e robustez a outliers em processos GaussianosCovariance functions and robustness to outliers in Gaussian processesProcessos gaussianosKernelOutliersGaussian processesKernelOutliersCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOSIn Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.Na Teoria de Regressão, os Processos Gaussianos surgem como uma alternativa eficiente para simplificar a obtenção de estimativas em Modelos Bayesianos. Um Processo Gaussiano é uma generalização da distribuição gaussiana, totalmente definido por sua média e função de covariância (ou kernel). Este modelo não-paramétrico tem ganhado destaque devido à facilidade de cálculos e sua eficácia em predições. Nas predições com Processo Gaussiano, a escolha da função de covariância desempenha um papel crucial, pois ela depende diretamente dos valores de entrada das observações. Entretanto, a presença de outliers nos dados pode comprometer as inferências do modelo, resultando em predições inadequadas. Este trabalho analisa, por meio de simulações com dados contendo outliers, como diferentes funções de covariância afetam o desempenho de Modelos Preditivos de Processos Gaussianos. O objetivo é identificar quais kernels são mais sensíveis à presença de dados extremos e quais são mais robustos, além de categorizar essas funções em suas respectivas famílias de variação. Adicionalmente, propõe-se um novo kernel, denominado DC-LogExp, como uma alternativa para melhorar a robustez dos Processos Gaussianos. Os resultados mostram que o desempenho do modelo é significativamente impactado pela escolha do kernel e pela proporção de outliers nas amostras. As funções de covariância classificadas como função de variação regular, especificamente Rational Quadratic e DC-LogExp, destacaram-se por sua baixa sensibilidade à presença de outliers. Em particular, a função DC-LogExp mostrou-se ser uma alternativa promissora, apresentando bons ajustes em cenários com ou sem outliers, além de resultados satisfatórios em termos de convergência dos parâmetros e erros preditivos.Andrade, José Ailton AlencarMartinho, Wasley Correia2025-05-22T18:25:37Z2025-05-22T18:25:37Z2025-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.http://repositorio.ufc.br/handle/riufc/80973info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2025-06-03T20:13:26Zoai:repositorio.ufc.br:riufc/80973Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2025-06-03T20:13:26Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
dc.title.none.fl_str_mv |
Funções de covariância e robustez a outliers em processos Gaussianos Covariance functions and robustness to outliers in Gaussian processes |
title |
Funções de covariância e robustez a outliers em processos Gaussianos |
spellingShingle |
Funções de covariância e robustez a outliers em processos Gaussianos Martinho, Wasley Correia Processos gaussianos Kernel Outliers Gaussian processes Kernel Outliers CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS |
title_short |
Funções de covariância e robustez a outliers em processos Gaussianos |
title_full |
Funções de covariância e robustez a outliers em processos Gaussianos |
title_fullStr |
Funções de covariância e robustez a outliers em processos Gaussianos |
title_full_unstemmed |
Funções de covariância e robustez a outliers em processos Gaussianos |
title_sort |
Funções de covariância e robustez a outliers em processos Gaussianos |
author |
Martinho, Wasley Correia |
author_facet |
Martinho, Wasley Correia |
author_role |
author |
dc.contributor.none.fl_str_mv |
Andrade, José Ailton Alencar |
dc.contributor.author.fl_str_mv |
Martinho, Wasley Correia |
dc.subject.por.fl_str_mv |
Processos gaussianos Kernel Outliers Gaussian processes Kernel Outliers CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS |
topic |
Processos gaussianos Kernel Outliers Gaussian processes Kernel Outliers CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS |
description |
In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors. |
publishDate |
2025 |
dc.date.none.fl_str_mv |
2025-05-22T18:25:37Z 2025-05-22T18:25:37Z 2025-02 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025. http://repositorio.ufc.br/handle/riufc/80973 |
identifier_str_mv |
MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025. |
url |
http://repositorio.ufc.br/handle/riufc/80973 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
instname_str |
Universidade Federal do Ceará (UFC) |
instacron_str |
UFC |
institution |
UFC |
reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
_version_ |
1834207478819061760 |