Funções de covariância e robustez a outliers em processos Gaussianos

Bibliographic Details
Main Author: Martinho, Wasley Correia
Publication Date: 2025
Format: Master thesis
Language: por
Source: Repositório Institucional da Universidade Federal do Ceará (UFC)
Download full: http://repositorio.ufc.br/handle/riufc/80973
Summary: In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.
id UFC-7_9cbfdd7523a53424f6f9026d6d9de14b
oai_identifier_str oai:repositorio.ufc.br:riufc/80973
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Funções de covariância e robustez a outliers em processos GaussianosCovariance functions and robustness to outliers in Gaussian processesProcessos gaussianosKernelOutliersGaussian processesKernelOutliersCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOSIn Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.Na Teoria de Regressão, os Processos Gaussianos surgem como uma alternativa eficiente para simplificar a obtenção de estimativas em Modelos Bayesianos. Um Processo Gaussiano é uma generalização da distribuição gaussiana, totalmente definido por sua média e função de covariância (ou kernel). Este modelo não-paramétrico tem ganhado destaque devido à facilidade de cálculos e sua eficácia em predições. Nas predições com Processo Gaussiano, a escolha da função de covariância desempenha um papel crucial, pois ela depende diretamente dos valores de entrada das observações. Entretanto, a presença de outliers nos dados pode comprometer as inferências do modelo, resultando em predições inadequadas. Este trabalho analisa, por meio de simulações com dados contendo outliers, como diferentes funções de covariância afetam o desempenho de Modelos Preditivos de Processos Gaussianos. O objetivo é identificar quais kernels são mais sensíveis à presença de dados extremos e quais são mais robustos, além de categorizar essas funções em suas respectivas famílias de variação. Adicionalmente, propõe-se um novo kernel, denominado DC-LogExp, como uma alternativa para melhorar a robustez dos Processos Gaussianos. Os resultados mostram que o desempenho do modelo é significativamente impactado pela escolha do kernel e pela proporção de outliers nas amostras. As funções de covariância classificadas como função de variação regular, especificamente Rational Quadratic e DC-LogExp, destacaram-se por sua baixa sensibilidade à presença de outliers. Em particular, a função DC-LogExp mostrou-se ser uma alternativa promissora, apresentando bons ajustes em cenários com ou sem outliers, além de resultados satisfatórios em termos de convergência dos parâmetros e erros preditivos.Andrade, José Ailton AlencarMartinho, Wasley Correia2025-05-22T18:25:37Z2025-05-22T18:25:37Z2025-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.http://repositorio.ufc.br/handle/riufc/80973info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2025-06-03T20:13:26Zoai:repositorio.ufc.br:riufc/80973Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2025-06-03T20:13:26Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv Funções de covariância e robustez a outliers em processos Gaussianos
Covariance functions and robustness to outliers in Gaussian processes
title Funções de covariância e robustez a outliers em processos Gaussianos
spellingShingle Funções de covariância e robustez a outliers em processos Gaussianos
Martinho, Wasley Correia
Processos gaussianos
Kernel
Outliers
Gaussian processes
Kernel
Outliers
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
title_short Funções de covariância e robustez a outliers em processos Gaussianos
title_full Funções de covariância e robustez a outliers em processos Gaussianos
title_fullStr Funções de covariância e robustez a outliers em processos Gaussianos
title_full_unstemmed Funções de covariância e robustez a outliers em processos Gaussianos
title_sort Funções de covariância e robustez a outliers em processos Gaussianos
author Martinho, Wasley Correia
author_facet Martinho, Wasley Correia
author_role author
dc.contributor.none.fl_str_mv Andrade, José Ailton Alencar
dc.contributor.author.fl_str_mv Martinho, Wasley Correia
dc.subject.por.fl_str_mv Processos gaussianos
Kernel
Outliers
Gaussian processes
Kernel
Outliers
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
topic Processos gaussianos
Kernel
Outliers
Gaussian processes
Kernel
Outliers
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
description In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.
publishDate 2025
dc.date.none.fl_str_mv 2025-05-22T18:25:37Z
2025-05-22T18:25:37Z
2025-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.
http://repositorio.ufc.br/handle/riufc/80973
identifier_str_mv MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.
url http://repositorio.ufc.br/handle/riufc/80973
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1834207478819061760