Detalhes bibliográficos
Ano de defesa: |
2016 |
Autor(a) principal: |
Bruna Cristina Braga |
Orientador(a): |
Sidnei João Siqueira Sant'Anna,
Corina da Costa Freitas |
Banca de defesa: |
Camilo Daleles Rennó,
Thales Sehn Körting,
Gilson Alexandre Ostwald Pedro da Costa |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Nacional de Pesquisas Espaciais (INPE)
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação do INPE em Sensoriamento Remoto
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Resumo em Inglês: |
A new data integration methodology named ${''}$Multisource Classification${''}$ is proposed and assessed in this work. It is based on stochastic distances and their associated hypothesis tests. The great advantage of this new method is the generation of multisource classification by means of stochastic distances between unknown joint probability density function (p.d.f.). These distances (and statistical tests) are computed from marginal distances (and marginal statistical tests) regardless the joint p.d.f. knowledge. The multisource classification result is generated using mathematical functions based on statistical tests and they can be obtained by theoretical or empirical approaches. For some distances, it is also mathematically, shown that the theoretical function is given by the sum of statistical tests. The classification performance is evaluated using images obtained from three different sensors: two SAR (Alos and Radarsat2) and one TM (Landsat5). Twelve individual classifications were generated using these three images and by varying the data modeling. The classifications presenting the best accuracy (Kappa coefficient and overall accuracy) were selected for each image. Ten combinations were then constructed using these selected classifications in order to employ the proposed methodology. For each combination it was constructed three multisource scenarios, called sum, minimum and product multisource scenarios. The first is based on the theoretical approach whereas the two latter follow an empirical approach. In addition, an empirical Fuzzy multisource scenario was also created. The sum multisource scenario compound by the three images exhibited 45\%, 32\% and 6\% of improvement related to Palsar, Radarsat and TM image classifications, respectively. In general, the majority of SAR data combinations resulted in classifications with highest rates of accuracy than those presented by the individual classifications. In some situations, SAR and TM images combinations high values of accuracy indexes were observed. It was observed that the empirical minimum and product multisource scenarios, using the three images, presented high values of Kappa coefficient and overall accuracy regarding to Palsar image classification. However, relatively to Radarsat image classification, only the product multisource scenario reached high values for the same indexes. On the other hand, based on TM image classification, both scenarios showed low improvement values. The Fuzzy multisource scenario allowed mixed classes classification with high values of accuracy per class. This is an interesting and positive factor in the proposed methodology of classification. Given the great variety of feasible multisource scenarios that can be implemented and the obtained results, it was concluded that it is possible to improve classification results using the proposed multisource methodology. |
Link de acesso: |
http://urlib.net/sid.inpe.br/mtc-m21b/2016/07.04.21.38
|
Resumo: |
Neste trabalho de dissertação, propõe-se uma nova metodologia de integração de dados classificados baseada em distâncias estocásticas e testes de hipóteses, denominada ${''}$Classificação Multifonte${''}$. O grande diferencial do método de integração proposto se origina do fato da classificação multifonte ser obtida a partir do cálculo das distâncias estocásticas entre a função densidade de probabilidade (f.d.p.) conjunta dos dados oriundos das múltiplas fontes sem, no entanto, conhecê-la. Estas distâncias (e estatísticas de teste associadas) são computadas a partir das distâncias marginais (e estatísticas de teste marginais), independentemente do conhecimento da f.d.p. conjunta. O resultado da classificação multifonte é, então, construído utilizando-se funções matemáticas baseadas nas estatísticas de teste empregadas nas classificações e que são obtidas de maneira teórica e empírica. Demonstra-se matematicamente que a função teórica é a soma das estatísticas de teste. Para avaliação da metodologia, foram utilizadas duas imagens SAR (Alos/Palsar e Radarsat2) e uma imagem Landsat5/TM. Foram geradas 12 classificações individuais utilizando-se as três imagens e variando-se suas respectivas modelagens. Selecionaram-se para cada uma das imagens a classificação que apresentou os melhores índices de acurácia (coeficiente Kappa e acurácia global). Por intermédio das classificações escolhidas, construíram-se 10 combinações por meio das quais foi aplicada a metodologia proposta. Para tais combinações, originaram-se três Cenários multifontes, o primeiro, nomeado Cenário multifonte da soma, segue a abordagem teórica enquanto os dois últimos, denominados Cenário multifonte dos mínimos e Cenário multifonte do produto seguem uma abordagem empírica. Como mais um exemplo de criação de Cenário, foi gerado um Cenário multifonte Fuzzy que segue também a abordagem empírica. Apresentaram-se as classificações multifontes para as combinações que obtiveram os melhores resultados. O Cenário multifonte da soma envolvendo as três imagens conjuntamente apresenta melhora no coeficiente Kappa relativa às classificações individuais de 45\%, 32\% e 6\% para imagens Palsar, Radarsat e TM, respectivamente. De modo geral, combinações envolvendo somente os dados SAR resultaram, na maior parte, em classificações com maiores índices de acurácia do que aqueles apresentados pelas imagens individualmente. Para combinações envolvendo as imagens SAR e TM os índices foram elevados em algumas situações. Para os Cenários multifontes empíricos dos mínimos e do produto, observou-se que, em comparação à imagem Palsar, ambos os Cenários obtiveram valores superiores de índice Kappa e acurácia global. Para a imagem Radarsat, somente o Cenário multifonte do produto apresentou valores superiores para os mesmos índices. Já para a imagem TM, ambos os Cenários apresentaram índices inferiores. A classificação baseada na lógica Fuzzy permitiu uma classificação em classes mistas com alta confiabilidade e altos valores de acurácia por classe. Isto pode ser visto como um fator positivo na metodologia de classificação proposta. Dada a variedade de Cenários multifontes distintos possíveis de serem construídos concluiu-se que é possível melhorar os resultados de classificação utilizando-se a metodologia multifonte proposta. |