Seleção de variáveis ambientais e de algoritmos de classificação para mapeamento digital de solos
Ano de defesa: | 2013 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Viçosa
BR Fertilidade do solo e nutrição de plantas; Gênese, Morfologia e Classificação, Mineralogia, Química, Doutorado em Solos e Nutrição de Plantas UFV |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://locus.ufv.br/handle/123456789/1649 |
Resumo: | No mapeamento digital de solos têm sido utilizados os atributos do terreno como as principais variáveis preditivas ambientais. Outras variáveis, relacionadas aos processos pedogenéticos, como as climáticas, não tem sido geralmente utilizadas. Nesse contexto, os objetivos deste estudo foram: (1) comparar o método da cokrigagem ordinária em com o da krigagem na espacialização da precipitação pluvial no Estado do Espírito Santo; (2) identificar no mapeamento de solos, em escalas diferentes, quais as variáveis mais relevantes para um melhor desempenho de predição das classes de solo, tendo como estudo duas áreas distintas; (3) avaliar o desempenho dos algoritmos classificadores NaiveBayes, rede neural multilayerperceptron - MLP, SimpleCart e J48.Na avaliação da krigagem e cokrigagem utilizaram-se dados de 108 postos pluviométricos e variáveis secundárias como altitude e distância do mar. Para a avaliação das variáveis e algoritmos classificadores no mapeamento de média escala (1:100.000) o estudo foi realizado na bacia do rio Muqui do Norte, sul do Estado do Espírito Santo. Utilizaram-se 598 amostras de treinamento (10 classes de solos) e 45variáveis relacionadas a diferentes fatores de formação dos solos, tais como: atributos do terreno, geologia, geomorfologia, clima, balanço hídrico e índices derivados das bandas 1, 3, 4 e 5 do sensor TM Landsat 5. Essas variáveis foram submetidas a diferentes métodos de seleção de atributos baseadas em correlação CFS; em consistência CSE; ganho de informação - IA e ReliefF , disponíveis no software Weka 3.6.8. Nesse software foi aplicado o classificador SimpleCart para avaliar a efetividade da predição com os subconjuntos de variáveis selecionadas. A avaliação dos quatro classificadores foi realizada com o uso das 45 variáveis e as selecionadas pelo algoritmo ReliefF . Para o mapeamento detalhado realizado no Assentamento Rural Sezínio Fernandes, em Linhares, ES, utilizaram-se 259 amostras de treinamento (3 classes de solos) e 19 variáveis preditivas (atributos do terreno, climáticas e balanço hídrico) nas predições feitas pelos classificadores SimpleCart, J48,MLP e NaiveBayes. As predições foram avaliadas com base na validação cruzada e comparações dos mapas elaborados com o mapa convencional de referência. Os resultados da interpolação sugerem que se deve preferir a cokrigagem e o uso de grades regulares para amostragem viiide variáveis secundárias. Os resultados da seleção de atributos para mapeamento da bacia do rio Muqui do Norte indicaram que os algoritmos ReliefF e o CSE, ambos limitados a 10 atributos, foram os que apresentaram árvores menos complexas e sem perda significativa na exatidão da predição em relação ao grupo de 45 variáveis. A exatidão da classificação, indicada pelo Kappa de 0,60, foi considerada muito boa. As variáveis selecionadas pelo ReliefF foram geologia, geomorfologia e principalmente atributos do terreno e elementos do balanço hídrico, como excedente hídrico, deficiência hídrica e evapotranspiração potencial. Os algoritmos NaiveBayes, MLP e SimpleCart apresentaram desempenhos de predição semelhantes (Kappa 0,60 a 0,66), superiores ao J48. A maior concordância com o mapa de referência obtida pelo algoritmo MLP, seguido do SimpleCart, J48 e NaiveBayes foi de 55, 52, 51 e 48%, respectivamente. Nas predições de classes de solos do Assentamento Sezinio Fernandes as variáveis excedente hídrico, deficiência hídrica e temperatura do ar foram relevantes. No entanto, as pequenas amplitudes de valores apresentadas pelas variáveis climáticas e balanço hídrico não são provavelmente suficientes para propiciar condições pedogenéticas diferenciadas na área de estudo. Não houve diferenças significativas entre os valores de Kappa (0,77 a 0,82) dos três algoritmos de classificação. As maiores concordâncias com o mapa convencional foram obtidas para o algoritmo J48, seguido do NaiveBayes e do SimpleCart, utilizando somente atributos de terreno como variáveis preditivas. As árvores de decisão por produzirem resultados de mais fácil entendimento e apresentarem em geral exatidões semelhantes aos classificadores NaiveBayes e rede neural MLP, podem ser consideradas como de grande potencial para se consolidarem no mapeamento digital de solos. |