Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
LIMA, Jefferson Luiz Pessoa |
Orientador(a): |
MATTOS NETO, Paulo Salgado Gomes de |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Informacao
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/39224
|
Resumo: |
Base de dados com diferentes proporções de exemplos por classe é algo frequente e pode afetar negativamente alguns algoritmos de aprendizagem supervisionada. Uma série de classificadores podem ficar enviesados quando são treinados nessas condições, especializando-se somente nas classes com maior quantidade de amostras, deixando de lado as classes minoritárias, as quais podem ser mais importantes para o objetivo em questão. Esse problema exige um esforço considerável de investigação e estudo para elaboração de métodos. Como nem sempre é possível, ou viável, a coleta de novas amostras da classe minoritária, métodos têm sido estudados e desenvolvidos para realizar a geração de amostras a partir das existentes, fazendo o chamado Oversampling. Utilizando as Generative Adversarial Networks - GANs, as quais compõem o estado da arte para geração de amostras sintéticas realistas, o presente trabalho propôs o método Adversarial Oversampling - AO. O método proposto utiliza as Auxiliary Classifier GANs - AC-GAN como rede adversária, para aprender a distribuição das classes e gerar amostras sintéticas para balancear a base de dados. Durante o treinamento do AO, é dado uma maior atenção às amostras consideradas difíceis, utilizando a própria rede adversária para determinar a dificuldade dessas amostras. Com isso, o AO tenta gerar amostras mais significativas, que colaboram para melhorar a região de fronteira do classificador em questão. As amostras sintéticas geradas são filtradas utilizando a rede adversário do AO. A primeira análise realizada teve como objetivo observar a morfologia das amostras geradas pelo Oversampling, e mostrou que o AO conseguiu gerar amostras com um aspecto visual mais fiel às amostras originais, comparado aos métodos tradicionais de Oversampling, que possuem a geração baseada em interpolação. Uma segunda análise foi feita para observar a precisão do classificador na classe minoritária à medida que são inseridas as amostras geradas pelo AO. Por fim, foi feito um experimento comparativo entre os métodos de Oversampling, observando o quão as amostras geradas contribuem para o aumento na precisão do classificador na classe minoritária. Esse experimento foi repetido em cinco bases de dados de imagens. Os resultados médios do AO mostraram indícios de superioridade em quatro das cinco das bases, em até 4%. Com base nos indícios obtidos através dos experimentos realizados, pode-se observar que o método proposto pode ser capaz de gerar amostras sintéticas, balanceando a distribuição das classes e contribuindo no processo de aprendizagem do classificador. |