Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Barcellos, William |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/18/18152/tde-16082022-103558/
|
Resumo: |
As Redes Neurais Convolucionais (CNN do inglês Convolutional Neural Network) se tornaram o estado da arte para reconhecimento de imagem. Apesar dos excelentes resultados em alguns problemas de visão computacional, treinar uma CNN a partir do zero às vezes é difícil devido ao número limitado de amostras rotuladas de imagens disponíveis. Algumas estratégias foram desenvolvidas visando a solução para esse tipo de problema, como aumento de dados, transferência de aprendizado com ajuste fino ou usando uma CNN como um extrator de características. Biometria da íris e da região periocular são problemas típicos. Os conjuntos de dados disponíveis foram gerados para algoritmos tradicionais de visão computacional e estratégias baseadas em abordagens de aprendizado profundo de ponta a ponta não são em geral viáveis. Com base em alguns bons resultados obtidos por descritores de textura como Local Binary Patterns (LBP) para classificação de íris e da região periocular, propomos neste trabalho aplicar o descritor LBP uniforme (uLBP) nas Ativações das camadas profundas de uma CNN, e utilizar os vetores de características extraídos em processos de reconhecimento biométrico da região periocular e incluindo o olho (íris, esclera, pupila). Avaliamos esta abordagem nas Ativações da CNN AlexNet. Estas Ativações podem ser interpretadas como imagens processadas pelos filtros da CNN previamente treinada, apresentando características discriminantes de textura. Os resultados mostram que, ao se aplicar esse descritor às Ativações das camadas da CNN AlexNet, foram obtidos melhores resultados do que com as metodologias tradicionais uLBP, HOG, SURF e SIFT, nos testes realizados nas bases de imagens UBIPr Std01, UBIPr_v2, VISOB e MICHE. Esta abordagem fornece assim, uma nova maneira de se utilizar redes neurais profundas em conjunto com técnicas tradicionais de visão computacional, para a solução de problemas de classificação de imagens em bases de imagens com número insuficiente de amostras para treinamento de uma CNN a partir do zero. |