Deep Multitask Learning for Automatic Evaluation of ICAO Requirements.

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: SILVA, Arnaldo Gualberto de Andrade e.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/32992
Resumo: A face ´e considerada o principal tra¸co biom´etrico para documentos de viagem leg´ıveis por m´aquina, como passaportes. Neste contexto, o padr˜ao ISO/IEC 19794-5 dene um conjunto de requisitos fotogr´acos para garantir a qualidade da imagem e simplicar o processo de reconhecimento facial. No entanto, devido ao grande n´umero de requisitos denidos por esse padr˜ao (quase 30), a verica¸c˜ao de conformidade de uma ´unica imagem facial ainda ´e um desao. Normalmente, problemas com v´arias tarefas, como os requisitos desse padr˜ao, s˜ao divididos em subproblemas independentes que s˜ao resolvidos separadamente e, em seguida, recombinados. No entanto, isso ignora as informa¸c˜oes comuns entre tarefas relacionadas e aumenta o risco de sobreajuste. O Aprendizado Multitarefa (do inglˆes, Multitasking Learning, MTL) tem se provado uma t´ecnica importante para resolver v´arias tarefas relacionadas simultaneamente. Ele explora os aspectos comuns e distintos de tarefas do mesmo dom´ınio para melhorar a generaliza¸c˜ao entre todas as tarefas. Al´em disso, o MTL concentra-se em aprender uma representa¸c˜ao ´util que possa gerar benef´ıcios, especialmente em cen´arios em que um conjunto de dados rotulados para uma tarefa ´e limitado. Por m, no caso das Redes Neurais Profundas, o MTL pode ajudar a reduzir o n´umero de parˆametros e a velocidade de inferˆencia. Esta pesquisa prop˜oe o primeiro m´etodo de aprendizado profundo multitarefa projetado para avalia¸c˜ao autom´atica dos requisitos do padr˜ao ISO/IEC 19794-5, denominado ICAONet. Autoencoders subcompletos s˜ao estendidos para empregar uma abordagem de multi-aprendizagem colaborativa, onde a aprendizagem supervisionada e n˜ao-supervisionada s˜ao realizadas simultaneamente e de forma cooperativa. O m´etodo ´e treinado usando um banco de imagens especialmente constru´ıdo para o problema descrito e avaliado por um sistema de benchmark ocial tamb´em utilizado por outras abordagens presentes na literatura. Os experimentos mostram que o m´etodo proposto alcan¸ca os melhores resultados em termos de Taxa de Erro Igual (do inglˆes, Equal Error Rate, EER) para 9 dos 23 requisitos fotogr´acos, o que n˜ao foi alcan¸cado por nenhum outro m´etodo conforme a bibliograa consultada. Portanto, o m´etodo proposto pode ser considerado a melhor solu¸c˜ao geral entre trabalhos acadˆemicos publicados na literatura e SDKs privados analisados. No geral, a EER mediana (3,3%) tamb´em ´e competitiva. Em termos de tempo de execu¸c˜ao, o m´etodo proposto se destaca entre os m´etodos mais r´apidos para avaliar todos os 23 requisitos segundo o benchmark ocial. Por outro lado, h´a espa¸co para melhorias nos resultados da localiza¸c˜ao dos olhos e alguns requisitos espec´ıcos, que podem exigir investiga¸c˜ao adicional. Por m, por meio de t´ecnicas de visualiza¸c˜ao de Redes Neurais, foram identicados padr˜oes de representa¸c˜ao relevantes aos requisitos do padr˜ao ISO/IEC 19794-5.