Modelo de visão computacional para identificação de alimentos em refeições a partir da segmentação obtida por múltiplas redes completamente convolucionais

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: CARVALHO, Marcos Alberto de lattes
Orientador(a): PIMENTA, Tales Cleber lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Itajubá
Programa de Pós-Graduação: Programa de Pós-Graduação: Doutorado - Engenharia Elétrica
Departamento: IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.unifei.edu.br/jspui/handle/123456789/4112
Resumo: A estratégia de contar os carboidratos dos alimentos consumidos é recomendada por sociedades científicas como uma forma de melhorar a qualidade de vida dos pacientes com diabetes. O monitoramento da ingestão de alimentos pode ser facilitado através do uso de um aplicativo móvel que reconhece automaticamente os alimentos em uma refeição. O reconhecimento automático de imagens de alimentos é considerado uma tarefa desafiadora para a visão computacional devido à semelhança entre os alimentos. Esse desafio aumenta quando o objetivo é classificar alimentos de uma região específica e com um conjunto de dados contendo apenas alimentos dessa região e, portanto, pequeno em comparação com conjuntos de dados públicos de outros países. Para essa tarefa, este trabalho apresenta um modelo que utiliza um conjunto de Redes Completamente Convolucionais (Fully Convolutional Network - FCNs) para gerar segmentações dos alimentos em uma refeição. Essas segmentações são processadas por um algoritmo que classifica os alimentos utilizando técnicas de processamento digital de imagens. O modelo tem baixos custos de treinamento e é escalável, ou seja, pode ser treinado para reconhecer um novo alimento sem a necessidade de re-treinar o modelo inteiro. Nos testes, foram utilizados alimentos consumidos no Brasil, obtendo 98.2% de acurácia e 87.8% de sensibilidade.