Framework para reconhecimento de ferramental industrial a partir de modelos tridimensionais em imagens adquiridas de câmera monocular

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: OLIVEIRA, Walber Rodrigues de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/40073
Resumo: A visão computacional tem como uma de suas áreas de atuação a busca de itens. O uso de tais técnicas possibilita o impulsionamento de diversos setores sociais e econômicos. A ferramentaria é o setor que produz os moldes para criação de estrutura básica de produtos; são criados moldes em forma de matrizes que podem vir a pesar até 20 toneladas e ocupar dezenas de metros quadrados. Cada matriz é formada de dezenas a centenas de componentes, muitos deles únicos. Na indústria automotiva estes moldes são concebidos em software de modelagem tridimensional e, através de um processo de manufatura aditiva, passam por diversas alterações até a construção do componente final. Após modelagem, a matriz é montada e utilizada em prensas hidráulicas que criam a estrutura metálica dos automóveis. Um passo fundamental consiste na verificação da montagem dos componentes antes de serem levados à prensa. A conferência é feita a olho nu e a única fonte de informação disponível é o modelo tridimensional. Falhas na estrutura podem causar danos estruturais e por a saúde dos colaboradores em risco. Com isto, esta dissertação apresenta um modelo de reconhecimento dos componentes de uma matriz de ferramentaria automotiva a partir do modelo tridimensional em imagem obtida a partir de câmera monocular. A solução proposta modela desde o padrão de aquisição de imagens até a geração de relatórios. Após a aquisição das imagens de cena, é inferida a posição global ideal da matriz utilizando geometria projetiva. Na próxima etapa, são renderizados os itens buscados numa imagem que se torna um modelo canônico da cena. Em paralelo a isto, a imagem de cena passa por um processo de extração de características, onde são utilizados algoritmos clássicos como o algoritmo de Canny, e soluções modernas baseadas em redes neurais de aprendizagem profunda (o HED - Holystically-nested Edge Network). A partir dos relatórios gerados é possível indicar problemas estruturais nos componentes e itens indesejados em cena. Além de demonstrar o percentual de casamento dos itens, a partir de uma análise comparativa entre a imagem de bordas da cena e o modelo canônico. A solução foi testada em uma indústria automotiva e obteve como resultados de casamento valores médios de 88% de acurácia e 91% de precisão além de conseguir identificar problemas estruturais nas ferramentas. A solução demonstra ser adequada para aumentar a eficiência do processo de conferência, trazendo melhorias de segurança e diminuindo os custos do processo.