Contagem de multidões através de redes neurais convolucionais
Main Author: | |
---|---|
Publication Date: | 2021 |
Format: | Report |
Language: | por |
Source: | Repositório Institucional da INSPER |
Download full: | https://repositorio.insper.edu.br/handle/11224/3740 |
Summary: | A Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem. |
id |
INSP_b5d857fbd6d46df9a7709733fbb4b27a |
---|---|
oai_identifier_str |
oai:repositorio.insper.edu.br:11224/3740 |
network_acronym_str |
INSP |
network_name_str |
Repositório Institucional da INSPER |
repository_id_str |
|
spelling |
Contagem de multidões através de redes neurais convolucionaisRedes Neurais Convolucionaiscontagem de multidãoVisão ComputacionalConvolutional Neural NetworksCrowd CountingComputer VisionBackground SegmentationA Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem.Crowd Counting with Computer Vision is a hard task, factors such as occlusion due to different heights of people, environments not present in the training set and different densities in the crowd image, significantly impair the performance of most counting methods. A possible approach is using a real-time foreground-background segmentation. However, prior knowledge of the environment is required, which affects performance in unfamiliar environments. Another approach is through Convolutional Neural Networks or CNN, according to Gerón[4], they emerged from the study of the visual cortex of the brain and have been used in image recognition since 1980. in this way, CNNs are inspired by the processing of visual data from neurons in humans, specializing in image analysis, which can achieve superhuman performance in some visual tasks. A Convolutional Neural Network Architecture is proposed with three different columns. The columns have differents characteristics, that allows each column specializing in certain density range. A Switch is trained to classify a input patch of the image based on the density in this patch, and forward this to the most appropriate column. A database with 1198 annotated images is used to mesure the precision of the crowd count.Silva, Raul Ikeda Gomes daSantos, Eiki Luis Yamashiro Batista dosSantos, Eiki Luis Yamashiro Batista dos2022-07-13T12:41:41Z2022-07-13T12:41:41Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/report15 p.Digitalapplication/pdfapplication/pdfhttps://repositorio.insper.edu.br/handle/11224/3740BrasilSão PauloTODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da INSPERinstname:Instituição de Ensino Superior e de Pesquisa (INSPER)instacron:INSPER2025-06-12T13:32:08Zoai:repositorio.insper.edu.br:11224/3740Biblioteca Digital de Teses e Dissertaçõeshttps://www.insper.edu.br/biblioteca-telles/PRIhttps://repositorio.insper.edu.br/oai/requestbiblioteca@insper.edu.br || conteudobiblioteca@insper.edu.bropendoar:2025-06-12T13:32:08Repositório Institucional da INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER)false |
dc.title.none.fl_str_mv |
Contagem de multidões através de redes neurais convolucionais |
title |
Contagem de multidões através de redes neurais convolucionais |
spellingShingle |
Contagem de multidões através de redes neurais convolucionais Santos, Eiki Luis Yamashiro Batista dos Redes Neurais Convolucionais contagem de multidão Visão Computacional Convolutional Neural Networks Crowd Counting Computer Vision Background Segmentation |
title_short |
Contagem de multidões através de redes neurais convolucionais |
title_full |
Contagem de multidões através de redes neurais convolucionais |
title_fullStr |
Contagem de multidões através de redes neurais convolucionais |
title_full_unstemmed |
Contagem de multidões através de redes neurais convolucionais |
title_sort |
Contagem de multidões através de redes neurais convolucionais |
author |
Santos, Eiki Luis Yamashiro Batista dos |
author_facet |
Santos, Eiki Luis Yamashiro Batista dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Silva, Raul Ikeda Gomes da |
dc.contributor.author.fl_str_mv |
Santos, Eiki Luis Yamashiro Batista dos Santos, Eiki Luis Yamashiro Batista dos |
dc.subject.por.fl_str_mv |
Redes Neurais Convolucionais contagem de multidão Visão Computacional Convolutional Neural Networks Crowd Counting Computer Vision Background Segmentation |
topic |
Redes Neurais Convolucionais contagem de multidão Visão Computacional Convolutional Neural Networks Crowd Counting Computer Vision Background Segmentation |
description |
A Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem. |
publishDate |
2021 |
dc.date.none.fl_str_mv |
2021 2022-07-13T12:41:41Z 2022-07-13T12:41:41Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/report |
format |
report |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.insper.edu.br/handle/11224/3740 |
url |
https://repositorio.insper.edu.br/handle/11224/3740 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
15 p. Digital application/pdf application/pdf |
dc.coverage.none.fl_str_mv |
Brasil São Paulo |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da INSPER instname:Instituição de Ensino Superior e de Pesquisa (INSPER) instacron:INSPER |
instname_str |
Instituição de Ensino Superior e de Pesquisa (INSPER) |
instacron_str |
INSPER |
institution |
INSPER |
reponame_str |
Repositório Institucional da INSPER |
collection |
Repositório Institucional da INSPER |
repository.name.fl_str_mv |
Repositório Institucional da INSPER - Instituição de Ensino Superior e de Pesquisa (INSPER) |
repository.mail.fl_str_mv |
biblioteca@insper.edu.br || conteudobiblioteca@insper.edu.br |
_version_ |
1839074957043171328 |