Detalhes bibliográficos
Ano de defesa: |
2019 |
Autor(a) principal: |
Garcia, Rafael |
Orientador(a): |
Comba, Joao Luiz Dihl |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
eng |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Palavras-chave em Inglês: |
|
Link de acesso: |
http://hdl.handle.net/10183/197050
|
Resumo: |
Redes Neurais Profundas são responsáveis por muitos dos mais importantes resultados alcançados na Inteligência Artificial na última década. Muitas aplicações em diversas áreas começaram a utilizar estes modelos para solucionar tarefas de reconhecimento e aprendizado tanto à nível industrial quanto científico. Apesar do significativo aumento na utilização desta técnica, o desenvolvimento de redes neurais efetivas ainda encara vários desafios que acabam freando o potencial destas técnicas. Em particular, a alta complexi- dade destes modelos, que frequentemente contem milhares, ou mesmo milhões, de parâ- metros espalhados por várias camadas, dificulta a identificação das features que o modelo aprendeu a reconhecer e como elas afetam o seu processo de decisão. Sem tal conheci- mento, as redes neurais se tornam essencialmente uma caixa-preta que dá pouquíssimo entendimento sobre o que o modelo está realmente fazendo. Isso é indesejável pois di- minui a capacidade do usuário de interpretar e avaliar os processos internos dessas redes. Se nós conseguíssemos fazer isso, nós poderíamos usar tal informação para construir mo- delos não só com melhor performances, mas também com processos de decisão mais embasados, de forma que possam ser empregados em tarefas críticas — como aplicações médicas — onde entender como o modelo chega à uma certa conclusão é extremamente importante. Uma forma de abordar esses desafios é o emprego de ferramentas de análise visual que permitam a exploração e análise das features aprendidas pelas redes neurais. Muitas dessas ferramentas foram desenvolvidas nos últimos anos com o objetivo de abor- dar desafios em uma ou mais etapas do fluxo de desenvolvimento de uma rede neural. Neste trabalho, nós revisamos estas ferramentas de análise visual e introduzimos uma ta- xonomia para classificá-las de acordo com o tipo de análise que elas providenciam, seja a análise da arquitetura da rede, a avaliação do processo de treinamento, ou a análise e interpretação de quais features o modelo aprendeu a reconhecer. Após isso, nós ainda propomos uma nova técnica de visualização para guiar a escolha da arquitetura de redes neurais. Nós demonstramos, através de uma série de experimentos, como nosso método pode revelar múltiplas informações sobre como e se a arquitetura da rede deve ser modi- ficada — por exemplo, adicionando camadas ou aumentando o número de neurônios — para melhorar a performance da rede. |