Equidade e justiça dos dados para encontrar vieses que influenciam resultados de algoritmos em tomada de decisão

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Soares, Letícia Sakamoto
Orientador(a): Silva, Leandro Augusto da
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
eng
Instituição de defesa: Universidade Presbiteriana Mackenzie
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://dspace.mackenzie.br/handle/10899/29275
Resumo: Com os avanços no âmbito da Inteligência Artificial, Aprendizado de Máquina e outras abordagens analíticas, o algoritmo vem sendo modificado no sentido de substituir um ser humano em diversas tarefas simples e rotineiras. Contudo, há uma discussão no que tange as definições adequadas da justiça de dados, debate este que obtém a atenção de pesquisadores de numerosas áreas, como engenharia de software e direito, sociologia, por exemplo. Em consulta a literatura, nota-se indefinição sobre o significado do termo vieses algorítmicos. Como principais fontes de viés são apontados os dados de treinamento e o processo de construção de ferramentas utilizadas para decisões automatizadas. Sendo assim, enfatiza-se a necessidade de investir no aumento da transparência em todas as etapas da construção do algoritmo, desde a exploração do conjunto de dados até o desenvolvimento e a tomada de decisões, e transcender a objetividade desses elementos como, por exemplo, analisar a desigualdade social estrutural presente em dados. A problemática abordada nesta pesquisa visa atestar que as decisões guiadas por algoritmos sejam mais equitativas, apontando quais as variáveis que as influenciam. Com o objetivo de observar os impactos e influência que dados possam causar nos resultados dos algoritmos de tomada de decisão, existe na literatura uma base de dados de um estudo investigativo feito pela ProPublica sobre a ferramenta COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), pesquisa comumente citada na área de viés algoritmíco. Tomando como base as abordagens de análises da literatura, foi aplicada no conjunto de dados COMPAS uma Análise Exploratória para verificar a existência de desbalanceamento de classe, condição essa confirmada. Posteriormente foi aplicada a técnica de Self Organizing Map (SOM) como ferramenta de exploração dividida em três etapas para compreender o comportamento dos dados. Na primeira etapa, quando os dados estão desbalanceados pela classe e intraclasse, na segunda etapa, quando estão balanceados pela classe, e na terceira etapa, pela intraclasse. Com isso, foi possível observar como cada elemento do conjunto de dados estava disposto e a sua relevância no mapa SOM, e em conjunto com o Coeficiente de Gini compreender quais conjuntos de dados estão mais equitativos.