Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Marques, Charles Gleison Nunes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
Resumo: A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.