Uma abordagem agnóstica para geração de texto legal e aplicação em tarefas da área de LegalTech

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Flesch, Jean Ampos
Orientador(a): Galante, Renata de Matos
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/255630
Resumo: A área de LegalTech é referida como a relação entre áreas da Ciência da Computação que operam em linguagem natural e áreas jurídicas. A proximidade entre as áreas da Linguagem e Direito possibilita que a LegalTech seja aplicada em diversas tarefas como geração de texto legal, predição de sentenças, recuperação de texto legal. Porém, apesar da flexibilidade em aplicações, muitas soluções apresentam lacunas em sua metodologia de implementação e/ou disponibilização das bases de dados extraídas e pré-processadas. Neste trabalho, é proposta uma Abordagem Agnóstica com o objetivo de providenciar recomendações para o desenvolvimento de soluções na área de LegalTech de forma coesa, estruturada, extensível, e robusta. Inicialmente, foi realizada a revisão sistemática da literatura para identificar e apresentar um panorama sobre diferentes soluções propostas na geração de texto legal. A partir da revisão sistemática, uma taxonomia para classificar os estudos em cinco categorias de acordo com o escopo principal de cada trabalho foi proposta a fim de embasar a Abordagem Agnóstica, que é composta por 4 etapas responsáveis pela coleta, processamento, modelagem e exibição de resultados a partir da utilização de técnicas de Inteligência Artificial e Processamento de Linguagem Natural em documentos legais. A abordagem é testada em três tarefas diferentes. A primeira tarefa testa a capacidade de construção de uma base de dados com documentos legais a partir da extração de informações dos acórdãos em páginas Web do Supremo Tribunal Brasileiro. Além da organização e disponibilização da base de dados, uma análise com visualização de informações sobre os dados é apresentada. A segunda tarefa realiza a classificação de palavras em documentos legais para geração de texto anotado, resultando no primeiro passo para a construção de uma solução capaz de facilitar a leitura de texto legal para pessoas leigas na área jurídica. Por fim, a terceira tarefa utiliza a base de dados construída para experimentos em classificação de documentos legais utilizando algoritmos de aprendizado de máquina supervisionado em modelos classificadores. Na realização dos experimentos, o uso dos modelos apresentou resultados promissores para predição das classes dos acórdãos. Em especial, o uso do classificador SVM resultou em um F1-score médio de 0,96.