[en] A DATA ANNOTATION APPROACH USING LARGE LANGUAGE MODELS

CARLOS VINICIOS MARTINS ROCHA

[en] A DATA ANNOTATION APPROACH USING LARGE LANGUAGE MODELS

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	CARLOS VINICIOS MARTINS ROCHA
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	eng
Instituição de defesa:	MAXWELL
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	[pt] GRANDE MODELO DE LINGUAGEM [pt] DOCUMENTO [pt] VQA [pt] ANOTACAO DE DADOS [en] LARGE LANGUAGE MODEL [en] DOCUMENT [en] VQA [en] DATA ANNOTATION
Link de acesso:	https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68379&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=68379&idi=2 http://doi.org/10.17771/PUCRio.acad.68379
Resumo:	[pt] Os documentos são essenciais para o sistema econômico e acadêmico; no entanto, explorá-los pode ser uma tarefa complexa e demorada. Uma abordagem para contornar esse problema é o uso de modelos de Visual Question and Answering (VQA) para extração de informações de documentos por meio de prompts em linguagem natural. No VQA, assim como para o desenvolvimento dos mais variados modelos, é necessário possuir dados anotados para a sua etapa de treinamento e validação. No entanto, criar esses conjuntos de dados é desafiador devido ao alto custo envolvido no processo. Com base nisso, propomos um processo de quatro etapas que combina Modelos de Visão Computacional e Large Language Models (LLMs) para a anotação de dados de VQA em relatórios financeiros. O método proposto inicia pelo reconhecimento da estrutura textual dos documentos por meio de modelos de Análise de Layout de Documentos e Extração de Estrutura de Tabelas. Em seguida, utiliza duas LLMs distintas para a etapa de geração e avaliação dos pares de perguntas e respostas geradas, automatizando a construção e seleção dos melhores pares para compor a base final. Para avaliar o método proposto, geramos um dataset para treinar e avaliar modelos especialistas em VQA.

[en] A DATA ANNOTATION APPROACH USING LARGE LANGUAGE MODELS

Registros relacionados