FINDOS: uma ferramenta para identificação automática de unidades de rastreamento

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: CARDOSO, Kamilla Rafaelle Fernandes
Orientador(a): IYODA, Juliano Manabu
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/28086
Resumo: Documentos descritos em linguagem natural ainda são muito usados na indústria, especialmente em requisitos e testes. Coincidentemente, tais artefatos em linguagem natural seguem uma estrutura tabular (como Casos de Uso ou Casos de Teste), que muitas vezes não têm padronização e são editados livremente em editores de texto ou em planilhas eletrônicas. Variações na estrutura da tabela são encontradas em diferentes versões do mesmo documento, seja por falta de uma política de padronização, seja por falta de uso de alguma ferramenta estruturada (ou ambos). Em particular, o tratamento da evolução dos arquivos em diferentes versões é prejudicado, dado que cada stakeholder ou colaborador da documentação possui formas particulares de expressar os requisitos com pequenas variações em formato. O gerenciamento eficiente sobre documentos descritos em linguagem natural e que não possuem padronização é necessário para manter as informações sempre atualizadas e serem fáceis de manipular. Contudo, no contexto organizacional, em que a maioria das informações obtidas são fornecidos por terceiros (clientes, agências reguladoras, governo, fornecedores, etc) e onde a quantidade de documentos é relativamente grande, aumenta muito a complexidade do gerenciamento. Como os documentos, em sua grande maioria, estão semi-estruturados, há pouca ou nenhuma possibilidade de forçar a adoção de um padrão e, na maioria dos casos, forçar a adoção de um padrão acarreta em altos custos adicionais. Na área de requisitos encontramos várias soluções para identificar, armazenar e rastrear requisitos de forma eficaz. Entretanto a maioria destas soluções assumem a adoção de documentos previamente estruturados, ou semi-estruturados. Isto limita os usuários a seguir um padrão que estruture os arquivos antes de promover um gerenciamento ou identificação de requisitos em um processo evolutivo (onde N versões de um documento são produzidos). Abordagens automatizadas que promovam a identificação automática de unidades de rastreamento (Casos de Uso, Requisitos, Casos de Teste, etc) desestruturados não existem. Este trabalho desenvolveu a ferramenta FINDOS (Ferramenta de INspeção em DOcumentos deSestruturados) que, através de um algoritmo de busca angular (esquerda para direito, cima para baixo), identifica unidades de rastreamento em documentos altamente desestruturados. O algoritmo assume que as unidades de rastreamento possuem formato tabular (não padronizado) e que cada unidade possui um identificador único que obedeça a uma expressão regular. A ferramenta busca unidades de rastreamento em documentos do Word e Excel. Aplicamos a ferramenta em um estudo de caso no contexto do convênio UFPE-Motorola. Neste estudo de caso, a ferramenta, além de identificar as unidades de rastreamento, ainda comparou duas versões da mesma unidade para o usuário avaliar se houve mudanças de uma versão para outra (seja por uma remoção, adição ou modificação da informação entre versões). A ferramenta processou, no geral, 1.050 arquivos Word/Excel, com tempo de processamento em torno de 5,12 minutos, identificando através da execução do algoritmo, no total, 62.547 unidades de rastreamento (neste caso, 62.547 Casos de Testes). A equipe do convênio UFPE-Motorola reportou levar de 1 a 2 meses para realizar manualmente esta atividade