Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK

Bibliographic Details
Main Author: Cavassin, Wilian Henrique
Publication Date: 2021
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Download full: http://repositorio.utfpr.edu.br/jspui/handle/1/34907
Summary: During the 1970’s the term Software Crisis was used in reference to a Malthusian problem which came to be during the early stages of Software Engineering. During those times, the growth of software demand and complexity increased rapidly, while the growth of software development remained linear. After some time, new development methods were created with the intention of solving the problems related to excessive development times and increase productivity. Some of the methods created were the Structured Programming, SDM (System Development Method), SSADM (Structured Systems Analysis e Design Method), Object Oriented, and Agile. The creation of those methods contributed for the undoing of the Malthusian problem which loomed on the field of Software Engineering. However, the growth of software demand and complexity continues to rapidly increase in a world in which a software is present in every situation and activity. This document proposes the development of a new ontological identification method, main words based and consequently valuation in the phrases, keeping a focus in translation of formatted English natural language texts into software requirements, which can then be used by computer programmers and software engineers. By making use of natural language processing, combined with a chosen set of meta-heuristics, ranking the importance and the frequency of grammatical functions for the development of an ontology to convert well formatted texts into use cases, applied to the Umbrello2 Software, by XMI model. At the end of this document were identified patterns, the importance and behavior of words, grammatical classes. Also shown are statistical data which were used to help characterize, model and comprehend the formation of user-stories from different data sets.
id UTFPR-12_59e3fd34316772e47bb58f1b2bb6d5a6
oai_identifier_str oai:repositorio.utfpr.edu.br:1/34907
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTKCreation of an ontology for extracting use cases from user stories, using the NLTK libraryOntologiaEngenharia de SoftwareEngenharia de requisitosProcessamento de linguagem natural (Computação)OntologySoftware engineeringRequirements engineeringNatural language processing (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAODuring the 1970’s the term Software Crisis was used in reference to a Malthusian problem which came to be during the early stages of Software Engineering. During those times, the growth of software demand and complexity increased rapidly, while the growth of software development remained linear. After some time, new development methods were created with the intention of solving the problems related to excessive development times and increase productivity. Some of the methods created were the Structured Programming, SDM (System Development Method), SSADM (Structured Systems Analysis e Design Method), Object Oriented, and Agile. The creation of those methods contributed for the undoing of the Malthusian problem which loomed on the field of Software Engineering. However, the growth of software demand and complexity continues to rapidly increase in a world in which a software is present in every situation and activity. This document proposes the development of a new ontological identification method, main words based and consequently valuation in the phrases, keeping a focus in translation of formatted English natural language texts into software requirements, which can then be used by computer programmers and software engineers. By making use of natural language processing, combined with a chosen set of meta-heuristics, ranking the importance and the frequency of grammatical functions for the development of an ontology to convert well formatted texts into use cases, applied to the Umbrello2 Software, by XMI model. At the end of this document were identified patterns, the importance and behavior of words, grammatical classes. Also shown are statistical data which were used to help characterize, model and comprehend the formation of user-stories from different data sets.Durante os anos 1970 o termo Software Crisis foi utilizado para representar um problema Malthusiano que se aplicava aos primeiros passos da Engenharia de Software. Complexidade e Demanda aumentavam exponencialmente, mas, o desenvolvimento de softwares crescia linearmente. Com o tempo surgiram metodologias para contornar tais problemas e aumentar a produtividade, dentre as quais pode-se citar: Programação Estruturada, SDM (System Development Method), SSADM (Structured Systems Analysis e Design Method), Programação Orientada a objetos, Metodologias ágeis, entre outras. Tais metodologias contribuíram para que a produção de softwares não fosse mais uma função linear. Contudo, a demanda e complexidade continuam a crescer em um mundo ao qual descobre e utiliza-se de softwares para controlar as mais variadas atividades. Propõe-se à análise de um conjunto de user-stories para o desenvolvimento de um modelo de identificação ontológico, baseado em palavras principais e sua valoração em frases, focando na transcrição de textos em linguagem natural inglesa formatada para casos de uso que possam ser utilizados por programadores e profissionais da área de Engenharia de Software. Utilizando-se de identificação e processamento de linguagens naturais, combinados com um conjunto de meta-heurísticas classifica-se: importância(peso) e frequência de termos gramaticais para o desenvolvimento de uma ontologia de conversão de textos formatados em requisitos computacionais aplicado ao software Umbrello1, através do modelo XMI. Ao fim da realização desta monografia foram identificados padrões, importâncias e comportamentos de palavras, classes gramaticais. Também foram extraídos dados estatísticos a fim de caracterizar, modelar e compreender a formação de user-stories de diferentes DataSets.Universidade Tecnológica Federal do ParanáCuritibaBrasilSistemas de InformaçãoUTFPRBastos, Laudelino CordeiroBastos, Laudelino CordeiroEmer, Maria Claudia Figueiredo PereiraGiménez Lugo, Gustavo AlbertoCavassin, Wilian Henrique2024-09-27T18:27:50Z2024-09-27T18:27:50Z2021-12-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfCAVASSIN, Willian Henrique. Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK. 2021. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/34907porhttp://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2024-09-28T06:07:24Zoai:repositorio.utfpr.edu.br:1/34907Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2024-09-28T06:07:24Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
Creation of an ontology for extracting use cases from user stories, using the NLTK library
title Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
spellingShingle Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
Cavassin, Wilian Henrique
Ontologia
Engenharia de Software
Engenharia de requisitos
Processamento de linguagem natural (Computação)
Ontology
Software engineering
Requirements engineering
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
title_short Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
title_full Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
title_fullStr Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
title_full_unstemmed Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
title_sort Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK
author Cavassin, Wilian Henrique
author_facet Cavassin, Wilian Henrique
author_role author
dc.contributor.none.fl_str_mv Bastos, Laudelino Cordeiro
Bastos, Laudelino Cordeiro
Emer, Maria Claudia Figueiredo Pereira
Giménez Lugo, Gustavo Alberto
dc.contributor.author.fl_str_mv Cavassin, Wilian Henrique
dc.subject.por.fl_str_mv Ontologia
Engenharia de Software
Engenharia de requisitos
Processamento de linguagem natural (Computação)
Ontology
Software engineering
Requirements engineering
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
topic Ontologia
Engenharia de Software
Engenharia de requisitos
Processamento de linguagem natural (Computação)
Ontology
Software engineering
Requirements engineering
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
description During the 1970’s the term Software Crisis was used in reference to a Malthusian problem which came to be during the early stages of Software Engineering. During those times, the growth of software demand and complexity increased rapidly, while the growth of software development remained linear. After some time, new development methods were created with the intention of solving the problems related to excessive development times and increase productivity. Some of the methods created were the Structured Programming, SDM (System Development Method), SSADM (Structured Systems Analysis e Design Method), Object Oriented, and Agile. The creation of those methods contributed for the undoing of the Malthusian problem which loomed on the field of Software Engineering. However, the growth of software demand and complexity continues to rapidly increase in a world in which a software is present in every situation and activity. This document proposes the development of a new ontological identification method, main words based and consequently valuation in the phrases, keeping a focus in translation of formatted English natural language texts into software requirements, which can then be used by computer programmers and software engineers. By making use of natural language processing, combined with a chosen set of meta-heuristics, ranking the importance and the frequency of grammatical functions for the development of an ontology to convert well formatted texts into use cases, applied to the Umbrello2 Software, by XMI model. At the end of this document were identified patterns, the importance and behavior of words, grammatical classes. Also shown are statistical data which were used to help characterize, model and comprehend the formation of user-stories from different data sets.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-09
2024-09-27T18:27:50Z
2024-09-27T18:27:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv CAVASSIN, Willian Henrique. Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK. 2021. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.
http://repositorio.utfpr.edu.br/jspui/handle/1/34907
identifier_str_mv CAVASSIN, Willian Henrique. Criação de uma ontologia de extração de casos de uso a partir de user stories, utilizando a biblioteca NLTK. 2021. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) - Universidade Tecnológica Federal do Paraná, Curitiba, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/34907
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Sistemas de Informação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Sistemas de Informação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498042039369728