Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes

Bibliographic Details
Main Author: Kiefer, Tobias Felipe
Publication Date: 2025
Format: Article
Language: por
Source: Repositório Institucional da Udesc
Download full: https://repositorio.udesc.br/handle/UDESC/23286
Summary: Com o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação.
id UDESC-2_e460e6a6ae6c2411bcc5c9bd815925db
oai_identifier_str oai:repositorio.udesc.br:UDESC/23286
network_acronym_str UDESC-2
network_name_str Repositório Institucional da Udesc
repository_id_str 6391
spelling Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentesData WarehouseETL AutomatizadoPatentesAnálise TextualInteligência ArtificialCom o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação.Zanchett, Pedro SidneiKiefer, Tobias Felipe2025-09-19T16:28:57Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/article65 f.application/pdfKIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.https://repositorio.udesc.br/handle/UDESC/23286Attribution-NonCommercial-ShareAlike 4.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/4.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Udescinstname:Universidade do Estado de Santa Catarina (UDESC)instacron:UDESC2025-09-30T17:34:12Zoai:repositorio.udesc.br:UDESC/23286Biblioteca Digital de Teses e Dissertaçõeshttps://pergamumweb.udesc.br/biblioteca/index.phpPRIhttps://repositorio-api.udesc.br/server/oai/requestri@udesc.bropendoar:63912025-09-30T17:34:12Repositório Institucional da Udesc - Universidade do Estado de Santa Catarina (UDESC)false
dc.title.none.fl_str_mv Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
title Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
spellingShingle Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
Kiefer, Tobias Felipe
Data Warehouse
ETL Automatizado
Patentes
Análise Textual
Inteligência Artificial
title_short Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
title_full Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
title_fullStr Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
title_full_unstemmed Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
title_sort Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
author Kiefer, Tobias Felipe
author_facet Kiefer, Tobias Felipe
author_role author
dc.contributor.none.fl_str_mv Zanchett, Pedro Sidnei
dc.contributor.author.fl_str_mv Kiefer, Tobias Felipe
dc.subject.por.fl_str_mv Data Warehouse
ETL Automatizado
Patentes
Análise Textual
Inteligência Artificial
topic Data Warehouse
ETL Automatizado
Patentes
Análise Textual
Inteligência Artificial
description Com o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação.
publishDate 2025
dc.date.none.fl_str_mv 2025-09-19T16:28:57Z
2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv KIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.
https://repositorio.udesc.br/handle/UDESC/23286
identifier_str_mv KIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.
url https://repositorio.udesc.br/handle/UDESC/23286
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/4.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 4.0 Brazil
http://creativecommons.org/licenses/by-nc-sa/4.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 65 f.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Udesc
instname:Universidade do Estado de Santa Catarina (UDESC)
instacron:UDESC
instname_str Universidade do Estado de Santa Catarina (UDESC)
instacron_str UDESC
institution UDESC
reponame_str Repositório Institucional da Udesc
collection Repositório Institucional da Udesc
repository.name.fl_str_mv Repositório Institucional da Udesc - Universidade do Estado de Santa Catarina (UDESC)
repository.mail.fl_str_mv ri@udesc.br
_version_ 1848168373389623296