Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes
| Main Author: | |
|---|---|
| Publication Date: | 2025 |
| Format: | Article |
| Language: | por |
| Source: | Repositório Institucional da Udesc |
| Download full: | https://repositorio.udesc.br/handle/UDESC/23286 |
Summary: | Com o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação. |
| id |
UDESC-2_e460e6a6ae6c2411bcc5c9bd815925db |
|---|---|
| oai_identifier_str |
oai:repositorio.udesc.br:UDESC/23286 |
| network_acronym_str |
UDESC-2 |
| network_name_str |
Repositório Institucional da Udesc |
| repository_id_str |
6391 |
| spelling |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentesData WarehouseETL AutomatizadoPatentesAnálise TextualInteligência ArtificialCom o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação.Zanchett, Pedro SidneiKiefer, Tobias Felipe2025-09-19T16:28:57Z2025info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/article65 f.application/pdfKIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025.https://repositorio.udesc.br/handle/UDESC/23286Attribution-NonCommercial-ShareAlike 4.0 Brazilhttp://creativecommons.org/licenses/by-nc-sa/4.0/br/info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Udescinstname:Universidade do Estado de Santa Catarina (UDESC)instacron:UDESC2025-09-30T17:34:12Zoai:repositorio.udesc.br:UDESC/23286Biblioteca Digital de Teses e Dissertaçõeshttps://pergamumweb.udesc.br/biblioteca/index.phpPRIhttps://repositorio-api.udesc.br/server/oai/requestri@udesc.bropendoar:63912025-09-30T17:34:12Repositório Institucional da Udesc - Universidade do Estado de Santa Catarina (UDESC)false |
| dc.title.none.fl_str_mv |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| title |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| spellingShingle |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes Kiefer, Tobias Felipe Data Warehouse ETL Automatizado Patentes Análise Textual Inteligência Artificial |
| title_short |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| title_full |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| title_fullStr |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| title_full_unstemmed |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| title_sort |
Arquitetura de data warehouse automatizado para apoio à gestão do conhecimento em bases de patentes |
| author |
Kiefer, Tobias Felipe |
| author_facet |
Kiefer, Tobias Felipe |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Zanchett, Pedro Sidnei |
| dc.contributor.author.fl_str_mv |
Kiefer, Tobias Felipe |
| dc.subject.por.fl_str_mv |
Data Warehouse ETL Automatizado Patentes Análise Textual Inteligência Artificial |
| topic |
Data Warehouse ETL Automatizado Patentes Análise Textual Inteligência Artificial |
| description |
Com o crescimento exponencial de documentos técnicos e científicos, a análise automatizada de informações contidas em bases de patentes tornou-se essencial para subsidiar decisões estratégicas em contextos de inovação. Este trabalho apresenta o desenvolvimento de uma arquitetura automatizada de Data Warehouse, voltada à extração, organização e análise de dados textuais provenientes de arquivos XML do USPTO (United States Patent and Trademark Office). A solução proposta é composta por um pipeline de ETL desenvolvido em Python, que realiza a transformação e carga dos dados em um banco de dados PostgreSQL modelado segundo a abordagem dimensional.Adicionalmente, foi implementada uma API REST com consultas analíticas, permitindo a exploração dos dados por diferentes dimensões, como autor, país, tempo e termos técnicos. Um diferencial da proposta é a utilização de modelos de linguagem natural para extração automática de entidades técnicas, que são integradas ao modelo dimensional para enriquecer semanticamente as análises.Os resultados demonstraram a viabilidade técnica da solução, que se mostrou eficaz para consultas exploratórias, detecção de tendências e apoio à gestão do conhecimento tecnológico. A arquitetura desenvolvida contribui para a democratização do acesso a informações tecnológicas estruturadas, oferecendo uma base sólida para aplicações em inteligência competitiva e prospecção de inovação. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-09-19T16:28:57Z 2025 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
KIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. https://repositorio.udesc.br/handle/UDESC/23286 |
| identifier_str_mv |
KIEFER, Tobias Felipe. <b>ARQUITETURA DE DATA WAREHOUSE AUTOMATIZADO PARA APOIO À GESTÃO DO CONHECIMENTO EM BASES DE PATENTES</b>. 2025. Artigo (Curso de Engenharia de Software) - Udesc, Ibirama, 2025. Disponível em: https://repositorio.udesc.br/handle/UDESC/23286. Acesso em: insira aqui a data de acesso ao material. Ex: 18 fev. 2025. |
| url |
https://repositorio.udesc.br/handle/UDESC/23286 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-ShareAlike 4.0 Brazil http://creativecommons.org/licenses/by-nc-sa/4.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
65 f. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Udesc instname:Universidade do Estado de Santa Catarina (UDESC) instacron:UDESC |
| instname_str |
Universidade do Estado de Santa Catarina (UDESC) |
| instacron_str |
UDESC |
| institution |
UDESC |
| reponame_str |
Repositório Institucional da Udesc |
| collection |
Repositório Institucional da Udesc |
| repository.name.fl_str_mv |
Repositório Institucional da Udesc - Universidade do Estado de Santa Catarina (UDESC) |
| repository.mail.fl_str_mv |
ri@udesc.br |
| _version_ |
1848168373389623296 |