BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político
Main Author: | |
---|---|
Publication Date: | 2023 |
Other Authors: | |
Format: | Bachelor thesis |
Language: | por |
Source: | Repositório Institucional da UFSC |
dARK ID: | ark:/67038/001300001skdf |
Download full: | https://repositorio.ufsc.br/handle/123456789/248654 |
Summary: | TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação. |
id |
UFSC_aeff61ff018cdae0ff88ef3e1e1f734b |
---|---|
oai_identifier_str |
oai:repositorio.ufsc.br:123456789/248654 |
network_acronym_str |
UFSC |
network_name_str |
Repositório Institucional da UFSC |
repository_id_str |
2373 |
spelling |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário políticoNERScrapingBERTimbauBERT PolRENTCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação.Atualmente enfrentamos diversos problemas relacionados à sobrecarga de informações, principalmente no âmbito político. Diante dessa situação, estamos em busca de uma solução que facilite a identificação de pessoas, cargos políticos, locais e eventos mencionados nos textos, a fim de filtrar e compreender melhor os acontecimentos. Nesse contexto, é proposto realizar análises utilizando o BERTimbau, uma versão em português do modelo BERT, aplicado a dados coletados por meio de web scraping, com o parâmetro "política Brasil". Nosso objetivo é avaliar a precisão da inferência de Reconhecimento de Entidades Nomeadas (NER) em um cenário seletivo, dividido em cinco classes: PESSOA/CARGO, ABSTRAÇÃO/IDEIA, ACONTECIMENTO, LOCAL/HUMANO e FÍSICO/REGIÃO. Além disso, pretendemos comparar a precisão entre fontes de dados do Twitter e da Wikipedia. Para validar nossa abordagem, adotamos dois métodos distintos, o primeiro consiste em uma validação manual, no qual analisamos individualmente a saída do modelo BERTimbau para a classe "PESSOA/CARGO", gerando gráficos que demonstram a precisão dos resultados obtidos; O segundo método envolve o uso de scripts de validação, que podem ser aplicados posteriormente, para validar uma grande quantidade de dados de forma automatizada. O primeiro método apresenta uma precisão maior, enquanto o segundo método oferece perspectivas promissoras para validações em escala. Com base nas análises e nas precisões obtidas, foi possível verificar a eficiência do modelo BERT PolREN no que diz respeito à resolução do problema identificado.Florianópolis, SC.Dorneles, Carina FriedrichUniversidade Federal de Santa Catarina.Souza, Allison deCamello, Vinicios2023-07-11T20:48:11Z2023-07-11T20:48:11Z2023-07-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://repositorio.ufsc.br/handle/123456789/248654ark:/67038/001300001skdfporOpen Access.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSC2023-07-11T20:48:11Zoai:repositorio.ufsc.br:123456789/248654Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732023-07-11T20:48:11Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false |
dc.title.none.fl_str_mv |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
title |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
spellingShingle |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político Souza, Allison de NER Scraping BERTimbau BERT PolREN |
title_short |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
title_full |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
title_fullStr |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
title_full_unstemmed |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
title_sort |
BERT PolREN: Análise da precisão sobre a inferência textual de reconhecimento de entidades nomeadas do BERTimbau no cenário político |
author |
Souza, Allison de |
author_facet |
Souza, Allison de Camello, Vinicios |
author_role |
author |
author2 |
Camello, Vinicios |
author2_role |
author |
dc.contributor.none.fl_str_mv |
Dorneles, Carina Friedrich Universidade Federal de Santa Catarina. |
dc.contributor.author.fl_str_mv |
Souza, Allison de Camello, Vinicios |
dc.subject.por.fl_str_mv |
NER Scraping BERTimbau BERT PolREN |
topic |
NER Scraping BERTimbau BERT PolREN |
description |
TCC (graduação) - Universidade Federal de Santa Catarina, Centro Tecnológico, Sistemas de Informação. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-07-11T20:48:11Z 2023-07-11T20:48:11Z 2023-07-05 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufsc.br/handle/123456789/248654 |
dc.identifier.dark.fl_str_mv |
ark:/67038/001300001skdf |
url |
https://repositorio.ufsc.br/handle/123456789/248654 |
identifier_str_mv |
ark:/67038/001300001skdf |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Open Access. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Open Access. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Florianópolis, SC. |
publisher.none.fl_str_mv |
Florianópolis, SC. |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSC instname:Universidade Federal de Santa Catarina (UFSC) instacron:UFSC |
instname_str |
Universidade Federal de Santa Catarina (UFSC) |
instacron_str |
UFSC |
institution |
UFSC |
reponame_str |
Repositório Institucional da UFSC |
collection |
Repositório Institucional da UFSC |
repository.name.fl_str_mv |
Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC) |
repository.mail.fl_str_mv |
sandra.sobrera@ufsc.br |
_version_ |
1839033414127190016 |