Prospecção de Conceitos Geográficos na Web

Bibliographic Details
Main Author: Batista, David Soares
Publication Date: 2009
Format: Master thesis
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10451/13867
Summary: Esta dissertação apresenta um estudo feito sobre extracção de informação de documentos, para geração de resumos geográficos. É estudado um método de aprendizagem supervisionada, com base em Conditional Random Fields para extracção de entidades em sequências de texto. O método estudado ´e integrado num sistema desenvolvido no âmbito desta dissertação, o HENDRIX, de forma a poder efectuar a extracção de entidades geográficas para textos em português e o seu tratamento. O tratamento das entidades geográficas extraídas é feito recorrendo a ontologias geográficas. O sistema desenvolvido foi depois usado para fazer a extracção de entidades geográficas de uma colecção de documentos, que representa uma recolha da web portuguesa, sob um cluster de computadores. São apresentados os resultados do desempenho do modelo gerado para extracção de informação geográfica e a análise das entidades geográficas extraídas da recolha da web portuguesa. A partir dos resultados observou-se que o corpus usado para treinar o modelo não é suficientemente expressivo para treinar um modelo de extracção de informação geográfica.
id RCAP_583a464e5715d4546a18a031afca10b9
oai_identifier_str oai:repositorio.ulisboa.pt:10455/3318
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Prospecção de Conceitos Geográficos na Webextracção de informação geográficaontologias geográficasweb semânticaconditional random fieldsEsta dissertação apresenta um estudo feito sobre extracção de informação de documentos, para geração de resumos geográficos. É estudado um método de aprendizagem supervisionada, com base em Conditional Random Fields para extracção de entidades em sequências de texto. O método estudado ´e integrado num sistema desenvolvido no âmbito desta dissertação, o HENDRIX, de forma a poder efectuar a extracção de entidades geográficas para textos em português e o seu tratamento. O tratamento das entidades geográficas extraídas é feito recorrendo a ontologias geográficas. O sistema desenvolvido foi depois usado para fazer a extracção de entidades geográficas de uma colecção de documentos, que representa uma recolha da web portuguesa, sob um cluster de computadores. São apresentados os resultados do desempenho do modelo gerado para extracção de informação geográfica e a análise das entidades geográficas extraídas da recolha da web portuguesa. A partir dos resultados observou-se que o corpus usado para treinar o modelo não é suficientemente expressivo para treinar um modelo de extracção de informação geográfica.Silva, Mário Jorge Costa Gaspar daRepositório da Universidade de LisboaBatista, David Soares2010-02-19T11:49:41Z20092009-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10451/13867porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-03-17T13:11:53Zoai:repositorio.ulisboa.pt:10455/3318Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T02:37:21.731541Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Prospecção de Conceitos Geográficos na Web
title Prospecção de Conceitos Geográficos na Web
spellingShingle Prospecção de Conceitos Geográficos na Web
Batista, David Soares
extracção de informação geográfica
ontologias geográficas
web semântica
conditional random fields
title_short Prospecção de Conceitos Geográficos na Web
title_full Prospecção de Conceitos Geográficos na Web
title_fullStr Prospecção de Conceitos Geográficos na Web
title_full_unstemmed Prospecção de Conceitos Geográficos na Web
title_sort Prospecção de Conceitos Geográficos na Web
author Batista, David Soares
author_facet Batista, David Soares
author_role author
dc.contributor.none.fl_str_mv Silva, Mário Jorge Costa Gaspar da
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Batista, David Soares
dc.subject.por.fl_str_mv extracção de informação geográfica
ontologias geográficas
web semântica
conditional random fields
topic extracção de informação geográfica
ontologias geográficas
web semântica
conditional random fields
description Esta dissertação apresenta um estudo feito sobre extracção de informação de documentos, para geração de resumos geográficos. É estudado um método de aprendizagem supervisionada, com base em Conditional Random Fields para extracção de entidades em sequências de texto. O método estudado ´e integrado num sistema desenvolvido no âmbito desta dissertação, o HENDRIX, de forma a poder efectuar a extracção de entidades geográficas para textos em português e o seu tratamento. O tratamento das entidades geográficas extraídas é feito recorrendo a ontologias geográficas. O sistema desenvolvido foi depois usado para fazer a extracção de entidades geográficas de uma colecção de documentos, que representa uma recolha da web portuguesa, sob um cluster de computadores. São apresentados os resultados do desempenho do modelo gerado para extracção de informação geográfica e a análise das entidades geográficas extraídas da recolha da web portuguesa. A partir dos resultados observou-se que o corpus usado para treinar o modelo não é suficientemente expressivo para treinar um modelo de extracção de informação geográfica.
publishDate 2009
dc.date.none.fl_str_mv 2009
2009-01-01T00:00:00Z
2010-02-19T11:49:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10451/13867
url http://hdl.handle.net/10451/13867
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833601429791571968