Um método para povoamento de ontologias: extração de textos da web no idioma português

Lima, Fabio dos Santos

Um método para povoamento de ontologias: extração de textos da web no idioma português

Detalhes bibliográficos
Ano de defesa:	2015
Autor(a) principal:	Lima, Fabio dos Santos
Orientador(a):	Salvador, Laís do Nascimento
Banca de defesa:	Durão, Frederico Araujo, Bulcão Neto, Renato de Freitas
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Instituto de Matemática. Departamento de Ciência da Computação
Programa de Pós-Graduação:	Mestrado Multiinstitucional em Ciência da Computação
Departamento:	Não Informado pela instituição
País:	Brasil
Palavras-chave em Português:	Ontologias Povoamento de Ontologias Extração de Informações
Área do conhecimento CNPq:	Ciência da Computação
Link de acesso:	http://repositorio.ufba.br/ri/handle/ri/19378
Resumo:	A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.

Um método para povoamento de ontologias: extração de textos da web no idioma português

Registros relacionados