RISO - TT - extração de expressões temporais em textos.
Ano de defesa: | 2013 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1263 |
Resumo: | A necessidade de gerenciar a grande quantidade de documentos digitais existentes na atualidade, associada à incapacidade humana de analisar todas essas informações em tempo hábil, fez com que as pesquisas e o desenvolvimento de sistemas na área de automatização de processos para a gestão de informação crescessem, no entanto, essa atividade não é trivial. A maioria dos documentos disponíveis não tem estrutura bem definida (padronizada), o que torna difícil a criação de mecanismos computacionais que automatizem a análise das informações e gera a necessidade de se promoverem atividades intermediárias de conversão de informações em linguagem natural em informações estruturadas. Para isso, são necessárias atividades de reconhecimento de padrões nominais, temporais e espaciais. No tocante a essa pesquisa, o objetivo principal foi criar um mecanismo de reconhecimento de padrões temporais. Heuristicamente, foi criado um dicionário de regras baseadas em associações de padrões temporais e desenvolvido um módulo de marcação e recuperação de padrões temporais em uma arquitetura extensível e flexível, chamado RISO-TT, que implementa esse mecanismo de reconhecimento de padrões temporais. Esse módulo faz parte do projeto de pesquisa RISO (Recuperação da Informação Semântica de Objetos Textuais). Foram realizados dois experimentos para avaliar a eficiência do RISO-TT. O primeiro, com o intuito de verificar a extensibilidade e a flexibilidade do módulo RISO-TT, e o segundo, para analisar a eficiência da abordagem proposta com base em uma comparação com duas ferramentas consolidadas no meio académico (HeidelTime e SuTime). O RISO-TT obteve resultados superiores aos concorrentes no processo de marcação de expressões temporais, comprovados por meio de testes estatísticos. |