Detalhes bibliográficos
Ano de defesa: |
2001 |
Autor(a) principal: |
Imamura, Cristiane Yae- Mi |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19012018-144536/
|
Resumo: |
A descoberta de conhecimento em bases de dados é uma área de pesquisa que tem crescido rapidamente, e cujo desenvolvimento tem. sido dirigido ao benefício das necessidades práticas. sociais e econômicas. entre outras. Entretanto. mesmo em bases de dados podem estar presentes campos importantes que não são considerados na análise, como aqueles preenchidos com informações textuais. Essas informações não estão presentes apenas em tabelas, mias também em diversos documentos que são disponibilizados e acessados através da Internet. Para tornar a descoberta de conhecimento em textos possível, tem-se associado estratégias de preparação/pré-proccssamento de textos e técnicas utilizadas no processo Data Mining. Essa associação vem sendo denominada de processo Text Mining. Tendo em vista a importância da preparação dos textos. neste trabalho foi projetado e construído um módulo de pré-processamento de textos, com a finalidade de tornar possível a realização do processo Text Mining considerando textos em português. Devido ao fato de que muitas estratégias e/ou ferramentas estarem disponíveis somente para o inglês, a possibilidade de realizar a descoberta de padrões em textos em português pode significar o alcance de novos horizontes era termos de oportunidades e informações desconhecidas. |