Detalhes bibliográficos
Ano de defesa: |
2010 |
Autor(a) principal: |
Barroso, Rafael de Holanda |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124807/
|
Resumo: |
Grandes quantidades de dados são geradas a cada segundo. Sensores capturando dados de saúde de um paciente, servidores registrando os interesses de usuários em lojas virtuais, sismógrafos medindo a menor vibração do solo. Entretanto, esses dados brutos podem ser utilizados somente se soubermos como interpretá-los. Nesse contexto, mineração de dados se tornou indispensável para extrair informações importantes a partir de dados. Nesse trabalho, estudamos um problema e resolvemos outros dois. Estudamos o TrendFinder, um paradigma para descobrir tendências em séries temporais que organiza o processo de mineração de dados em passos. Estudando a área de inteligência coletiva, realizamos alguns experimentos. No primeiro, usamos dados temporais da lista pública do Twitter, tentamos detectar tendências relacionadas a eventos populares. Em seguida, mudamos para o problema da classificação de textos, classificando aplicações disponíveis no SourceForge através do seu código-fonte. Através de vários experimentos, buscamos informações que possam nos ajudar a encontrar relações entre o código-fonte das aplicações e suas respectivas categorias fundamentais. Em ambos os casos, chegamos a resultados interessantes |