Transformando dados em informação: estudos de caso com dados do Twitter e do SourceForge

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Barroso, Rafael de Holanda
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20220712-124807/
Resumo: Grandes quantidades de dados são geradas a cada segundo. Sensores capturando dados de saúde de um paciente, servidores registrando os interesses de usuários em lojas virtuais, sismógrafos medindo a menor vibração do solo. Entretanto, esses dados brutos podem ser utilizados somente se soubermos como interpretá-los. Nesse contexto, mineração de dados se tornou indispensável para extrair informações importantes a partir de dados. Nesse trabalho, estudamos um problema e resolvemos outros dois. Estudamos o TrendFinder, um paradigma para descobrir tendências em séries temporais que organiza o processo de mineração de dados em passos. Estudando a área de inteligência coletiva, realizamos alguns experimentos. No primeiro, usamos dados temporais da lista pública do Twitter, tentamos detectar tendências relacionadas a eventos populares. Em seguida, mudamos para o problema da classificação de textos, classificando aplicações disponíveis no SourceForge através do seu código-fonte. Através de vários experimentos, buscamos informações que possam nos ajudar a encontrar relações entre o código-fonte das aplicações e suas respectivas categorias fundamentais. Em ambos os casos, chegamos a resultados interessantes