Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Martins, Victor Hugo Penhalves |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://hdl.handle.net/11449/191893
|
Resumo: |
A quantidade de dados tem crescido significativamente nos últimos anos, principalmente em formatos de textos e não estruturados, com a colaboração efetiva das mídias sociais. Tais plataformas podem ser definidas como aplicativos de internet que podem ser web ou mobile e permitem a criação, acesso e a troca de conteúdos criados por usuários. Com isso, o conjunto de dados produzidos por essas mídias podem ser chamados de Big Data e são especialmente importantes para pesquisas computacionais de extração de conhecimento. O termo Big Data pode ser definido como um grande volume de dados complexos provenientes de múltiplas fontes que desafiam a capacidade de armazenamento e processamento dos computadores com as tecnologias atuais. Com isso, as técnicas de programação distribuída e paralela têm sido amplamente utilizadas a fim de retornar em tempo hábil os resultados dos algoritmos de extração de conhecimento em dados de mídias sociais. Tendo em vista as características dos dados criados nas mídias sociais e o aumento de pessoas no mundo com problemas relacionados a transtornos de saúde, ferramentas que analisam esses dados para encontrar correlações podem contribuir para o cenário atual. Dessa forma, a contribuição científica deste trabalho está no desenvolvimento de algoritmos paralelos para prospecção de conhecimento em dados textuais, com foco em mídias sociais, que permita a classificação dos indivíduos em classes comuns e que considera o contexto inserido. Os resultados de desempenho indicam que a ferramenta com abordagem paralela desenvolvida foi capaz de reduzir em cerca de 11 vezes o tempo de préprocessamento, extração de características e classificação. |