Detalhes bibliográficos
Ano de defesa: |
2014 |
Autor(a) principal: |
Alexandre Donizeti Alves |
Orientador(a): |
Nei Yoshihiro Soma,
Horacio Hideki Yanasse |
Banca de defesa: |
Edson Luiz França Senne,
Ana Paula Cabral Seixas Costa,
Paulo Afonso de Oliveira Soviero |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Nacional de Pesquisas Espaciais (INPE)
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação do INPE em Computação Aplicada
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Resumo em Inglês: |
The explosive growth and popularity of the Web has resulted in many sources of information on the Internet. The Web is nowadays a great source of information, hence the process of extracting relevant content is an important problem. Tools that automatically extract only the data of interest are increasingly needed, in order to facilitate the access and the manipulation of the relevant information. Government agencies for research funding increasingly strive to leave public data and information on teaching and research in Brazil, from financial investments to information about the researchers, in general. This paper describes a set of computational tools developed for the extraction of information in public databases of national and international scientific data. This makes it possible to perform analysis and studies of the scientific production of researchers, institutions, areas and even countries. This knowledge allows managers to define more clearly public policies. These studies also can contextualize the Brazilian scientific production in the international scenario. To show the potential of the tools developed some case studies were performed. In one of the studies, inconsistencies in scientific databases were identified. In another study, a methodology to identify researchers who actually work in a particular area of knowledge was defined. A new index that measures the level of collaboration between the authors of an article was also proposed. |
Link de acesso: |
http://urlib.net/sid.inpe.br/mtc-m21b/2014/03.21.14.11
|
Resumo: |
O crescimento explosivo e a popularidade da Web têm resultado em uma grande quantidade de fontes de informação na Internet. A Web é hoje uma grande fonte de informação, fazendo com que o processo de extração de informações relevantes de conteúdos Web seja considerado um problema importante. Cada vez mais se fazem necessárias ferramentas capazes de extrair automaticamente os dados de interesse de um usuário, facilitando o acesso e a manipulação dessas informações. Agências governamentais de fomento à pesquisa se empenham cada vez mais em deixar público dados e informações sobre o ensino e pesquisa no Brasil, desde investimentos financeiros até informações sobre os pesquisadores em geral. Este trabalho descreve um conjunto de ferramentas computacionais desenvolvidas para a extração de informações em bases públicas de dados científicas nacionais e internacionais. Com isso é possível realizar análises e estudos da produção científica de pesquisadores, instituições, áreas e até mesmo países. Esse conhecimento permite que políticas públicas sejam mais bem definidas. Além disso, esses estudos podem contextualizar a produção científica brasileira no cenário internacional. Para mostrar as potencialidades das ferramentas desenvolvidas foram realizados alguns estudos de casos. Em um dos estudos foi possível identificar inconsistências em algumas bases de dados científicas. Em outro estudo foi definida uma metodologia para identificar pesquisadores que realmente atuam em uma determinada área do conhecimento. Também foi proposto um novo índice que permite medir o nível de colaboração entre os autores de um artigo. |