Conteúdo do site
Submenu: Indicadores de Pesquisa

VantagePoint

VantagePointO software VantagePoint (VP) é uma importante ferramenta de mineração e análise de dados que está disponível aos bibliotecários e técnicos do Sistema de Bibliotecas da USP (SIBiUSP) por meio de acesso remoto a computadores virtuais especialmente preparados para utilização desse aplicativo. Por meio do VantagePoint é possível realizar análises bibliométricas e estudos relacionados à produção científica de uma determinada área de conhecimento, instituição ou pesquisador, análise de coleções, verificação de erros e inconsistências em registros bibliográficos, bem como análises de tendências de pesquisa, desde que se tenha o arquivo de dados, que pode ser obtido a partir de bases de dados como a Web of Science, Scopus, etc, ou bancos de dados bibliográficos como o Dedalus (Aleph/USP).

Para acesso a essa ferramenta de análise bibliométrica, consulte a sua Biblioteca.

O trabalho de text mining segue um procedimento padrão de (a) Obtenção de Dados, (b) Importação de Arquivos, (c) Limpeza de Dados e (d) Mapeamento e Análise de Dados, e se baseia em dados coletados e uso de filtros específicos. Enquanto os dados referem-se a um conjunto ou subconjunto das informações que se deseja analisar, os filtros são recursos para importar e pré-processar os dados para que eles sejam manipuláveis pelo software de text mining.

a) Obtenção de Dados

O primeiro passo do processo se inicia com a pesquisa realizada em bases de dados como a Web of ScienceSCOPUSDerwentCompendex, entre outras. O conjunto de dados textuais estruturados obtidos segundo a estratégia de busca selecionada, gera um arquivo que pode ser salvo em *.txt, *.dat, *.csv, *.tag, *.trn, *.xls, *.xlsx, *.mdb, *.accdb, *.ris, ou *.xml.

b) Importação de Arquivos

O segundo passo tem o objetivo de carregar os dados no software VantagePoint. O usuário inicia a utilização do VantagePoint importando o arquivo salvo para dentro do aplicativo. Seguindo os passos, o próprio VantagePoint apontará o filtro mais apropriado e, na falta deste, o usuário deverá utilizar a barra de ferramentas no Help do aplicativo para importar o filtro adequado à leitura de dados a partir do site do VantagePoint.

Após a seleção do filtro, caso necessário, o usuário poderá então selecionar os campos a serem importados para o VantagePoint. A opção de importação de todos os dados é a mais recomendada para uma análise inicial. Apos a importação, será exibido na área central do VantagePoint um sumário de dados (Summary), contendo a lista dos principais itens do arquivo importado. Também é possível importar dados de uma planilha Excel ou do Access e, a partir dela, realizar o processo. Pelo Summary, é possível observar a cobertura de dados. Recomenda-se a escolha de itens que contenham em torno de 100% de cobertura, pois são os mais consistentes em relação ao número de registros recuperados.

c) Limpeza de Dados

O terceiro passo tem o objetivo de eliminar registros irrelevantes ou com dados problemáticos para melhorar a qualidade das análises. A limpeza dos dados sempre deve ser feita de modo a garantir que apenas registros relevantes, não repetidos e consistentes sejam contabilizados e analisados. A limpeza se inicia pelos dados que individualizam os registros e que exibam em torno de 100% de cobertura. Para iniciar a limpeza, escolha um dos itens e clique com o botão direito do mouse para exibir opções. O próprio VantagePoint exibe a lista limpa (Cleaned), porém a limpeza também pode ser manual. A limpeza é especialmente útil no caso de denominações distintas para um mesmo autor ou instituição. Ex. USP e Universidade de São Paulo. Neste caso, a limpeza consiste em agrupar tais registros.

d) Mapeamento e Análise de Dados

O último passo é o mais específico de todos. Depois da limpeza de dados, de acordo com o foco da análise, o usuário deve selecionar os dados importantes para o cruzamento e criação de matrizes, a partir das quais serão gerados tabelas, gráficos e mapas.

VP

Tutoriais e Exemplos de Estudos utilizando o VantagePoint

Fim do conteúdo, você pode: