Análise de dados em artigos recuperados da Web of Science (WoS)

AutorMarcelo Batista de Carvalho, Denise Fukumi Tsunoda
Páginas114-127
112
v. 23, n. esp., 2018
p. 112-125
ISSN 1518-2924
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, v. 23, n. esp., p. 112-125, 2018.
ISSN 1518-2924. DOI: 10.5007/1518-2924.2018v23nespp112
Análise de dados em artigos recuperados da Web of
Science (WoS)
Data analysis on articles retrieved from Web of Science (WOS)
Marcelo Batista de CARVALHO (carvalhomarcelob@gmail.com)*
Denise Fukumi TSUNODA (dtsunoda@ufpr.br)**
* Bacharel em Gestão da Informação pela Universidade Federal do Paraná UFPR.
** Professor(a) da Universidade Federal do Paraná UFPR.
Resumo
Dado o contexto da Mineração de Dados e da Mi neração de Textos, objetiva-se analisar dados
recuperados da Web of Science (WoS). Pretende-se identificar padrões nos estudos sobre
Mineração de Textos voltados a escolha de ferramentas a serem utilizadas na aplicação de
método de mineração de dados. Recuperaram-se referências de artigos no formato BibTeX na
plataforma WoS. Desenvolveu-se uma aplicação para inserção de dados do formato BibTeX para
um banco de dados MySQL. Com base nas c aracterísticas encontradas, elegeram-se a ferramenta
R e algoritmo Apriori para utilização em parte dos dados. Extraíram-se da dos de f erramentas,
métodos, palavras-chave, termos, periódicos, países e autores presentes nos registros. A
aplicação do Apriori resultou em treze regras de associaçã o. A exploração dos dados de artigos
provenientes da WoS revelou características dos estudos da área de Mineração de Textos.
Trabalhos futuros podem a daptar a a plicação usada neste estudo e aplicar outros métodos de
mineração no conjunto de dados.
Palavras-chave: R ecuperação da informação. Descoberta de conhecimento em base de dados.
Mineração de texto.
Abstract
In Data mining and Text mining c ontext, the goal is to analyze data retrieved from Web of
Science (WoS). This pape r intends to identify patterns in Text mining researches on selection of
tools to be used on datamining application. References in BibTeX fo rmat were retrieved from
articles existing in WoS platform. An application imported data from BibTe X to a MySQL
database. The found characteristics led to choose the R programming language and the Apriori
algorithm o n a subset of data. Data about tools, methods, keywords, indexing terms, journals,
countries, and authors were identified in records. Apriori result ed on thirteen association rules.
The explo ration of data from WoS articles revealed cha racteristics of Data mining researches.
Future works can adapt the application used on this study and use other datamining methods
on the dataset.
Keywords: Information Retrieval. Knowledge Discovery in Databases. Text Mining.
Esta obra está licenciada sob uma Licença Creative Commons.
ARTIGO
Recebido em:
28/04/2017
Aceito em:
09/04/2018

Para continuar a ler

PEÇA SUA AVALIAÇÃO

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT