Title:
|
AGRUPAMENTO DE DADOS MISTOS BASEADOS NO ALGORITMO K-MEANS: UMA REVISÃO SISTEMÁTICA DA LITERATURA |
Author(s):
|
Nádia Junqueira Martarelli e Marcelo Seido Nagano |
ISBN:
|
978-989-8533-96-8 |
Editors:
|
Paula Miranda, Cristiano Costa, Pedro Isaías e Flávia Maria Santoro |
Year:
|
2019 |
Edition:
|
Single |
Keywords:
|
Agrupamento de Dados Mistos, K-means, Atributos Numéricos e Categóricos, Clustering, Revisão Sistemática |
Type:
|
Full |
First Page:
|
199 |
Last Page:
|
206 |
Cover:
|
|
Full Contents:
|
click to dowload
|
Paper Abstract:
|
O agrupamento de dados é uma atividade de mineração que busca por grupos naturais em conjuntos de dados não
rotulados. Embora bem desenvolvida para dados numéricos, o desenvolvimento de algoritmos para dados mistos
(atributos numéricos e categóricos) ainda é incipiente. Diante do fato de que os conjunto de dados mistos caracterizam a
maioria dos problemas reais, o avanço desta temática é essencial para o beneficiamento da sociedade e da indústria.
Dessa forma, este trabalho tem como objetivo reunir e discutir as principais contribuições publicadas na literatura sobre
algoritmos de agrupamento de dados mistos, especificamente as abordagens baseadas no algoritmo k-means, já que este
algoritmo apresenta alta velocidade de processamento e fácil implementação, características estas almejadas na resolução
de problemas do mundo real. Diante disso, realizou-se uma revisão bibliográfica sistemática na base de dados Scopus,
onde foram aceitos apenas artigos em inglês, com o indicador Jornal Citation Report (JCR) maior ou igual a um, ou com
pelo menos dois indicadores de impacto maior ou igual a um. Como primeiro resultado da busca, obteve-se 1.104
trabalhos. Após a aplicação dos critérios adotados, obteve-se 456 trabalhos passíveis de avaliação. Posteriormente,
avaliou-se quais trabalhos estavam dentro do objetivo da análise, por meio de três filtros de seleção, os quais
contemplaram diferentes leituras dos trabalhos. Como resultado, obteve-se 37 artigos. Após um estudo detalhado,
observou-se que esta temática ainda apresenta um desenvolvimento recente e esparso. Além disso, percebeu-se que os
trabalhos selecionados exploraram alguns temas-chave, como a definição dos pesos dos atributos, número de grupos,
inicialização dos centroides e agrupamento sujeito a restrições. |
|
|
|
|