X. Análise de Agrupamentos por Métodos Hierárquicos - HCA

A análise de agrupamentos por métodos hierárquicos (HCA - Hierarchical Cluster Analysis) é um método não supervisionado de reconhecimento de padrões naturais de comportamento em amostras com base em dados multivariados.

Foi desenvolvido inicialmente pelos biólogos para determinar as semelhanças entre organismos e estabelecer relacionamentos entre diferentes espécies, gêneros, famílias etc.

E os químicos também podem querer discriminar amostras de água mineral de diferentes localidades a partir da composição da água.

O objetivo da técnica é reunir amostras (objetos) com base na sua proximidade (semelhança), reduzindo a dimensionalidade dos dados e permitindo a visualização de dados multidimensionais através de um gráfico bidimensional chamado dendrograma.

O dendrograma é a representação gráfica de uma árvore hierárquica que representa a estrutura hierárquica dos dados, na qual os comprimentos dos ramos da árvore representam o grau de similaridade entre os objetos, como mostra a figura X.1.

Figura X.1. Exemplo ilustrativo de um dendrograma (Fonte: Wikipedia)

Exemplo ilustrativo de um dendrograma (Fonte: Wikipedia)