A análise de agrupamentos por métodos hierárquicos (HCA - Hierarchical Cluster Analysis) é um método “não supervisionado” de reconhecimento de “padrões naturais” de comportamento em amostras com base em dados multivariados.
Foi desenvolvido inicialmente pelos biólogos para determinar as semelhanças entre organismos e estabelecer relacionamentos entre diferentes espécies, gêneros, famílias etc.
E os químicos também podem querer “discriminar” amostras de água mineral de diferentes localidades a partir da composição da água.
O objetivo da técnica é reunir amostras (objetos) com base na sua “proximidade” (semelhança), reduzindo a “dimensionalidade” dos dados e permitindo a visualização de dados multidimensionais através de um gráfico bidimensional chamado dendrograma.
O dendrograma é a representação gráfica de uma “árvore hierárquica” que representa a estrutura hierárquica dos dados, na qual os comprimentos dos ramos da árvore representam o grau de similaridade entre os objetos, como mostra a figura X.1.