Função

Análise discriminante descritiva permite descrever dois ou mais grupos de indivíduos (por exemplo, de pessoas) em termos das variáveis ​​que têm disponíveis e nas maneiras que fazem as diferenças entre os grupos tão grandes quanto possível. Ele usa as informações sobre as médias e desvios-padrão das variáveis ​​para criar combinação ponderada de variáveis ​​que distinguem os grupos.

Tipos

Os dois tipos principais de análise discriminante são paramétrica e não paramétrica. Análise discriminante paramétrica assume a distribuição de cada um dos grupos é normal multivariada. Análise discriminante não-paramétrico relaxa essa hipótese, com algum custo no poder.

Tipos de Parametric análise discriminante 

O tipo mais comum de análise discriminante paramétrica é a análise discriminante linear de Fisher, o que cria combinações lineares das variáveis. Este é o valor de cada variável é multiplicado por uma constante, e, por conseguinte, estes produtos são adicionados em conjunto para criar uma pontuação discriminante. Uma alternativa é a análise discriminante quadrática, o que aumenta os termos quadrático.

Tipos de análise discriminante não paramétrica

Dois tipos comuns são a análise discriminante kernel não-paramétricos e k-vizinhos mais próximo. Análise discriminante Kernel estima a distribuição das variáveis ​​em cada grupo utilizando um de uma variedade de funções de complexos conhecidos como estimativas de densidade de kernel. Estes são necessários porque, quando a distribuição de uma variável não é normal, a média eo desvio padrão não são suficientes para descrever a distribuição.

Métodos k-vizinhos mais próximos antes de definir a "proximidade" e depois tentar identificar grupos de indivíduos que são o mais próximo possível uns dos outros.

Conjuntos de treinamento e dados de teste

Todos os métodos de análise discriminante são normalmente desenvolvidas em um conjunto de dados de treinamento e, em seguida, testado em um conjunto de dados de teste separadas. O método usual envolve a separação, eventualmente, o conjunto de dados iniciais em dois, e usar um para treinamento e outro para o controle.