Componentes Principais

Quando se tem um vasto conjunto de colunas (principalmente numéricas), pode ser interessante reduzir para poucas colunas que representarão bem a variabilidade existente nas diversas colunas.
Um método para isso são as Componentes Principais. O Gaio utiliza o H2O para realizar os cálculos e resumir os dados em poucas colunas. O algoritmo aceita tanto variáveis numéricas quanto categóricas.
Para construir a análise de componentes principais, basta clicar na tabela que utilizar, ir no menu Tarefas e escolher Componentes Principais.

- 1.Defina a tabela que receberá além dos seus dados, as colunas com as componentes.
- 2.Defina quantas componentes deseja que sejam criadas.
- 3.Defina colunas que não deseja utilizar na análise como por exemplo Código do Cliente.
Nas primeiras colunas são apresentadas as componentes principais e na sequência todas as colunas da tabela de origem.

Nesse exemplo como foram definidas 5 componentes, cinco colunas foram criadas.
Está em desenvolvimento um relatório que trará o diagnóstico da componentes criadas. Por enquanto, somente são geradas, mas não dá para identificar qual o percentual da variabilidade dos dados foram concentrados em cada componente.
Last modified 1yr ago