Quando se tem um vasto conjunto de colunas (principalmente numéricas), pode ser interessante reduzir para poucas colunas que representarão bem a variabilidade existente nas diversas colunas.

Um método para isso são as Componentes Principais. O Gaio utiliza o H2O para realizar os cálculos e resumir os dados em poucas colunas. O algoritmo aceita tanto variáveis numéricas quanto categóricas.

Configuração

Para construir a análise de componentes principais, basta clicar na tabela que utilizar, ir no menu Tarefas e escolher Componentes Principais.



Defina a tabela que receberá além dos seus dados, as colunas com as componentes.

Defina quantas componentes deseja que sejam criadas.

Defina colunas que não deseja utilizar na análise como por exemplo Código do Cliente.

Resultados

Nas primeiras colunas são apresentadas as componentes principais e na sequência todas as colunas da tabela de origem.



Nesse exemplo como foram definidas 5 componentes, cinco colunas foram criadas.

Está em desenvolvimento um relatório que trará o diagnóstico da componentes criadas. Por enquanto, somente são geradas, mas não dá para identificar qual o percentual da variabilidade dos dados foram concentrados em cada componente.
Was this article helpful?
Cancel
Thank you!