--- title: "Exemplo: dados qualitativos em FMI" output: rmarkdown::html_vignette vignette: > %\VignetteIndexEntry{Exemplo: dados qualitativos em FMI} %\VignetteEngine{knitr::rmarkdown} %\VignetteEncoding{UTF-8} --- ```{r, include = FALSE} knitr::opts_chunk$set( collapse = TRUE, comment = "#>" ) ``` # Ativando o pacote Após a instalação do pacote é preciso ativa-lo. Para isso, deve-se utilizar a função `library` ou `require` ```{r} library(MultivariateAnalysis) ``` # Abrindo o conjunto de dados Posteriormente, deve-se carregar no R o conjunto de dados a serem analizados. Isso pode ser feito de diferentes formas. Uma possibilidade é utilizando a função `read.table`. Neste exemplo vamos trabalhar com o banco de dados do pacote, o qual pode ser carregado com a função `data`. Este exemplo trata-se de dados multicategóricos em Famílias de Meios Irmãos. ```{r} data("Dados.FMI.Quali") head(Dados.FMI.Quali) ``` #Obtendo a porcentagem de cada classificação em nível de tratamento. ```{r} Fator=Dados.FMI.Quali$Tratamento DadosQuali=Dados.FMI.Quali[,6:10] Dados2=ApplyDissimilaridade(Dados = DadosQuali,Factor = Fator) (head(Dados2)) ``` # Obtenção de medidas de dissimilaridade Muitas são as opções que este pacote oferece de medidas de dissimilaridade. Convidamos os usuários a ler o manual da funcao `Distancia` (`?Distancia`). Para se ter diferentes medidas de dissimilaridade basta colocar o respectivo numero no argumento `Metodo` dentro da função `Distancia`: ### Dados quantitativos 1 = Distancia euclidiana. 2= Distancia euclidiana media. 3 = Quadrado da distancia euclidiana media. 4 = Distancia euclidiana padronizada. 5 = Distancia euclidiana padronizada media. 6 = Quadrado da distancia euclidiana padronizada media. 7 = Distancia de Mahalanobis. 8 = Distancia de Cole Rodgers. ```{r} #distancia euclidiana padronizada Dist=Distancia(Dados2,Metodo = 4) ``` Informações importantes podem ser obtidas dessa matriz com a função `SummaryDistancia`: ```{r} resumo=SummaryDistancia(Dist) resumo ``` A fim de resumir as informações da matriz de dissimilaridade a fim de melhorar a visualização da dissimilaridade, pode-se fazer um Dendrograma com o auxilio da função `Dendrograma`. Varios algoritimos podem ser utilizados para a construção deste Dendrograma. Para isso, deve-se indicar no argumento `Metodo`: 1 = Ligacao simples (Metodo do vizinho mais proximo). 2 = Ligacao completa (Metodo do vizinho distante). 3 = Ligacao media entre grupo (UPGMA). 4 = Metodo de Ward. 5 = Metodo de ward (d2). 6= Metodo da mediana (WPGMC). 7= Metodo do centroide (UPGMC). 8 = Metodo mcquitty (WPGMA). ```{r} #Dendrograma com o metodo UPGMA Dendo=Dendrograma(Dist,Metodo=3) Dendo$SigCorrelCofenetica Dendo$MojenaCorte ``` Adcionalmente, pode-se fazer o agrupamento Tocher com o auxilio da função `Tocher`: ```{r} #Dendrograma com o metodo UPGMA To=Tocher(Dist) To$Tocher To$DistanciaIntraInterCluster To$CorrelacaoCofenetica ``` Outra possibilidade é o estudo da dispersão da matriz de dissimilaridade pelas técnica de coordenadas principais: ```{r} CO=CoordenadasPrincipais(Dist) ``` Logo, quando se tem dados quantitativos faz mais sentido utilizar os componentes principais que coordenadas principais em situações quando irá se considerar a distância euclidiana padronizada.