Package 'MultivariateAnalysis'

Title: Pacote Para Analise Multivariada
Description: Package with multivariate analysis methodologies for experiment evaluation. The package estimates dissimilarity measures, builds dendrograms, obtains MANOVA, principal components, canonical variables, etc. (Pacote com metodologias de analise multivariada para avaliação de experimentos. O pacote estima medidas de dissimilaridade, construi de dendogramas, obtem a MANOVA, componentes principais, variaveis canonicas, etc.)
Authors: Alcinei Mistico Azevedo [aut, cre]
Maintainer: Alcinei Mistico Azevedo <[email protected]>
License: GPL-3
Version: 0.5.0
Built: 2024-12-05 07:11:30 UTC
Source: CRAN

Help Index


Analise de variancia considerando clusters

Description

Esta funcao retorna o resultado da analise de variancia considerando clusters formados por diferentes metodos como dendrograma, kmeans, Tocher, etc.

Usage

AnovaCluster(Cluster,Dados=Dados,design=design,test="Pillai")

Arguments

Cluster

Vetor contendo os grupos que cada individuo/tratamento pertence. Veja os exemplos.

Dados

Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Design 1: Deve ter apenas os dados numericos da pesquisa. Na primeira linha não deve ter o nome dos individuos/tratamentos.

  • Design 2 e 3: As duas primeiras colunas devem conter a identificacao dos tratamentos e repeticoes/blocos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 4: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 5 e 6: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

design

Valor numerico indicando o delineamento:

  • 1 = Experimento sem repeticoes.

  • 2 = Delineamento inteiramente casualizado (DIC) .

  • 3 = Delineamento em blocos casualizados (DBC).

  • 4 = Delineamento em quadrado latino (DQL).

  • 5 =Esquema fatorial duplo em DIC.

  • 6 = Esquema fatorial duplo em DBC.

test

Nome do teste que se deseja utilizar na manova ("Pillai", "Wilks", "Hotelling-Lawley" ou "Roy").

Value

A funcao retorna a ANOVA, para todas as variaveis considerando os clustes criados.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Tocher , Dendrograma

Examples

#######################################################
#######################################################
#Dados sem repeticoes considerando o Kmeans
data(Dados.MED)
Km=Kmeans(Dados = Dados.MED,design = 1,nclusters = 4)
AnovaCluster(Cluster = Km$Classe,Dados=Dados.MED,design = 1)

#Dados sem repeticoes considerando o Tocher
dist=Distancia(Dados = Dados.MED,Metodo = 3)
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.MED,design = 1)

#Dados sem repeticoes considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey")
Dendro
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.MED,design = 1)
#######################################################################
#######################################################################
#DIC considerando o Kmeans
data(Dados.DIC)
N=Kmeans_NumeroOtimo2(Dados = Dados.DIC,design = 2)
Km=Kmeans(Dados = Dados.DIC,design = 3,nclusters = N$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DIC,design = 2)

#DIC considerando o Tocher
m=MANOVA(Dados.DIC,Modelo=1)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DIC,design = 2)

#DIC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey")
Dendro
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DIC,design = 2)

#######################################################################
#######################################################################
#DBC considerando o Kmeans
data(Dados.DBC)
n=Kmeans_NumeroOtimo2(Dados = Dados.DBC,design = 3)
Km=Kmeans(Dados = Dados.DBC,design = 3,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DBC,design = 3)

#DBC considerando o Tocher
m=MANOVA(Dados.DBC,Modelo=2)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
dist
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DBC,design = 3)

#DBC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Mcclain")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DBC,design = 3)


#######################################################################
#######################################################################
#DQL considerando o Kmeans
data(Dados.DQL)
n=Kmeans_NumeroOtimo2(Dados = Dados.DQL,design = 4)
Km=Kmeans(Dados = Dados.DQL,design = 4,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DQL,design = 4)

#DQL considerando o Tocher
m=MANOVA(Dados.DQL,Modelo=2)
dist=Distancia(Dados = m$Med,Metodo = 3)
dist
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DQL,design = 4)

#DQL considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DQL,design = 4)



#######################################################################
#######################################################################
#Fat duplo em dic considerando o Kmeans
data("Dados.Fat2.DIC")
n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DIC,design = 5)
Km=Kmeans(Dados = Dados.Fat2.DIC,design = 5,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DIC,design = 5)

#Fat2.DIC considerando o Tocher
m=MANOVA(Dados.Fat2.DIC,Modelo=4)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO$Classe
AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DIC,design = 5)

#Fat2.DIC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DIC,design = 5)



#######################################################################
#######################################################################
#Fat duplo em dbc considerando o Kmeans
data("Dados.Fat2.DBC")
n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DBC,design = 6)
Km=Kmeans(Dados = Dados.Fat2.DBC,design = 5,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DBC,design = 5)

#Fat2.DBC considerando o Tocher
m=MANOVA(Dados.Fat2.DBC,Modelo=5)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO$Classe
AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DBC,design = 5)

#Fat2.DBC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Cindex")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DBC,design = 6)

ApplyDissimilaridade

Description

Esta funcao pode ser utilizado para experimentos com dados qualitativos cujos individuos que compoe cada tratamento possuem valores diferentes. Desta forma, obtem se o a porcentagem de cada classificao para os tratamentos.

Usage

ApplyDissimilaridade(Dados,Factor)

Arguments

Dados

Matriz contendo os dados qualitativos. Nesta matriz deve conter apenas os dados qualitativos. Nao pode ter a identificacao de tratamentos, blocos, etc.

Factor

Vetor com os niveis a partir dos quais se pretende obter as porcentagem de cada classificacao.

Value

A funcao retorna a porcentagem de cada classificao referente aos dados qualitativos para os tratamentos.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN13:9788581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN13:9780138132637)

See Also

hclust, dist

Examples

data(Dados.FMI.Quali)
DadosQuali=ApplyDissimilaridade(Dados.FMI.Quali[,6:10],Dados.FMI.Quali[,2])
Dist=Distancia(DadosQuali,1)
Dist
Dendo=Dendrograma(Dist, 3)
Dendo

Componentes principais

Description

Esta funcao possibilita o estudo dos componentes principais.

Usage

ComponentesPrincipais(D,
padronizar=TRUE,
layout=8,
cols=c(1,2),
xlab="PCA 1",
ylab="PCA 2",
CR=TRUE,
CorPlot=TRUE,
CorCol="red",
VarCol="blue",
Perc=0.1,
NomeTrat=NULL,
NomeVar=NULL,
bty="L")

Arguments

D

Matriz com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Se provir de experimento com repeticao, a matriz deve conter apenas as medias dos tratamentos.

padronizar

Se for TRUE (default) os dados serao padronizados para ter media 0 e variancia igual a 1. Se for FALSE os componentes principais considerarao os valores originais.

layout

Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente.

cols

vetor contendo dois numeros indicando os componentes principais que serao utilizados na representacao bidimencional. Default = c(1,2).

xlab

Nome do eixo X do grafico de componentes principais.

ylab

Nome do eixo Y do grafico de componentes principais.

CR

Valor logico.Se for TRUE aparecera a contribuicao relativa dos dois primeiros componentes principais no grafico.

CorPlot

Valor logico. Se for TRUE sera apresentado no grafico as correlacoes.

CorCol

Indica a cor das setas referente a apresentacao das correlacoes no grafico (default = "red").

VarCol

Cor do nome das variavies na dispersao grafica da correlacao.

Perc

Valor entre 0 e 1 indicando o recuo dos eixos.

NomeTrat

vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados)

NomeVar

Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados)

bty

Deve receber um character indicando o tipo de borda desejado no grafico:

  • "o": Todas as bordas.

  • "n": Sem bordas.

  • "7" : Acima e a direita.

  • "L" : Abaixo + esquerda (Default).

  • "C" : Acima + Direita + Abaixo.

  • "U" : Direita + Abaixo + Direita.

Value

Esta funcao retorna informacoes importantes para o estudo de componentes princiapais. Sao apresentados autovalores e autovetores da matriz de covariancia, Escores dos componentes principais, correlacao entre as variaveis e eos escores, contribuicao na explicacao de cada componente e o grafico de dispersao dos CPs.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

eigen, princomp

Examples

data(Dados.MED)
ComponentesPrincipais(Dados.MED)
#Atribuindo nome aos tratamentos
Trat=paste("T_",1:nrow(Dados.MED),sep="")
ComponentesPrincipais(Dados.MED,NomeTrat = Trat)

ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=1)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=2)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=3)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=4)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=5)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=6)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=7)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=8)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=9)


ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = FALSE)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,
CorCol = "blue",VarCol="red" )
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,bty = "n")

Componentes principais para dados mistos (qualitativos e quantitativos)

Description

Esta funcao possibilita o estudo dos componentes principais considerando dados quantitativos e qualitativos simultaneamente.

Usage

ComponentesPrincipais.Misto(Dados,
plot="all",
NomeTrat=NULL,
NomeVar=NULL)

Arguments

Dados

Dataframe com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Ha a opcao de colocar o nomes nas linhas para a representacao grafica. Obrigatoriamente, as colunas com as variaveis quantitivas devem ser do tipo "numeric" ou "integer". Ja as colunas com valores dos dados qualitativos devem ser do tipo "logic", "character" ou "factor.

plot

Indica o tipo de grafico desejado:

  • "all": Serao apresentados os quatro tipos de graficos.

  • "individuos": Sera apresentado o grafico com a dispersao dos individuos (tratamentos).

  • "nivel" : Sera apresentado o grafico com a dispersao dos niveis das variaveis qualitativas.

  • "correlacao" : Sera apresentado o grafico com a correlacao das variaveis quantitativas com os componentes principais.

  • "pesos" : Sera apresentado no grafico a contribuicao de cada variavel qualitativa na explicao dos componentes.

NomeTrat

vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados)

NomeVar

Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados)

Value

Esta funcao retorna informacoes importantes para o estudo de componentes princiapais considerando dados quantitativos e qualitativos simultaneamente.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

Package PCAmix: https://cran.r-project.org/web/packages/PCAmixdata/vignettes/PCAmixdata.html

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

eigen, princomp, PCAmix

Examples

data("Dados.Misto")

NomeTrat=paste("Trat",1:nrow(Dados.Misto),sep="_")
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat)
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "individuos")
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "correlacao")

Contribuicao das variaveis independentes para o agrupamento

Description

Esta funcao retorna a contribuicao relativa entre as variaveis independentes no agrupamento formado pelo metodo Tocher, Kmeans ou Dendrograma.

Usage

ContribuicaoRelativa(obj,layout=2,theme="default")

Arguments

obj

Objeto que se obtem como saida pelas funcoes 'Dendrograma()', 'Tocher()' ou 'Kmeans()'.

layout

variavel numerica que indica o layout do grafico. Os valores podem variar entre 1 e 5.

theme

Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()).

Value

A funcao retorna a contribuicao das variaveis independentes no agrupamento.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Kmeans_NumeroOtimo2 , ContribuicaoRelativa

Examples

#Dados sem repeticao considerando o metodo Kmeans
     data("Dados.MED")
     Dados=Dados.MED
     rownames(Dados)=paste("Genotipo",1:10,sep="_")
     no=Kmeans_NumeroOtimo2(Dados,design=1,Metodo = 2)
     km=Kmeans(Dados,design=1,nclusters=no$ClusterNumber)
     km$predict
     ContribuicaoRelativa(km,layout = 2)

    #Dados de experimento em dic considerando o dendrograma
    data("Dados.DIC")
    m=MANOVA(Dados = Dados.DIC,Modelo = 1)
    dist=Distancia(Dados=m$Med,Metodo =7,Cov = m$CovarianciaResidual)
    Dendro=Dendrograma(Dissimilaridade = dist,corte = "Dunn")





    #Dados de experimento em dbc
    data("Dados.DBC")
    Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL)
    Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
           algorithm = "Hartigan-Wong")

    #Dados de experimento em DQL
    data("Dados.DQL")
    Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
    Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
           algorithm = "Hartigan-Wong")

    #Dados de experimento em Esquema fatorial em DIC
    data("Dados.Fat2.DIC")
    Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
    Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
           algorithm = "Hartigan-Wong")

    #Dados de experimento em Esquema fatorial em DBC
    data("Dados.Fat2.DBC")
    Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
    Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
           algorithm = "Hartigan-Wong")

Estudo de coordenadas principais

Description

Esta funcao possibilita o estudo dos coordenadas principais.

Usage

CoordenadasPrincipais(Dist, layout = 1,
main = NULL, NomeTrat = NULL, xlab = "PCoA 1", ylab ="PCoA 2",
ColVars = c(1, 2), CR = TRUE, Perc = 0.01, plot = TRUE)

Arguments

Dist

Matriz com as medidas de dissimilaridade.

layout

Deve ser um numero variando de 1 a 8. Para cada numero teremos um layout diferente.

main

Titulo do grafico.

NomeTrat

Nome dos tratamentos.

xlab

Nome do eixo x no grafico.

ylab

Nome do eixo y no grafico.

ColVars

Numero dos eixos que se pretende apresentar no grafico. O padrao e 'c(1,2)'.

CR

Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo.

Perc

Valor entre 0 e 1 indicando o recuo dos eixos.

plot

Valor logico.Se for TRUE o grafico sera apresentado.

Value

Esta funcao retorna informacoes importantes para o estudo de coordenadas principais.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

Cailliez, F. (1983) The analytical solution of the additive constant problem. Psychometrika, 48, 305–308.

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

Paradis, E.; Schliep, K. ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R. (2019) Bioinformatics. 526-528.

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

Lingoes, J. C. (1971) Some boundary conditions for a monotone analysis of symmetric matrices. Psychometrika, 36, 195–203.

See Also

ComponentesPrincipais

Examples

#Exemplo com dados Quantitativos
data("Dados.MED")
Dist=Distancia(Dados.MED,Metodo=5)
CoordenadasPrincipais(Dist)
#Compare os resultados com os componentes principais
ComponentesPrincipais(Dados.MED,padronizar = TRUE)

#Exemplo com dados Qualitativos

data=data("Dados.CAT")
Dist=Distancia(Dados.CAT,Metodo=10)
CoordenadasPrincipais(Dist)

Estimacao da correlacao e significancia pelo metodo Mantel.

Description

Esta funcao faz a correlacao entre matrizes e estima sua significancia pelo teste Mantel.

Usage

CorrelacaoMantel(Mat1,Mat2,
                        nperm=999,
                        alternativa="bilateral",
                        Plot=TRUE,
                        xlab="Dist1",
                        ylab="Dist2",
                        bty="l")

Arguments

Mat1

Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'.

Mat2

Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'.

nperm

Numero de permutacoes para identificar a signficancia pelo metodo de Mantel

alternativa

Character indicando a hipotese alternativa considerada. Pode ser:

  • "bilateral": Testa se a correlacao e diferente de zero.

  • "maior" : Testa se a correlacao e maior de zero.

  • "menor : Testa se a correlacao e menor de zero.

Plot

Valor logico (TRUE ou FALSE) indicando se aparecera o grafico de correlacao entre as matriz cofenetica e de dissimilaridade

xlab

nome do eixo x do grafico

ylab

nome do eixo y do grafico

bty

deve receber um character indicando o tipo de borda desejado no grafico.

  • "o": Todas as bordas

  • "n": Sem bordas

  • "7": Acima e a direita

  • "L": Abaixo + esquerda (Default)

  • "C": Acima + Direita + Abaixo

  • "U": Direita + Abaixo + Direita

Value

A funcao retorna resultados do teste Tocher.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.

Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.

Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.

Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.

Examples

data(Dados.MED)
#Distancia euclidiana.
Mat1=Distancia(Dados.MED,1)
#Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)".
Mat2=Distancia(Dados.MED,6)
CorrelacaoMantel(Mat1,Mat2)

Dados de exemplo (Dados binarios).

Description

Exemplo com um conjunto de dados binarios.

Usage

data(Dados.BIN)

Format

Um data frame com 5 observacoes e 9 variaveis (Cruz et al. 2014).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

PlayList "Curso de Analise Multivariada": <https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>

Cruz et al., 2014. Modelos biometricos aplicados ao melhoramento de genetico. Vol3. editora UFV. 668p.


Exemplo de dados qualitativos multicategoricos.

Description

Exemplo com um conjunto de dados com 13 variaveis resposta do tipo multicategorico para 9 individuos.

Usage

data(Dados.CAT)

Format

Um data frame com 9 observacoes e 13 variaveis.

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de exemplo de um experimento em DBC.

Description

Exemplo simulado com um conjunto de dados de um experimento em DBC.

Usage

data(Dados.DBC)

Format

Um data frame com 45 observacoes e 11 variaveis. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de exemplo de um experimento em DBC com dados quantitativos e mistos.

Description

Exemplo de parte de um exeperimento com clones batata-doce em DBC com dados quantitativos e qualitativos.

Usage

data(Dados.DBC.Misto)

Format

Um data frame. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de exemplo de um experimento em DIC.

Description

Exemplo simulado com um conjunto de dados de um experimento no delineamento inteiramente casualizado

Usage

data(Dados.DIC)

Format

Um data frame com 30 observacoes e 9 variaveis. A primeira coluna tem a identificacao dos tratamentos, a segunda a identificacao das repeticoes e da terceira em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de exemplo de um experimento em DQL.

Description

Exemplo simulado com um conjunto de dados de um experimento em quadrados latino

Usage

data(Dados.DQL)

Format

Um data frame com 16 observacoes e 7 colunas. A primeira coluna tem a identificacao dos tratamentos, a segunda um vetor com a identificacao das linhas, a terceira coluna com a identificacao das colunas e da quarta em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de um experimento em esquema fatorial duplo conduzido em DBC.

Description

Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.

Usage

data(Dados.Fat2.DBC)

Format

Um data frame com 38 observacoes e 14 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao dos blocos e da quarta em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de um experimento em esquema fatorial duplo conduzido em DIC.

Description

Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido em DIC.

Usage

data(Dados.Fat2.DIC)

Format

Um data frame com 36 observacoes e 7 colunas. A primeira coluna com a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao das repeticoes e da quarta em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo, [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de um experimento em esquema fatorial triplo conduzido em DBC.

Description

Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.

Usage

data(Dados.Fat3.DBC)

Format

Um data frame com 64 observacoes e 9 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao dos blocos e da quinta em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de um experimento em esquema fatorial triplo conduzido em DIC.

Description

Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.

Usage

data(Dados.Fat3.DBC)

Format

Um data frame. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao das repeticoes e da quinta em diante as variaveis respostas (dependentes).

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Exemplo de dados qualitativos multicategoricos em um experimento com progenies de meios irmaos.

Description

Exemplo de um experimento com progenies de meios irmaos de couve

Usage

data(Dados.FMI.Quali)

Format

Um data frame com 25925 observacoes e 10 variaveis.

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>


Exemplo de dados quantitativos em um experimento com progenies de meios irmaos.

Description

Exemplo de um experimento com progenies de meios irmaos de couve

Usage

data(Dados.FMI.Quanti)

Format

Dataframe.

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>


Dados de um exemplo com variaveis quantitativas.

Description

Exemplo com um conjunto de dados com 7 variaveis resposta quantitativas para 10 individuos.

Usage

data(Dados.MED)

Format

Um data frame com 10 observacoes e 7 variaveis.

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dados de exemplo de um experimento com dados mistos.

Description

Exemplo simulado com um conjunto de dados de um experimento com dados qualitativos binarios, multicategoricos e quantitativos.

Usage

data(Dados.Misto)

Format

Um data frame com 5 observacoes e 11 colunas.

Author(s)

Alcinei Mistico Azevedo: [email protected]

References

<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>


Dendrograma

Description

Esta funcao retorna a figura do Dendrograma, distancias feneticas e correlacao cofenetica.

Usage

Dendrograma(Dissimilaridade,
                  Metodo=3,
                  layout=2,
                  nperm=999,
                  Titulo="",
                  corte="Mojena1")

Arguments

Dissimilaridade

Matriz contendo a estimativa das distancias entre tratamentos.

Metodo

Valor numerico indicando o metodo a ser utilizado:

  • 1 = Ligacao simples (Metodo do vizinho mais proximo).

  • 2 = Ligacao completa (Metodo do vizinho distante).

  • 3 = Ligacao media entre grupo (UPGMA).

  • 4 = Metodo de Ward.

  • 5 = Metodo de Ward (d2).

  • 6 = Metodo da mediana (WPGMC).

  • 7 = Metodo do centroide (UPGMC).

  • 8 = Metodo mcquitty (WPGMA).

layout

Deve ser um numero variando de 1 a 10. Para cada numero teremos um layout diferente.

nperm

Numero de permutacoes do teste mantel para testar a significancia pelo teste Mantel.

Titulo

Texto com o titulo a ser apresentado no grafico

corte

Indica a metodologia considerada para estabelecer a linha de corte no Dendrograma:

  • FALSE = Indica que o ponto de corte nao sera apresentado.

  • Mojena1 = Coeficiente de mojena considerando o K=1.25.

  • Mojena2 = Coeficiente de mojena considerando o K=2.00.

  • Cindex = Considera o metodo Cindex para determinar o numero de clusters.

  • Frey = Considera o metodo Frey para determinar o numero de clusters.

  • Mcclain = Considera o metodo Frey para determinar o numero de clusters.

  • Dunn = Considera o metodo Dunn para determinar o numero de clusters.

  • Numeric= Valor numerico indicando onde se deseja plotar a linhade corte.

Value

A funcao retorna o Dendrograma, distancias feneticas e correlacao cofenetica.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

MOJENA, R. Hierarquical grouping method and stopping rules: an evaluation. Computer Journal, v.20, p.359-363, 1977.

See Also

hclust, dist

Examples

data(Dados.MED)
rownames(Dados.MED)=paste0("Treatment ",1:10)
Dist=Distancia(Dados.MED,2)
Dendrograma(Dist,Metodo = 2)
Dendrograma(Dist,2,layout =1,corte = "Mojena2")
Dendrograma(Dist,2,layout =2,corte="Cindex")
Dendrograma(Dist,2,layout =3,corte="Frey")
Dendrograma(Dist,2,layout =4,corte="Mcclain")
Dendrograma(Dist,2,layout =5,corte="Dunn")
Dendrograma(Dist,2,layout =6)
Dendrograma(Dist,2,layout =7,corte=3)
Dendrograma(Dist,2,layout =8)
Dendrograma(Dist,2,layout =9)
Dendrograma(Dist,2,layout =10,corte=2)

Determinacao do numero otimo de clusters no dendrograma

Description

Esta funcao retorna informacoes que auxilia na determinacao do numero de clusters a serem considerados no dendrograma.

Usage

Dendrograma_NumeroOtimo(Dissimilaridade,Metodo=3)

Arguments

Dissimilaridade

Objeto criado pela funcao 'Distancia'

Metodo

Metodo Valor numerico indicando o metodo a ser utilizado:

  • 1 = Ligacao simples (Metodo do vizinho mais proximo).

  • 2 = Ligacao completa (Metodo do vizinho distante).

  • 3 = Ligacao media entre grupo (UPGMA).

  • 4 = Metodo de Ward.

  • 5 = Metodo de Ward (d2).

  • 6 = Metodo da mediana (WPGMC).

  • 7 = Metodo do centroide (UPGMC).

  • 8 = Metodo mcquitty (WPGMA).

Value

A funcao retorna o numero otimo de Clusters.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Tocher , Dendrograma

Examples

data(Dados.MED)
rownames(Dados.MED)=paste0("Treatment ",1:10)
Dist=Distancia(Dados.MED,Metodo=3)
Dendrograma_NumeroOtimo(Dissimilaridade = Dist,Metodo = 3)

data("Dados.CAT")
Diss=Distancia(Dados = Dados.CAT,Metodo=10)
Dendrograma_NumeroOtimo(Dissimilaridade = Diss,Metodo = 5)

Distancia de dissimilaridade

Description

Esta funcao retorna a distancia de dissimilaridade.

Usage

Distancia(Dados,Metodo,Cov=NULL)

Arguments

Dados

Matriz contendo os dados para calculo das distancias. Nas linhas devem estar os tratamentos, e nas colunas as variaveis respostas. Neste arquivo nao deve ter a identificacao dos tratamentos.

Metodo

Valor numerico indicando o metodo a ser utilizado:

  • Dados quantitativos

    • 1 = Distancia euclidiana.

    • 2= Distancia euclidiana media.

    • 3 = Quadrado da distancia euclidiana media.

    • 4 = Distancia euclidiana padronizada.

    • 5 = Distancia euclidiana padronizada media.

    • 6 = Quadrado da distancia euclidiana padronizada media.

    • 7 = Distancia de Mahalanobis.

    • 8 = Distancia de Cole Rodgers.

  • Dados qualitativos: binarios ou multicategoricos

    • 9 = Frequencia de coincidencia.

    • 10 = Frequencia de discordancia.

    • 11 = indice Inverso de 1+coincidencia = 1/(1+c)

  • Dados qualitativos binarios

    • 12 = Dissimilaridade de Jacard: 1-a/(a+b+c).

    • 13 = Dissimilaridade de Sorensen Dice: 1-2a/(2a+b+c).

    • 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)

    • 15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)

    • 16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).

    • 17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).

    • 18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).

    • 19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).

    • 20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).

  • Dados mistos

    • 21 =Dissimilaridade de Gower

    • 22 =Dissimilaridade de Gower 2

Cov

matriz quadrada e simetrica contendo as variancias e covariancias (residuais) entre as caracteristicas. Necessaria apenas para calculo da distancia de Mahalanobis.

Details

Um problema do indice de Gower (Metodo = 21) e que quando as variaveis binarias (0 ou 1) indicam a presença ou ausencia de bandas a informação 0-0 (ausencia de bandas em ambos os individuos) indica que os dois individuos sao iguais, o que nao e verdade necessariamente. Caso queira desconsiderar essas informações (0-0) no computo da dissimilaridade, pode-se usar o "indice de Gower 2" (Metodo =22)).

Value

A funcao retorna a distancia estimada entre os tratamentos.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

dist

Examples

data(Dados.MED)
##########> Dados quantitativos
#1 = Distancia euclidiana.
Distancia(Dados.MED,1)
#2 = Distancia euclidiana media.
Distancia(Dados.MED,2)
#3 = Quadrado da distancia euclidiana media.
Distancia(Dados.MED,3)
#4 = Distancia euclidiana padronizada.
Distancia(Dados.MED,4)
#5 = Distancia euclidiana padronizada media.
Distancia(Dados.MED,5)
#6 = Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)".
Distancia(Dados.MED,6)
#7 = Distancia de Mahalanobis.
data(Dados.DBC)
m=MANOVA(Dados.DBC,2)
Med=apply(Dados.DBC[, -c(1:2)],2,function(x) tapply(x,as.factor(Dados.DBC[,1]),mean))
CRE=m$CovarianciaResidual
Distancia(Med,7,CRE)
#8 = Distancia de Cole Rodgers.
Distancia(Dados.MED,8)

######################>Dados qualitativos: binarios ou multicategoricos
#9 = Frequencia de coincidencia.
data(Dados.CAT)
Distancia(Dados.CAT,9)
#10 = Frequencia de discordancia.
Distancia(Dados.CAT,10)
data(Dados.BIN)
Distancia(Dados.BIN,10)
#11 = indice Inverso de 1+coincidencia  > 1/(1+c)
Distancia(Dados.CAT,11)

##############################>Dados qualitativos binarios
data(Dados.BIN)
#12 = Dissimilaridade de Jacard.
Distancia(Dados.BIN,12)
#13 = Dissimilaridade de Sorensen Dice.
Distancia(Dados.BIN,13)
  # 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)
  Distancia(Dados.BIN,14)
  #15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)
  Distancia(Dados.BIN,15)
  #16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).
  Distancia(Dados.BIN,16)
  #17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).
  Distancia(Dados.BIN,17)
  #18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).
  Distancia(Dados.BIN,18)
  #19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).
  Distancia(Dados.BIN,19)
  #20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).
  Distancia(Dados.BIN,20)

#' ##################>Dados mistos (quantitativos, binarios e multicategoricos)
  data(Dados.Misto)
  Distancia(Dados.Misto,21)

Grafico de calor para a interpretacao do Dendrograma

Description

Esta funcao apresenta um mapa de calor junto com o Dendrograma.

Usage

HeatPlot(Dendo,Col=NULL,layout=1,cut=1000)

Arguments

Dendo

Objeto criado pela funcao 'Dendrograma'.

Col

Paleta de cores. Veja os exemplos.

layout

Deve ser um numero variando de 1 a 3. Para cada numero teremos um layout diferente.

cut

Valor do corte no dendrograma para o estabelecimento de cluster.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Distancia ,Dendrograma

Examples

################################################
####################################
#PlotHeat
#Distancia euclidiana
data("Dados.MED")
dist=Distancia(Dados.MED,Metodo = 3)
dist
Dendo=Dendrograma(dist)
HeatPlot(Dendo)
#Distancia Mahalanobis
data("Dados.DBC")
m=MANOVA(Dados.DBC,Modelo = 2)
m
dist=Distancia(m$Med,Cov=m$CovarianciaResidual,Metodo = 7)
dist
Dendo=Dendrograma(dist)
HeatPlot(Dendo)
col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F'))
col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white',
                          'cyan', '#007FFF', 'blue','#00007F'))
col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582',
                          '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE',
                          '#4393C3', '#2166AC', '#053061'))
col3 = colorRampPalette(c('red', 'white', 'blue'))
col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F',
                          'cyan', '#007FFF', 'blue', '#00007F'))
HeatPlot(Dendo,Col=col1)
HeatPlot(Dendo,Col=col3)
HeatPlot(Dendo,Col=col4)


#Dados binarios
data("Dados.BIN")
Dist=Distancia(Dados.BIN,Metodo=12)
Dist
Dend=Dendrograma(Dist)
HeatPlot(Dend)
HeatPlot(Dend,Col=col3)

#Dados cat
data("Dados.CAT")
row.names(Dados.CAT)=paste0("T",1:nrow(Dados.CAT))
Dist=Distancia(Dados.CAT,Metodo=10)
Dist
Dend=Dendrograma(Dist)
HeatPlot(Dend)

Agrupamento K-means

Description

Esta funcao retorna clusters pelo metodo kmeans a partir de uma matriz com dados quantitativos.

Usage

Kmeans(Dados,design=1,nclusters=4,iter.max = 10,nstart = 1,algorithm = "Hartigan-Wong")

Arguments

Dados

Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Design 1: Deve ter apenas os dados numericos da pesquisa. Na primeira linha não deve ter o nome dos individuos/tratamentos.

  • Design 2 e 3: As duas primeiras colunas devem conter a identificacao dos tratamentos e repeticoes/blocos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 4: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 5 e 6: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

design

Valor numerico indicando o delineamento:

  • 1 = Experimento sem repeticoes.

  • 2 = Delineamento inteiramente casualizado (DIC) .

  • 3 = Delineamento em blocos casualizados (DBC).

  • 4 = Delineamento em quadrado latino (DQL).

  • 5 =Esquema fatorial duplo em DIC.

  • 6 = Esquema fatorial duplo em DBC.

nclusters

numero desejado de cluster.

iter.max

numero de iteracoes permitidas.

nstart

numero de conjuntos aleatorios a serem escolhidos.

algorithm

Metodo desejado para o agrupamento kmeans:

  • “Hartigan-Wong”

  • “Lloyd”

  • “Forgy”

  • “MacQueen”

Value

A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Kmeans_NumeroOtimo2 , ContribuicaoRelativa

Examples

#Dados sem repeticao
 data("Dados.MED")
 Dados=Dados.MED
 rownames(Dados)=paste("Genotipo",1:10,sep="_")
 Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
 Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1,
        algorithm = "Hartigan-Wong")

#Dados de experimento em dic
data("Dados.DIC")
Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1,
       algorithm = "Hartigan-Wong")

#Dados de experimento em dbc
data("Dados.DBC")
Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
       algorithm = "Hartigan-Wong")

#Dados de experimento em DQL
data("Dados.DQL")
Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
       algorithm = "Hartigan-Wong")

#Dados de experimento em Esquema fatorial em DIC
data("Dados.Fat2.DIC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
       algorithm = "Hartigan-Wong")

#Dados de experimento em Esquema fatorial em DBC
data("Dados.Fat2.DBC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
       algorithm = "Hartigan-Wong")

Numero otimo de clusters

Description

Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo

Usage

Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)

Arguments

Dados

Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Design 1: Deve ter apenas os dados numericos da pesquisa. Na primeira linha não deve ter o nome dos individuos/tratamentos.

  • Design 2 e 3: As duas primeiras colunas devem conter a identificacao dos tratamentos e repeticoes/blocos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 4: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 5 e 6: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

design

Valor numerico indicando o delineamento:

  • 1 = Experimento sem repeticoes.

  • 2 = Delineamento inteiramente casualizado (DIC) .

  • 3 = Delineamento em blocos casualizados (DBC).

  • 4 = Delineamento em quadrado latino (DQL).

  • 5 =Esquema fatorial duplo em DIC.

  • 6 = Esquema fatorial duplo em DBC.

nboot

numero de reamostragens desejadas para o metodo bootstrap.

method

Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:

  • "silhouette" (for average silhouette width).

  • "wss" (for total within sum of square).

  • "gap_stat" (for gap statistics).

NumMax

Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2).

Value

A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Kmeans_NumeroOtimo2 , ContribuicaoRelativa

Examples

#Dados sem repeticao
  data("Dados.MED")
  Dados=Dados.MED
  rownames(Dados)=paste("Genotipo",1:10,sep="_")
  Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
  Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1,
      algorithm = "Hartigan-Wong")

  #Dados de experimento em dic
  data("Dados.DIC")
  Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="wss",NumMax=NULL)
  Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1,
      algorithm = "Hartigan-Wong")

  #Dados de experimento em dbc
  data("Dados.DBC")
  Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="gap_stat",NumMax=NULL)
  Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
     algorithm = "Hartigan-Wong")

  #Dados de experimento em DQL
  data("Dados.DQL")
  Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
  Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
     algorithm = "Hartigan-Wong")

  #Dados de experimento em Esquema fatorial em DIC
  data("Dados.Fat2.DIC")
  Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
  Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
    algorithm = "Hartigan-Wong")

  #Dados de experimento em Esquema fatorial em DBC
  data("Dados.Fat2.DBC")
  Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
  Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
    algorithm = "Hartigan-Wong")

Numero otimo de clusters pelo metodo do cotovelo

Description

Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo2

Usage

Kmeans_NumeroOtimo2(Dados,design=1,nboot=100, Metodo=1,iter.max = 100,
NumMax=NULL,TituloX="Numero de clusters",TituloY=NULL,Theme=theme_classic())

Arguments

Dados

Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Design 1: Deve ter apenas os dados numericos da pesquisa. Na primeira linha não deve ter o nome dos individuos/tratamentos.

  • Design 2 e 3: As duas primeiras colunas devem conter a identificacao dos tratamentos e repeticoes/blocos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 4: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 5 e 6: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

design

Valor numerico indicando o delineamento:

  • 1 = Experimento sem repeticoes.

  • 2 = Delineamento inteiramente casualizado (DIC) .

  • 3 = Delineamento em blocos casualizados (DBC).

  • 4 = Delineamento em quadrado latino (DQL).

  • 5 =Esquema fatorial duplo em DIC.

  • 6 = Esquema fatorial duplo em DBC.

nboot

numero de reamostragens desejadas para o metodo bootstrap.

Metodo

Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:

  • 1 = Metodo baseado na porcentagem de explicacao

  • 2 = Metodo baseado na soma dos quadrados intra-cluster

  • 3 = = Metodo baseado na soma dos quadrados inter-cluster

iter.max

numero de reamostragens desejadas para o metodo bootstrap.

NumMax

Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2).

TituloX

Titulo desejado para o eixo x.

TituloY

Titulo desejado para o eixo y.

Theme

Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()).

Value

A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Kmeans, Kmeans_NumeroOtimo2 , ContribuicaoRelativa

Examples

#Sem repeticoes
data("Dados.MED")
Dados=Dados.MED
rownames(Dados)=paste("Genotipo",1:10,sep="_")
Kmeans_NumeroOtimo2(Dados,design=1,nboot=100,iter.max = 100,NumMax=NULL)

#Experimento em DIC
data("Dados.DIC")
Dados=Dados.DIC
Kmeans_NumeroOtimo2(Dados,design=2,Metodo = 2,nboot=100,iter.max = 100,NumMax=NULL)

#Experimento em DBC
data("Dados.DBC")
Dados=Dados.DBC
Kmeans_NumeroOtimo2(Dados,design=3,nboot=100,iter.max = 100,NumMax=NULL)

#Experimento em DQL
data("Dados.DQL")
Dados=Dados.DQL
Kmeans_NumeroOtimo2(Dados,design=4,nboot=100,iter.max = 100,NumMax=NULL)

#Experimento em fatorial no DIC
data("Dados.Fat2.DIC")
Dados=Dados.Fat2.DIC
Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)

#Experimento em fatorial no DBC
data("Dados.Fat2.DBC")
Dados=Dados.Fat2.DBC
Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)

Analise de variancia multivariada

Description

Esta funcao retorna o resultado da analise de variancia multivariada (MANOVA). @name MANOVA

Usage

MANOVA(Dados,Modelo)

Arguments

Dados

Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Modelos 1 e 2: As duas primeiras colunas devem conter a identificacao dos tratamentos e repeticoes/blocos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 3: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 4 e 5: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

  • Modelos 6 e 7: as primeiras colunas precisam ter a informacao do fator A, fator B, fator C, repeticao/bloco, e posteriormente, as variaveis respostas.

Modelo

Valor numerico indicando o delineamento:

  • 1 = Delineamento inteiramente casualizado (DIC)

  • 2 = Delineamento em blocos casualizados (DBC)

  • 3 = Delineamento em quadrado latino (DQL)

  • 4 = Esquema fatorial duplo em DIC

  • 5 = Esquema fatorial duplo em DBC

  • 6 = Esquema fatorial triplo em DIC

  • 7 = Esquema fatorial triplo em DBC

Value

A funcao retorna a MANOVA, a matriz de (co)variancia residual e o numero dos graus de liberdade do residuo.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

lm, manova

Examples

#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
MANOVA(Dados.DIC,1)

#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
MANOVA(Dados.DBC,2)

#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
MANOVA(Dados.DQL,3)

#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
MANOVA(Dados.Fat2.DIC,4)

#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
MANOVA(Dados.Fat2.DBC,5)

#' #Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
MANOVA(Dados.Fat3.DIC,6)

#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
MANOVA(Dados.Fat3.DBC,7)

Media ponderada entre as matrizes de dissimilaridade

Description

Esta funcao faz a padronizacao da matriz de dissimilaridade a fim de retirar a escala, nesta etapa, os valores das matrizes sao calculados, a fim de variar entre 0 e 1. Posteriormente, e feita a media ponderada entre essas matrizes em funcao do numero de variaveis consideradas na estimativa de cada uma dessas dissimilaridade. Essa funcao e importante quando se trabalha com dados mistos.

Usage

MediaDistancia(Distancias,n,Normatizar=TRUE)

Arguments

Distancias

Objeto do tipo list contendo as matrizes de dissimilaridade.

n

Vetor com o numero de variaveis consideradas na estimacao de cada medida de dissimilaridade.

Normatizar

Valor Logico. Se TRUE a matriz de dissimilaridade sera normatizada para que os valores variem entre 0 e 1.

Value

Retorna a media ponderada de duas matrizes de dissimilaridade.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

dist

Examples

#Obentendo as dados de exemplo
DadosQuanti=matrix(rnorm(100,100,5),ncol=4)
DadosQuali=matrix(round(runif(200,1,5),0),ncol=8)
DadosBin=matrix(round(rbinom(400 ,1,0.5),0),ncol=16)
rownames(DadosQuanti)=rownames(DadosQuali)=rownames(DadosBin)=paste("T",1:25,sep="_")

#Obentendo as matrizes de dissimilaridade
DistQuant=Distancia(DadosQuanti,4)
DistQuali=Distancia(DadosQuali,10)
Distbin=Distancia(DadosBin,12)

#Criando os argumentos
Distancias=list(DistQuant,DistQuali,Distbin)
n=c(ncol(DadosQuanti),ncol(DadosQuali),ncol(DadosBin))

#obentedo a media ponderada das matrizes
Dist=MediaDistancia(Distancias,n,Normatizar = TRUE)
Dist

Diagnostico de multicolinearidade

Description

Esta funcao retorna o diagnostico de multicolinearidade. E indicativo de multicolinearidade a presenca de pelo menos um fator de inflacao de variancia maior que 10 ou numero de condicao maior que 100 (Cruz et al.,2014). @name Multicolinearidade

Usage

Multicolinearidade(Matriz)

Arguments

Matriz

Matriz na qual se deseja verificar a presenca de multicolinearidade.

Value

A funcao retorna os autovalores,numero de condicao, fator de inflacao de variancia e a determinante da matriz .

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

Examples

data(Dados.MED)
D=cov(Dados.MED)
Multicolinearidade(D)

Pacote Para Analise De Experimentos Com Abordagem Multivariada

Description

Este pacote realiza a analise de experimentos por abordagem multivariada. Com este pacote e possivel fazer analises de variancia multivariada, estimar medidas de disimilaridade, fazer dendogramas,componentes principais, variaveis canonicas, etc.

Author(s)

Alcinei Mistico Azevedo: <[email protected]>

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)


Normatiza a matriz para que os valores variem entre valores pre-estabelecidos.

Description

Esta funcao faz a padronizacao da matriz a fim de retirar a escala. Para isso, os valores das matrizes sao calculados a fim de variar entre um "LimiteInferior" e um "LimiteSuperior".

Usage

Normatiza(DadosEntrada, DadosBase=NULL, LimiteInferior=0, LimiteSuperior=1,Metodo=1)

Arguments

DadosEntrada

Matriz contendo os dados sendo normatizados.

DadosBase

Matriz contendo o conjunto de dados referencia para a normatizacao. Se for "NULL" essa matriz de referencia sera a propria matriz de entrada.

LimiteInferior

Numero cujo menor valor devera corresponder.

LimiteSuperior

Numero cujo maior valor devera corresponder.

Metodo

indica a forma que a normatizacao sera feita. Pode receber o valor 1 ou 2:

  • 1 = A normatizacao sera feita considerando os dados de cada coluna individualmente.

  • 2 = A normatizacao sera feita considerando os dados de toda a matriz simultaneamente.

Value

Retorna a matriz normatizada.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

dist

Examples

data("Dados.MED")
Dist=Distancia(Dados.MED,3)
Dendrograma(Dist)
DistN=Normatiza((Dist),LimiteInferior = 0,LimiteSuperior = 1,Metodo = 2)
Dendrograma(DistN)

Comparacoes multiplas multivariadas

Description

Esta funcao retorna o resultado da comparacao multiplas (dois a dois) com abordagem multivariada.

Usage

PairComp(MANOVA,adjust="bonferroni",test="Pillai",Sig=0.05)

Arguments

MANOVA

Resultado da funcao MANOVA

adjust

Ajuste da significancia para o teste de comparacao multipla. Pode ser: "holm", "hochberg", "hommel", "bonferroni", "BH", "BY", "fdr" ou "none".

test

Teste considerado na MANOVA. Pode ser:"Pillai", "Wilks", "Hotelling-Lawley" ou "Roy"

Sig

Significancia a ser considerado. Default e 0.05.

Value

A funcao as comparações multiplas para os tratamentos.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

Da Silva, A.R.; Malafaia, G.; Menezes, I.P.P. (2017) biotools: an R function to predict spatial gene diversity via an individual-based approach. Genetics and Molecular Research, 16: gmr16029655.

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

Krzanowski, W. J. (1988) Principles of Multivariate Analysis. A User's Perspective. Oxford.

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

lm, manova

Examples

#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
Res=MANOVA(Dados.DIC,1)
PairComp(Res)

#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
Res=MANOVA(Dados.DBC,2)
PairComp(Res)

#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
Res=MANOVA(Dados.DQL,3)
PairComp(Res)

#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
Res=MANOVA(Dados.Fat2.DIC,4)
PairComp(Res)

#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
Res=MANOVA(Dados.Fat2.DBC,5)
PairComp(Res)

#' #Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
Res=MANOVA(Dados.Fat3.DIC,6)
PairComp(Res)

#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
Res=MANOVA(Dados.Fat3.DBC,7)
PairComp(Res)

Grafico com tres dimensoes

Description

Esta funcao cria um grafico 3d a partir de escores.

Usage

plot3d(Obj,names = NULL,lab=NULL,title=NULL,cols=c(1,2,3),size=1)

Arguments

Obj

Objeto criado pelas funcoes 'ComponentesPrincipais', 'CoordenadasPrincipais' e 'VariaveisCanonicas'.

names

Nomes das Variaveis.

lab

Nome dos eixos.

title

Titulo do grafico.

cols

Numeros dos eixos que aparecera no grafico.

size

Tamanho das letras.

Value

Esta funcao retorna um grafico com tres dimensoes.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

See Also

ComponentesPrincipais

Examples

#####################################
##### Matriz
#################################
data("Dados.MED")
data=as.matrix(Dados.MED[,5:7])
plot3d(Obj = data,names = letters[1:10],
       lab=c("Retencao 75",
             "Retencao 55",
             "Retencao fundo"),size =2 )


#####################################
##### Componentes Principais
#################################
data(Dados.MED)
cp=ComponentesPrincipais(Dados.MED,layout = 11,
                         CorPlot = TRUE,VarCol = "green")
plot3d(Obj = cp,names = letters[1:10],
       lab=c("Principal Component 1",
             "Principal Component 2",
             "Principal Component 3"),size =2 )


#####################################
##### Variaveis  canonicas
#################################
data(Dados.DBC)
VC=VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red")
plot3d(VC)
plot3d(VC,names = paste("Var","1:10"),
       lab=c("Variable component 1",
             "Variable Component 2",
             "Variable Component 3"),size =2 )


#####################################
##### Coordenadas Principais
#################################
data=data("Dados.CAT")
Dist=Distancia(Dados.CAT,Metodo=10)
CO=CoordenadasPrincipais(Dist)
plot3d(Obj = CO,names = letters[1:9],
       lab=c("PCoA 1",
             "PCoA 2",
             "PCoA 3"),size =2 )

Transformar dados quantitativos em qualitativos

Description

Esta funcao converte dados quantitativos em qualitativos. Para isso, deve-se apenas indicar o numero de classes desejadas. A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.

Usage

Quant2Quali(Dados,nclasses)

Arguments

Dados

Objeto com os dados quantitativos a serem convertidos em qualitativos.

nclasses

Numero maximo de classes desejado.

Value

A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

Distancia , MediaDistancia

Examples

data(Dados.Misto)
nclasses=5
Dados=Dados.Misto[,c(6,7,10)]
Quant2Quali(Dados,nclasses)

Definir o diretório do script working directory (Set the script Directory as working directory).

Description

Esta funcao define como o endereco da pasta onde esta o scritp atual como o diretorio de trabalho. (This function set the directory of current script as working directory).

Usage

setwd_script()

Resumo das informacoes de cada tratamento em funcao da dissimilaridade

Description

Esta funcao apresenta informacoes que resumem a matriz de dissimilaridade.

Usage

SummaryDistancia(Dist,
ndec=2,
plot=TRUE,
layout="shade",
type="full",
title=NULL,
tl.cex =1,
tl.col="black",
col=NULL)

Arguments

Dist

Matriz de dissimilaridade

ndec

Valor numerico indicando o numero de casas decimais.

plot

Valor logico (TRUE ou FALSE). Indica se o grafico deve ser apresentado.

layout

Valor do tipo character indicando como sera preenchido cada casela:

  • "circle"

  • "square"

  • "ellipse"

  • "number"

  • "shade"

  • "color"

  • "pie"

type

Character, 'full' (default), 'upper' or 'lower', display full matrix, lower triangular or upper triangular matrix.

  • "full"

  • "lower"

  • "upper"

title

Texto referente ao titulo da figura

tl.cex

Valor numerico indicando o tamanho das letras no grafico

tl.col

Cor das letras. Default ("black")

col

Vetor com a paleta de cores. Estas cores devem ser distribuidas uniformemente. se NULL, a paleta de cores sera colorRampPalette(col2)(200), veja exemplo abaixo.

Value

Retorna informacoes importantes sobre cada tratamento em relacao aos demais como distancia media, menor distancia, maior distancia, tratamento mais proximo, tratamento mais distante etc.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

dist

Examples

data(Dados.MED)
 Dist=Distancia(Dados.MED,1)
 SummaryDistancia(Dist)
 #Acrescentando nomes aos tratamentos
 Dist=as.matrix(Dist$Distancia)
 rownames(Dist)=colnames(Dist)=paste("Trat",1:nrow(Dist))
 SummaryDistancia(Dist)
 #Diferentes configuracoes
 SummaryDistancia(Dist,type  ="lower")
 #opcoes de paletas de cores
 col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F'))
 col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white',
   'cyan', '#007FFF', 'blue','#00007F'))
 col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582',
                           '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE',
                           '#4393C3', '#2166AC', '#053061'))
 col3 = colorRampPalette(c('red', 'white', 'blue'))
 col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F',
                           'cyan', '#007FFF', 'blue', '#00007F'))

 SummaryDistancia(Dist,type = "upper",col=col4(200),title = "Medidas de dissimilaridade")
 SummaryDistancia(Dist,type = "lower",layout = "ellipse",col=col3(200))

Agrupamento Tocher

Description

Esta funcao faz o agrupamento pelo metodo Tocher.

Usage

Tocher(Dist,
Metodo="original",
nperm=999,
Plot=1,
xlab="Dissimilaridade",
ylab="Distancia fenetica",
bty="n")

Arguments

Dist

Objeto contendo a matriz de dissimilaridade

Metodo

Um character indicando o algoritimo de agrupamento. Ha duas possibidades: "original" (default) ou "sequential". O ultimo foi proposto por Vasconcelos et al. (2007), tambem chamando de metodo Tocher modificado.

nperm

Numero de permutacoes para identificar a signficancia pelo metodo de Mantel

Plot

Numero indicando qual grafico devera ser plotado:

  • "1": Grafico com as distancias intra e intercluster

  • "2": Grafico com as dispersao da distancia cofenetica em funcao dos valores de dissimilaridade.

xlab

nome do eixo x do grafico. Deve ser utilizado quando o Plot=2.

ylab

nome do eixo y do grafico. Deve ser utilizado quando o Plot=2.

bty

deve receber un character indicando o tipo de borda desejado no grafico. Deve ser utilizado quando o Plot=2.

  • "o": Todas as bordas

  • "n": Sem bordas

  • "7": Acima e a direita

  • "L": Abaixo + esquerda (Default)

  • "C": Acima + Direita + Abaixo

  • "U": Direita + Abaixo + Direita

Value

A funcao retorna resultados do teste Tocher.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.

Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.

Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.

Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.

Examples

data("Dados.MED")
Dist=Distancia(Dados.MED,Metodo=6)
Tocher(Dist)

Analise de variaveis canonicas

Description

Esta funcao faz a analise dos dados pelo metodo de variaveis canonicas. @name VariaveisCanonicas

Usage

VariaveisCanonicas(Dados,
             Modelo=1,
              Fator=NULL,
              layout=1,
               xlab="VC1",
               ylab="VC2",
               cols=c(1,2),
               CR=TRUE,
               CorPlot=TRUE,
               CorCol="red",
               VarCol ="blue",
               bty="L",
               Perc=0.1,
               length = 0.25)

Arguments

Dados

Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:

  • Modelos 1 e 2: As duas primeiras colunas devem conter a identificacao dos tratamentos, e as demais os valores observanos nas variaveis respostas.

  • Modelo 3: As tres primeiras colunas devem conter as informacoes dos tratamentos, linhas e colunas, e posteriormente, os valores da variavel resposta.

  • Modelos 4 e 5: as primeiras colunas precisam ter a informacao do fator A, fator B, repeticao/bloco, e posteriormente, as variaveis respostas.

  • Modelos 6 e 7: as primeiras colunas precisam ter a informacao do fator A, fator B, fator C, repeticao/bloco, e posteriormente, as variaveis respostas.

Modelo

Valor numerico indicando o delineamento:

  • 1 = Delineamento inteiramente casualizado (DIC)

  • 2 = Delineamento em blocos casualizados (DBC)

  • 3 = Delineamento em quadrado latino (DQL)

  • 4 = Esquema fatorial duplo em DIC

  • 5 = Esquema fatorial duplo em DBC

  • 6 = Esquema fatorial triplo em DIC

  • 7 = Esquema fatorial triplo em DBC

Fator

Indica qual fator deve ser estudado na representacao grafica. Tal decisao pode ser feita baseando na significancia da manova. Esse objeto deve receber:

  • NULL = Para os delineamentos DIC, DBC e DQL (1, 2 e 3)

  • "A" = Para obter a presentacao grafica apenas dos niveis do fator A em caso de esquema fatorial (Design 4 ou 5)

  • "B" = Para obter a presentacao grafica apenas dos niveis do fator B em caso de esquema fatorial (Design 4 ou 5)

  • "A:B" = Para obter a presentacao grafica de todos os tratamentos (combinacoes entre os niveis do fator A e B) em caso de esquema fatorial (Design 4, 5, 6 ou 7)

  • "A:C" = Para obter a presentacao grafica de todos os tratamentos (combinacoes entre os niveis do fator A e C) em caso de esquema fatorial (Design 6 ou 7)

  • "B:C" = Para obter a presentacao grafica de todos os tratamentos (combinacoes entre os niveis do fator B e C) em caso de esquema fatorial (Design 6 ou 7)

  • "A:B:C" = Para obter a presentacao grafica de todos os tratamentos (combinacoes entre os niveis do fator A, B e C) em caso de esquema fatorial (Design 6 ou 7)

layout

Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente.

xlab

nome do eixo x do grafico de variaveis canonicas

ylab

nome do eixo y do grafico de variaveis canonicas

cols

Numero das variaveis canonicas que se pretende apresentar no grafico. O padrao e 'c(1,2)'.

CR

Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo.

CorPlot

Valor logico. Se for TRUE sera apresentado no grafico as correlacoes.

CorCol

Cor das setas na dispersao grafica da correlacao (default = "black")

VarCol

Cor do nome das variavies na dispersao grafica da correlacao (default = "red")

bty

deve receber un character indicando o tipo de borda desejado no grafico.

  • "o": Todas as bordas

  • "n": Sem bordas

  • "7": Acima e a direita

  • "L": Abaixo + esquerda (Default)

  • "C": Acima + Direita + Abaixo

  • "U": Direita + Abaixo + Direita

Perc

Valor entre 0 e 1 indicando o recuo dos eixos.

length

Refere-se ao tamanho da seta. O default e 0.25.

Value

A funcao retorna resultados associados as variaveis canonicas.

References

PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR

CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)

FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)

HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)

See Also

lm, manova

Examples

#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
VariaveisCanonicas(Dados.DIC,1)
#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red")
#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
VariaveisCanonicas(Dados.DQL,3,layout=2)

#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A:B")
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A",layout=3)
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="B",layout=4)

#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A:B",layout=5)
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A")
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="B")


#Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A:B")
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A")
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="B")

#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A:B")
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A")
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="B")