Title: | Pacote Para Analise Multivariada |
---|---|
Description: | Package with multivariate analysis methodologies for experiment evaluation. The package estimates dissimilarity measures, builds dendrograms, obtains MANOVA, principal components, canonical variables, etc. (Pacote com metodologias de analise multivariada para avaliação de experimentos. O pacote estima medidas de dissimilaridade, construi de dendogramas, obtem a MANOVA, componentes principais, variaveis canonicas, etc.) |
Authors: | Alcinei Mistico Azevedo [aut, cre] |
Maintainer: | Alcinei Mistico Azevedo <[email protected]> |
License: | GPL-3 |
Version: | 0.5.0 |
Built: | 2024-12-05 07:11:30 UTC |
Source: | CRAN |
Esta funcao retorna o resultado da analise de variancia considerando clusters formados por diferentes metodos como dendrograma, kmeans, Tocher, etc.
AnovaCluster(Cluster,Dados=Dados,design=design,test="Pillai")
AnovaCluster(Cluster,Dados=Dados,design=design,test="Pillai")
Cluster |
Vetor contendo os grupos que cada individuo/tratamento pertence. Veja os exemplos. |
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
test |
Nome do teste que se deseja utilizar na manova ("Pillai", "Wilks", "Hotelling-Lawley" ou "Roy"). |
A funcao retorna a ANOVA, para todas as variaveis considerando os clustes criados.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
####################################################### ####################################################### #Dados sem repeticoes considerando o Kmeans data(Dados.MED) Km=Kmeans(Dados = Dados.MED,design = 1,nclusters = 4) AnovaCluster(Cluster = Km$Classe,Dados=Dados.MED,design = 1) #Dados sem repeticoes considerando o Tocher dist=Distancia(Dados = Dados.MED,Metodo = 3) TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.MED,design = 1) #Dados sem repeticoes considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey") Dendro AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.MED,design = 1) ####################################################################### ####################################################################### #DIC considerando o Kmeans data(Dados.DIC) N=Kmeans_NumeroOtimo2(Dados = Dados.DIC,design = 2) Km=Kmeans(Dados = Dados.DIC,design = 3,nclusters = N$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DIC,design = 2) #DIC considerando o Tocher m=MANOVA(Dados.DIC,Modelo=1) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DIC,design = 2) #DIC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey") Dendro AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DIC,design = 2) ####################################################################### ####################################################################### #DBC considerando o Kmeans data(Dados.DBC) n=Kmeans_NumeroOtimo2(Dados = Dados.DBC,design = 3) Km=Kmeans(Dados = Dados.DBC,design = 3,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DBC,design = 3) #DBC considerando o Tocher m=MANOVA(Dados.DBC,Modelo=2) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) dist TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DBC,design = 3) #DBC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Mcclain") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DBC,design = 3) ####################################################################### ####################################################################### #DQL considerando o Kmeans data(Dados.DQL) n=Kmeans_NumeroOtimo2(Dados = Dados.DQL,design = 4) Km=Kmeans(Dados = Dados.DQL,design = 4,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DQL,design = 4) #DQL considerando o Tocher m=MANOVA(Dados.DQL,Modelo=2) dist=Distancia(Dados = m$Med,Metodo = 3) dist TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DQL,design = 4) #DQL considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DQL,design = 4) ####################################################################### ####################################################################### #Fat duplo em dic considerando o Kmeans data("Dados.Fat2.DIC") n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DIC,design = 5) Km=Kmeans(Dados = Dados.Fat2.DIC,design = 5,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DIC,design = 5) #Fat2.DIC considerando o Tocher m=MANOVA(Dados.Fat2.DIC,Modelo=4) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO$Classe AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DIC,design = 5) #Fat2.DIC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DIC,design = 5) ####################################################################### ####################################################################### #Fat duplo em dbc considerando o Kmeans data("Dados.Fat2.DBC") n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DBC,design = 6) Km=Kmeans(Dados = Dados.Fat2.DBC,design = 5,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DBC,design = 5) #Fat2.DBC considerando o Tocher m=MANOVA(Dados.Fat2.DBC,Modelo=5) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO$Classe AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DBC,design = 5) #Fat2.DBC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Cindex") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DBC,design = 6)
####################################################### ####################################################### #Dados sem repeticoes considerando o Kmeans data(Dados.MED) Km=Kmeans(Dados = Dados.MED,design = 1,nclusters = 4) AnovaCluster(Cluster = Km$Classe,Dados=Dados.MED,design = 1) #Dados sem repeticoes considerando o Tocher dist=Distancia(Dados = Dados.MED,Metodo = 3) TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.MED,design = 1) #Dados sem repeticoes considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey") Dendro AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.MED,design = 1) ####################################################################### ####################################################################### #DIC considerando o Kmeans data(Dados.DIC) N=Kmeans_NumeroOtimo2(Dados = Dados.DIC,design = 2) Km=Kmeans(Dados = Dados.DIC,design = 3,nclusters = N$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DIC,design = 2) #DIC considerando o Tocher m=MANOVA(Dados.DIC,Modelo=1) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DIC,design = 2) #DIC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey") Dendro AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DIC,design = 2) ####################################################################### ####################################################################### #DBC considerando o Kmeans data(Dados.DBC) n=Kmeans_NumeroOtimo2(Dados = Dados.DBC,design = 3) Km=Kmeans(Dados = Dados.DBC,design = 3,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DBC,design = 3) #DBC considerando o Tocher m=MANOVA(Dados.DBC,Modelo=2) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) dist TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DBC,design = 3) #DBC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Mcclain") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DBC,design = 3) ####################################################################### ####################################################################### #DQL considerando o Kmeans data(Dados.DQL) n=Kmeans_NumeroOtimo2(Dados = Dados.DQL,design = 4) Km=Kmeans(Dados = Dados.DQL,design = 4,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.DQL,design = 4) #DQL considerando o Tocher m=MANOVA(Dados.DQL,Modelo=2) dist=Distancia(Dados = m$Med,Metodo = 3) dist TO=Tocher(Dist = dist) TO AnovaCluster(Cluster = TO$Classe,Dados=Dados.DQL,design = 4) #DQL considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DQL,design = 4) ####################################################################### ####################################################################### #Fat duplo em dic considerando o Kmeans data("Dados.Fat2.DIC") n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DIC,design = 5) Km=Kmeans(Dados = Dados.Fat2.DIC,design = 5,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DIC,design = 5) #Fat2.DIC considerando o Tocher m=MANOVA(Dados.Fat2.DIC,Modelo=4) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO$Classe AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DIC,design = 5) #Fat2.DIC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DIC,design = 5) ####################################################################### ####################################################################### #Fat duplo em dbc considerando o Kmeans data("Dados.Fat2.DBC") n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DBC,design = 6) Km=Kmeans(Dados = Dados.Fat2.DBC,design = 5,nclusters = n$ClusterNumber) Km$predict AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DBC,design = 5) #Fat2.DBC considerando o Tocher m=MANOVA(Dados.Fat2.DBC,Modelo=5) dist=Distancia(Dados = m$Med,Metodo = 3) TO=Tocher(Dist = dist) TO$Classe AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DBC,design = 5) #Fat2.DBC considerando o Dendrograma Dendro=Dendrograma(Dissimilaridade = dist,corte="Cindex") Dendro$Classe AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DBC,design = 6)
Esta funcao pode ser utilizado para experimentos com dados qualitativos cujos individuos que compoe cada tratamento possuem valores diferentes. Desta forma, obtem se o a porcentagem de cada classificao para os tratamentos.
ApplyDissimilaridade(Dados,Factor)
ApplyDissimilaridade(Dados,Factor)
Dados |
Matriz contendo os dados qualitativos. Nesta matriz deve conter apenas os dados qualitativos. Nao pode ter a identificacao de tratamentos, blocos, etc. |
Factor |
Vetor com os niveis a partir dos quais se pretende obter as porcentagem de cada classificacao. |
A funcao retorna a porcentagem de cada classificao referente aos dados qualitativos para os tratamentos.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN13:9788581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN13:9780138132637)
data(Dados.FMI.Quali) DadosQuali=ApplyDissimilaridade(Dados.FMI.Quali[,6:10],Dados.FMI.Quali[,2]) Dist=Distancia(DadosQuali,1) Dist Dendo=Dendrograma(Dist, 3) Dendo
data(Dados.FMI.Quali) DadosQuali=ApplyDissimilaridade(Dados.FMI.Quali[,6:10],Dados.FMI.Quali[,2]) Dist=Distancia(DadosQuali,1) Dist Dendo=Dendrograma(Dist, 3) Dendo
Esta funcao possibilita o estudo dos componentes principais.
ComponentesPrincipais(D, padronizar=TRUE, layout=8, cols=c(1,2), xlab="PCA 1", ylab="PCA 2", CR=TRUE, CorPlot=TRUE, CorCol="red", VarCol="blue", Perc=0.1, NomeTrat=NULL, NomeVar=NULL, bty="L")
ComponentesPrincipais(D, padronizar=TRUE, layout=8, cols=c(1,2), xlab="PCA 1", ylab="PCA 2", CR=TRUE, CorPlot=TRUE, CorCol="red", VarCol="blue", Perc=0.1, NomeTrat=NULL, NomeVar=NULL, bty="L")
D |
Matriz com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Se provir de experimento com repeticao, a matriz deve conter apenas as medias dos tratamentos. |
padronizar |
Se for TRUE (default) os dados serao padronizados para ter media 0 e variancia igual a 1. Se for FALSE os componentes principais considerarao os valores originais. |
layout |
Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente. |
cols |
vetor contendo dois numeros indicando os componentes principais que serao utilizados na representacao bidimencional. Default = c(1,2). |
xlab |
Nome do eixo X do grafico de componentes principais. |
ylab |
Nome do eixo Y do grafico de componentes principais. |
CR |
Valor logico.Se for TRUE aparecera a contribuicao relativa dos dois primeiros componentes principais no grafico. |
CorPlot |
Valor logico. Se for TRUE sera apresentado no grafico as correlacoes. |
CorCol |
Indica a cor das setas referente a apresentacao das correlacoes no grafico (default = "red"). |
VarCol |
Cor do nome das variavies na dispersao grafica da correlacao. |
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
NomeTrat |
vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados) |
NomeVar |
Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados) |
bty |
Deve receber um character indicando o tipo de borda desejado no grafico:
|
Esta funcao retorna informacoes importantes para o estudo de componentes princiapais. Sao apresentados autovalores e autovetores da matriz de covariancia, Escores dos componentes principais, correlacao entre as variaveis e eos escores, contribuicao na explicacao de cada componente e o grafico de dispersao dos CPs.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.MED) ComponentesPrincipais(Dados.MED) #Atribuindo nome aos tratamentos Trat=paste("T_",1:nrow(Dados.MED),sep="") ComponentesPrincipais(Dados.MED,NomeTrat = Trat) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=1) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=2) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=3) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=4) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=5) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=6) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=7) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=8) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=9) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = FALSE) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE, CorCol = "blue",VarCol="red" ) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,bty = "n")
data(Dados.MED) ComponentesPrincipais(Dados.MED) #Atribuindo nome aos tratamentos Trat=paste("T_",1:nrow(Dados.MED),sep="") ComponentesPrincipais(Dados.MED,NomeTrat = Trat) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=1) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=2) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=3) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=4) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=5) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=6) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=7) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=8) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=9) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = FALSE) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE, CorCol = "blue",VarCol="red" ) ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,bty = "n")
Esta funcao possibilita o estudo dos componentes principais considerando dados quantitativos e qualitativos simultaneamente.
ComponentesPrincipais.Misto(Dados, plot="all", NomeTrat=NULL, NomeVar=NULL)
ComponentesPrincipais.Misto(Dados, plot="all", NomeTrat=NULL, NomeVar=NULL)
Dados |
Dataframe com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Ha a opcao de colocar o nomes nas linhas para a representacao grafica. Obrigatoriamente, as colunas com as variaveis quantitivas devem ser do tipo "numeric" ou "integer". Ja as colunas com valores dos dados qualitativos devem ser do tipo "logic", "character" ou "factor. |
plot |
Indica o tipo de grafico desejado:
|
NomeTrat |
vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados) |
NomeVar |
Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados) |
Esta funcao retorna informacoes importantes para o estudo de componentes princiapais considerando dados quantitativos e qualitativos simultaneamente.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Package PCAmix: https://cran.r-project.org/web/packages/PCAmixdata/vignettes/PCAmixdata.html
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data("Dados.Misto") NomeTrat=paste("Trat",1:nrow(Dados.Misto),sep="_") ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat) ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "individuos") ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "correlacao")
data("Dados.Misto") NomeTrat=paste("Trat",1:nrow(Dados.Misto),sep="_") ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat) ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "individuos") ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "correlacao")
Esta funcao retorna a contribuicao relativa entre as variaveis independentes no agrupamento formado pelo metodo Tocher, Kmeans ou Dendrograma.
ContribuicaoRelativa(obj,layout=2,theme="default")
ContribuicaoRelativa(obj,layout=2,theme="default")
obj |
Objeto que se obtem como saida pelas funcoes 'Dendrograma()', 'Tocher()' ou 'Kmeans()'. |
layout |
variavel numerica que indica o layout do grafico. Os valores podem variar entre 1 e 5. |
theme |
Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()). |
A funcao retorna a contribuicao das variaveis independentes no agrupamento.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
#Dados sem repeticao considerando o metodo Kmeans data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") no=Kmeans_NumeroOtimo2(Dados,design=1,Metodo = 2) km=Kmeans(Dados,design=1,nclusters=no$ClusterNumber) km$predict ContribuicaoRelativa(km,layout = 2) #Dados de experimento em dic considerando o dendrograma data("Dados.DIC") m=MANOVA(Dados = Dados.DIC,Modelo = 1) dist=Distancia(Dados=m$Med,Metodo =7,Cov = m$CovarianciaResidual) Dendro=Dendrograma(Dissimilaridade = dist,corte = "Dunn") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
#Dados sem repeticao considerando o metodo Kmeans data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") no=Kmeans_NumeroOtimo2(Dados,design=1,Metodo = 2) km=Kmeans(Dados,design=1,nclusters=no$ClusterNumber) km$predict ContribuicaoRelativa(km,layout = 2) #Dados de experimento em dic considerando o dendrograma data("Dados.DIC") m=MANOVA(Dados = Dados.DIC,Modelo = 1) dist=Distancia(Dados=m$Med,Metodo =7,Cov = m$CovarianciaResidual) Dendro=Dendrograma(Dissimilaridade = dist,corte = "Dunn") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
Esta funcao possibilita o estudo dos coordenadas principais.
CoordenadasPrincipais(Dist, layout = 1, main = NULL, NomeTrat = NULL, xlab = "PCoA 1", ylab ="PCoA 2", ColVars = c(1, 2), CR = TRUE, Perc = 0.01, plot = TRUE)
CoordenadasPrincipais(Dist, layout = 1, main = NULL, NomeTrat = NULL, xlab = "PCoA 1", ylab ="PCoA 2", ColVars = c(1, 2), CR = TRUE, Perc = 0.01, plot = TRUE)
Dist |
Matriz com as medidas de dissimilaridade. |
layout |
Deve ser um numero variando de 1 a 8. Para cada numero teremos um layout diferente. |
main |
Titulo do grafico. |
NomeTrat |
Nome dos tratamentos. |
xlab |
Nome do eixo x no grafico. |
ylab |
Nome do eixo y no grafico. |
ColVars |
Numero dos eixos que se pretende apresentar no grafico. O padrao e 'c(1,2)'. |
CR |
Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo. |
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
plot |
Valor logico.Se for TRUE o grafico sera apresentado. |
Esta funcao retorna informacoes importantes para o estudo de coordenadas principais.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cailliez, F. (1983) The analytical solution of the additive constant problem. Psychometrika, 48, 305–308.
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
Paradis, E.; Schliep, K. ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R. (2019) Bioinformatics. 526-528.
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Lingoes, J. C. (1971) Some boundary conditions for a monotone analysis of symmetric matrices. Psychometrika, 36, 195–203.
#Exemplo com dados Quantitativos data("Dados.MED") Dist=Distancia(Dados.MED,Metodo=5) CoordenadasPrincipais(Dist) #Compare os resultados com os componentes principais ComponentesPrincipais(Dados.MED,padronizar = TRUE) #Exemplo com dados Qualitativos data=data("Dados.CAT") Dist=Distancia(Dados.CAT,Metodo=10) CoordenadasPrincipais(Dist)
#Exemplo com dados Quantitativos data("Dados.MED") Dist=Distancia(Dados.MED,Metodo=5) CoordenadasPrincipais(Dist) #Compare os resultados com os componentes principais ComponentesPrincipais(Dados.MED,padronizar = TRUE) #Exemplo com dados Qualitativos data=data("Dados.CAT") Dist=Distancia(Dados.CAT,Metodo=10) CoordenadasPrincipais(Dist)
Esta funcao faz a correlacao entre matrizes e estima sua significancia pelo teste Mantel.
CorrelacaoMantel(Mat1,Mat2, nperm=999, alternativa="bilateral", Plot=TRUE, xlab="Dist1", ylab="Dist2", bty="l")
CorrelacaoMantel(Mat1,Mat2, nperm=999, alternativa="bilateral", Plot=TRUE, xlab="Dist1", ylab="Dist2", bty="l")
Mat1 |
Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'. |
Mat2 |
Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'. |
nperm |
Numero de permutacoes para identificar a signficancia pelo metodo de Mantel |
alternativa |
Character indicando a hipotese alternativa considerada. Pode ser:
|
Plot |
Valor logico (TRUE ou FALSE) indicando se aparecera o grafico de correlacao entre as matriz cofenetica e de dissimilaridade |
xlab |
nome do eixo x do grafico |
ylab |
nome do eixo y do grafico |
bty |
deve receber um character indicando o tipo de borda desejado no grafico.
|
A funcao retorna resultados do teste Tocher.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.
Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.
Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.
Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.
data(Dados.MED) #Distancia euclidiana. Mat1=Distancia(Dados.MED,1) #Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)". Mat2=Distancia(Dados.MED,6) CorrelacaoMantel(Mat1,Mat2)
data(Dados.MED) #Distancia euclidiana. Mat1=Distancia(Dados.MED,1) #Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)". Mat2=Distancia(Dados.MED,6) CorrelacaoMantel(Mat1,Mat2)
Exemplo com um conjunto de dados binarios.
data(Dados.BIN)
data(Dados.BIN)
Um data frame com 5 observacoes e 9 variaveis (Cruz et al. 2014).
Alcinei Mistico Azevedo: [email protected]
PlayList "Curso de Analise Multivariada": <https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Cruz et al., 2014. Modelos biometricos aplicados ao melhoramento de genetico. Vol3. editora UFV. 668p.
Exemplo com um conjunto de dados com 13 variaveis resposta do tipo multicategorico para 9 individuos.
data(Dados.CAT)
data(Dados.CAT)
Um data frame com 9 observacoes e 13 variaveis.
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo simulado com um conjunto de dados de um experimento em DBC.
data(Dados.DBC)
data(Dados.DBC)
Um data frame com 45 observacoes e 11 variaveis. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo de parte de um exeperimento com clones batata-doce em DBC com dados quantitativos e qualitativos.
data(Dados.DBC.Misto)
data(Dados.DBC.Misto)
Um data frame. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo simulado com um conjunto de dados de um experimento no delineamento inteiramente casualizado
data(Dados.DIC)
data(Dados.DIC)
Um data frame com 30 observacoes e 9 variaveis. A primeira coluna tem a identificacao dos tratamentos, a segunda a identificacao das repeticoes e da terceira em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo simulado com um conjunto de dados de um experimento em quadrados latino
data(Dados.DQL)
data(Dados.DQL)
Um data frame com 16 observacoes e 7 colunas. A primeira coluna tem a identificacao dos tratamentos, a segunda um vetor com a identificacao das linhas, a terceira coluna com a identificacao das colunas e da quarta em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
data(Dados.Fat2.DBC)
data(Dados.Fat2.DBC)
Um data frame com 38 observacoes e 14 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao dos blocos e da quarta em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido em DIC.
data(Dados.Fat2.DIC)
data(Dados.Fat2.DIC)
Um data frame com 36 observacoes e 7 colunas. A primeira coluna com a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao das repeticoes e da quarta em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo, [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
data(Dados.Fat3.DBC)
data(Dados.Fat3.DBC)
Um data frame com 64 observacoes e 9 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao dos blocos e da quinta em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
data(Dados.Fat3.DBC)
data(Dados.Fat3.DBC)
Um data frame. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao das repeticoes e da quinta em diante as variaveis respostas (dependentes).
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo de um experimento com progenies de meios irmaos de couve
data(Dados.FMI.Quali)
data(Dados.FMI.Quali)
Um data frame com 25925 observacoes e 10 variaveis.
Alcinei Mistico Azevedo: [email protected]
Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>
Exemplo de um experimento com progenies de meios irmaos de couve
data(Dados.FMI.Quanti)
data(Dados.FMI.Quanti)
Dataframe.
Alcinei Mistico Azevedo: [email protected]
Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>
Exemplo com um conjunto de dados com 7 variaveis resposta quantitativas para 10 individuos.
data(Dados.MED)
data(Dados.MED)
Um data frame com 10 observacoes e 7 variaveis.
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo simulado com um conjunto de dados de um experimento com dados qualitativos binarios, multicategoricos e quantitativos.
data(Dados.Misto)
data(Dados.Misto)
Um data frame com 5 observacoes e 11 colunas.
Alcinei Mistico Azevedo: [email protected]
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Esta funcao retorna a figura do Dendrograma, distancias feneticas e correlacao cofenetica.
Dendrograma(Dissimilaridade, Metodo=3, layout=2, nperm=999, Titulo="", corte="Mojena1")
Dendrograma(Dissimilaridade, Metodo=3, layout=2, nperm=999, Titulo="", corte="Mojena1")
Dissimilaridade |
Matriz contendo a estimativa das distancias entre tratamentos. |
Metodo |
Valor numerico indicando o metodo a ser utilizado:
|
layout |
Deve ser um numero variando de 1 a 10. Para cada numero teremos um layout diferente. |
nperm |
Numero de permutacoes do teste mantel para testar a significancia pelo teste Mantel. |
Titulo |
Texto com o titulo a ser apresentado no grafico |
corte |
Indica a metodologia considerada para estabelecer a linha de corte no Dendrograma:
|
A funcao retorna o Dendrograma, distancias feneticas e correlacao cofenetica.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
MOJENA, R. Hierarquical grouping method and stopping rules: an evaluation. Computer Journal, v.20, p.359-363, 1977.
data(Dados.MED) rownames(Dados.MED)=paste0("Treatment ",1:10) Dist=Distancia(Dados.MED,2) Dendrograma(Dist,Metodo = 2) Dendrograma(Dist,2,layout =1,corte = "Mojena2") Dendrograma(Dist,2,layout =2,corte="Cindex") Dendrograma(Dist,2,layout =3,corte="Frey") Dendrograma(Dist,2,layout =4,corte="Mcclain") Dendrograma(Dist,2,layout =5,corte="Dunn") Dendrograma(Dist,2,layout =6) Dendrograma(Dist,2,layout =7,corte=3) Dendrograma(Dist,2,layout =8) Dendrograma(Dist,2,layout =9) Dendrograma(Dist,2,layout =10,corte=2)
data(Dados.MED) rownames(Dados.MED)=paste0("Treatment ",1:10) Dist=Distancia(Dados.MED,2) Dendrograma(Dist,Metodo = 2) Dendrograma(Dist,2,layout =1,corte = "Mojena2") Dendrograma(Dist,2,layout =2,corte="Cindex") Dendrograma(Dist,2,layout =3,corte="Frey") Dendrograma(Dist,2,layout =4,corte="Mcclain") Dendrograma(Dist,2,layout =5,corte="Dunn") Dendrograma(Dist,2,layout =6) Dendrograma(Dist,2,layout =7,corte=3) Dendrograma(Dist,2,layout =8) Dendrograma(Dist,2,layout =9) Dendrograma(Dist,2,layout =10,corte=2)
Esta funcao retorna informacoes que auxilia na determinacao do numero de clusters a serem considerados no dendrograma.
Dendrograma_NumeroOtimo(Dissimilaridade,Metodo=3)
Dendrograma_NumeroOtimo(Dissimilaridade,Metodo=3)
Dissimilaridade |
Objeto criado pela funcao 'Distancia' |
Metodo |
Metodo Valor numerico indicando o metodo a ser utilizado:
|
A funcao retorna o numero otimo de Clusters.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.MED) rownames(Dados.MED)=paste0("Treatment ",1:10) Dist=Distancia(Dados.MED,Metodo=3) Dendrograma_NumeroOtimo(Dissimilaridade = Dist,Metodo = 3) data("Dados.CAT") Diss=Distancia(Dados = Dados.CAT,Metodo=10) Dendrograma_NumeroOtimo(Dissimilaridade = Diss,Metodo = 5)
data(Dados.MED) rownames(Dados.MED)=paste0("Treatment ",1:10) Dist=Distancia(Dados.MED,Metodo=3) Dendrograma_NumeroOtimo(Dissimilaridade = Dist,Metodo = 3) data("Dados.CAT") Diss=Distancia(Dados = Dados.CAT,Metodo=10) Dendrograma_NumeroOtimo(Dissimilaridade = Diss,Metodo = 5)
Esta funcao retorna a distancia de dissimilaridade.
Distancia(Dados,Metodo,Cov=NULL)
Distancia(Dados,Metodo,Cov=NULL)
Dados |
Matriz contendo os dados para calculo das distancias. Nas linhas devem estar os tratamentos, e nas colunas as variaveis respostas. Neste arquivo nao deve ter a identificacao dos tratamentos. |
Metodo |
Valor numerico indicando o metodo a ser utilizado:
|
Cov |
matriz quadrada e simetrica contendo as variancias e covariancias (residuais) entre as caracteristicas. Necessaria apenas para calculo da distancia de Mahalanobis. |
Um problema do indice de Gower (Metodo = 21) e que quando as variaveis binarias (0 ou 1) indicam a presença ou ausencia de bandas a informação 0-0 (ausencia de bandas em ambos os individuos) indica que os dois individuos sao iguais, o que nao e verdade necessariamente. Caso queira desconsiderar essas informações (0-0) no computo da dissimilaridade, pode-se usar o "indice de Gower 2" (Metodo =22)).
A funcao retorna a distancia estimada entre os tratamentos.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.MED) ##########> Dados quantitativos #1 = Distancia euclidiana. Distancia(Dados.MED,1) #2 = Distancia euclidiana media. Distancia(Dados.MED,2) #3 = Quadrado da distancia euclidiana media. Distancia(Dados.MED,3) #4 = Distancia euclidiana padronizada. Distancia(Dados.MED,4) #5 = Distancia euclidiana padronizada media. Distancia(Dados.MED,5) #6 = Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)". Distancia(Dados.MED,6) #7 = Distancia de Mahalanobis. data(Dados.DBC) m=MANOVA(Dados.DBC,2) Med=apply(Dados.DBC[, -c(1:2)],2,function(x) tapply(x,as.factor(Dados.DBC[,1]),mean)) CRE=m$CovarianciaResidual Distancia(Med,7,CRE) #8 = Distancia de Cole Rodgers. Distancia(Dados.MED,8) ######################>Dados qualitativos: binarios ou multicategoricos #9 = Frequencia de coincidencia. data(Dados.CAT) Distancia(Dados.CAT,9) #10 = Frequencia de discordancia. Distancia(Dados.CAT,10) data(Dados.BIN) Distancia(Dados.BIN,10) #11 = indice Inverso de 1+coincidencia > 1/(1+c) Distancia(Dados.CAT,11) ##############################>Dados qualitativos binarios data(Dados.BIN) #12 = Dissimilaridade de Jacard. Distancia(Dados.BIN,12) #13 = Dissimilaridade de Sorensen Dice. Distancia(Dados.BIN,13) # 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c) Distancia(Dados.BIN,14) #15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d) Distancia(Dados.BIN,15) #16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d). Distancia(Dados.BIN,16) #17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)). Distancia(Dados.BIN,17) #18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)). Distancia(Dados.BIN,18) #19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d). Distancia(Dados.BIN,19) #20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc). Distancia(Dados.BIN,20) #' ##################>Dados mistos (quantitativos, binarios e multicategoricos) data(Dados.Misto) Distancia(Dados.Misto,21)
data(Dados.MED) ##########> Dados quantitativos #1 = Distancia euclidiana. Distancia(Dados.MED,1) #2 = Distancia euclidiana media. Distancia(Dados.MED,2) #3 = Quadrado da distancia euclidiana media. Distancia(Dados.MED,3) #4 = Distancia euclidiana padronizada. Distancia(Dados.MED,4) #5 = Distancia euclidiana padronizada media. Distancia(Dados.MED,5) #6 = Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)". Distancia(Dados.MED,6) #7 = Distancia de Mahalanobis. data(Dados.DBC) m=MANOVA(Dados.DBC,2) Med=apply(Dados.DBC[, -c(1:2)],2,function(x) tapply(x,as.factor(Dados.DBC[,1]),mean)) CRE=m$CovarianciaResidual Distancia(Med,7,CRE) #8 = Distancia de Cole Rodgers. Distancia(Dados.MED,8) ######################>Dados qualitativos: binarios ou multicategoricos #9 = Frequencia de coincidencia. data(Dados.CAT) Distancia(Dados.CAT,9) #10 = Frequencia de discordancia. Distancia(Dados.CAT,10) data(Dados.BIN) Distancia(Dados.BIN,10) #11 = indice Inverso de 1+coincidencia > 1/(1+c) Distancia(Dados.CAT,11) ##############################>Dados qualitativos binarios data(Dados.BIN) #12 = Dissimilaridade de Jacard. Distancia(Dados.BIN,12) #13 = Dissimilaridade de Sorensen Dice. Distancia(Dados.BIN,13) # 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c) Distancia(Dados.BIN,14) #15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d) Distancia(Dados.BIN,15) #16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d). Distancia(Dados.BIN,16) #17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)). Distancia(Dados.BIN,17) #18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)). Distancia(Dados.BIN,18) #19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d). Distancia(Dados.BIN,19) #20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc). Distancia(Dados.BIN,20) #' ##################>Dados mistos (quantitativos, binarios e multicategoricos) data(Dados.Misto) Distancia(Dados.Misto,21)
Esta funcao apresenta um mapa de calor junto com o Dendrograma.
HeatPlot(Dendo,Col=NULL,layout=1,cut=1000)
HeatPlot(Dendo,Col=NULL,layout=1,cut=1000)
Dendo |
Objeto criado pela funcao 'Dendrograma'. |
Col |
Paleta de cores. Veja os exemplos. |
layout |
Deve ser um numero variando de 1 a 3. Para cada numero teremos um layout diferente. |
cut |
Valor do corte no dendrograma para o estabelecimento de cluster. |
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
################################################ #################################### #PlotHeat #Distancia euclidiana data("Dados.MED") dist=Distancia(Dados.MED,Metodo = 3) dist Dendo=Dendrograma(dist) HeatPlot(Dendo) #Distancia Mahalanobis data("Dados.DBC") m=MANOVA(Dados.DBC,Modelo = 2) m dist=Distancia(m$Med,Cov=m$CovarianciaResidual,Metodo = 7) dist Dendo=Dendrograma(dist) HeatPlot(Dendo) col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F')) col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white', 'cyan', '#007FFF', 'blue','#00007F')) col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582', '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE', '#4393C3', '#2166AC', '#053061')) col3 = colorRampPalette(c('red', 'white', 'blue')) col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F', 'cyan', '#007FFF', 'blue', '#00007F')) HeatPlot(Dendo,Col=col1) HeatPlot(Dendo,Col=col3) HeatPlot(Dendo,Col=col4) #Dados binarios data("Dados.BIN") Dist=Distancia(Dados.BIN,Metodo=12) Dist Dend=Dendrograma(Dist) HeatPlot(Dend) HeatPlot(Dend,Col=col3) #Dados cat data("Dados.CAT") row.names(Dados.CAT)=paste0("T",1:nrow(Dados.CAT)) Dist=Distancia(Dados.CAT,Metodo=10) Dist Dend=Dendrograma(Dist) HeatPlot(Dend)
################################################ #################################### #PlotHeat #Distancia euclidiana data("Dados.MED") dist=Distancia(Dados.MED,Metodo = 3) dist Dendo=Dendrograma(dist) HeatPlot(Dendo) #Distancia Mahalanobis data("Dados.DBC") m=MANOVA(Dados.DBC,Modelo = 2) m dist=Distancia(m$Med,Cov=m$CovarianciaResidual,Metodo = 7) dist Dendo=Dendrograma(dist) HeatPlot(Dendo) col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F')) col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white', 'cyan', '#007FFF', 'blue','#00007F')) col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582', '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE', '#4393C3', '#2166AC', '#053061')) col3 = colorRampPalette(c('red', 'white', 'blue')) col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F', 'cyan', '#007FFF', 'blue', '#00007F')) HeatPlot(Dendo,Col=col1) HeatPlot(Dendo,Col=col3) HeatPlot(Dendo,Col=col4) #Dados binarios data("Dados.BIN") Dist=Distancia(Dados.BIN,Metodo=12) Dist Dend=Dendrograma(Dist) HeatPlot(Dend) HeatPlot(Dend,Col=col3) #Dados cat data("Dados.CAT") row.names(Dados.CAT)=paste0("T",1:nrow(Dados.CAT)) Dist=Distancia(Dados.CAT,Metodo=10) Dist Dend=Dendrograma(Dist) HeatPlot(Dend)
Esta funcao retorna clusters pelo metodo kmeans a partir de uma matriz com dados quantitativos.
Kmeans(Dados,design=1,nclusters=4,iter.max = 10,nstart = 1,algorithm = "Hartigan-Wong")
Kmeans(Dados,design=1,nclusters=4,iter.max = 10,nstart = 1,algorithm = "Hartigan-Wong")
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nclusters |
numero desejado de cluster. |
iter.max |
numero de iteracoes permitidas. |
nstart |
numero de conjuntos aleatorios a serem escolhidos. |
algorithm |
Metodo desejado para o agrupamento kmeans:
|
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
#Dados sem repeticao data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dic data("Dados.DIC") Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
#Dados sem repeticao data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dic data("Dados.DIC") Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo
Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nboot |
numero de reamostragens desejadas para o metodo bootstrap. |
method |
Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:
|
NumMax |
Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2). |
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
#Dados sem repeticao data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dic data("Dados.DIC") Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="wss",NumMax=NULL) Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="gap_stat",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
#Dados sem repeticao data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dic data("Dados.DIC") Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="wss",NumMax=NULL) Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em dbc data("Dados.DBC") Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="gap_stat",NumMax=NULL) Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em DQL data("Dados.DQL") Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DIC data("Dados.Fat2.DIC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong") #Dados de experimento em Esquema fatorial em DBC data("Dados.Fat2.DBC") Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL) Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1, algorithm = "Hartigan-Wong")
Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo2
Kmeans_NumeroOtimo2(Dados,design=1,nboot=100, Metodo=1,iter.max = 100, NumMax=NULL,TituloX="Numero de clusters",TituloY=NULL,Theme=theme_classic())
Kmeans_NumeroOtimo2(Dados,design=1,nboot=100, Metodo=1,iter.max = 100, NumMax=NULL,TituloX="Numero de clusters",TituloY=NULL,Theme=theme_classic())
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nboot |
numero de reamostragens desejadas para o metodo bootstrap. |
Metodo |
Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:
|
iter.max |
numero de reamostragens desejadas para o metodo bootstrap. |
NumMax |
Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2). |
TituloX |
Titulo desejado para o eixo x. |
TituloY |
Titulo desejado para o eixo y. |
Theme |
Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()). |
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
#Sem repeticoes data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo2(Dados,design=1,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DIC data("Dados.DIC") Dados=Dados.DIC Kmeans_NumeroOtimo2(Dados,design=2,Metodo = 2,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DBC data("Dados.DBC") Dados=Dados.DBC Kmeans_NumeroOtimo2(Dados,design=3,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DQL data("Dados.DQL") Dados=Dados.DQL Kmeans_NumeroOtimo2(Dados,design=4,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em fatorial no DIC data("Dados.Fat2.DIC") Dados=Dados.Fat2.DIC Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em fatorial no DBC data("Dados.Fat2.DBC") Dados=Dados.Fat2.DBC Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)
#Sem repeticoes data("Dados.MED") Dados=Dados.MED rownames(Dados)=paste("Genotipo",1:10,sep="_") Kmeans_NumeroOtimo2(Dados,design=1,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DIC data("Dados.DIC") Dados=Dados.DIC Kmeans_NumeroOtimo2(Dados,design=2,Metodo = 2,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DBC data("Dados.DBC") Dados=Dados.DBC Kmeans_NumeroOtimo2(Dados,design=3,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em DQL data("Dados.DQL") Dados=Dados.DQL Kmeans_NumeroOtimo2(Dados,design=4,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em fatorial no DIC data("Dados.Fat2.DIC") Dados=Dados.Fat2.DIC Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL) #Experimento em fatorial no DBC data("Dados.Fat2.DBC") Dados=Dados.Fat2.DBC Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL) Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)
Esta funcao retorna o resultado da analise de variancia multivariada (MANOVA). @name MANOVA
MANOVA(Dados,Modelo)
MANOVA(Dados,Modelo)
Dados |
Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
Modelo |
Valor numerico indicando o delineamento:
|
A funcao retorna a MANOVA, a matriz de (co)variancia residual e o numero dos graus de liberdade do residuo.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") MANOVA(Dados.DIC,1) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) MANOVA(Dados.DBC,2) #Delineamento em quadrado latino (DQL) data(Dados.DQL) MANOVA(Dados.DQL,3) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) MANOVA(Dados.Fat2.DIC,4) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) MANOVA(Dados.Fat2.DBC,5) #' #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) MANOVA(Dados.Fat3.DIC,6) #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) MANOVA(Dados.Fat3.DBC,7)
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") MANOVA(Dados.DIC,1) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) MANOVA(Dados.DBC,2) #Delineamento em quadrado latino (DQL) data(Dados.DQL) MANOVA(Dados.DQL,3) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) MANOVA(Dados.Fat2.DIC,4) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) MANOVA(Dados.Fat2.DBC,5) #' #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) MANOVA(Dados.Fat3.DIC,6) #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) MANOVA(Dados.Fat3.DBC,7)
Esta funcao faz a padronizacao da matriz de dissimilaridade a fim de retirar a escala, nesta etapa, os valores das matrizes sao calculados, a fim de variar entre 0 e 1. Posteriormente, e feita a media ponderada entre essas matrizes em funcao do numero de variaveis consideradas na estimativa de cada uma dessas dissimilaridade. Essa funcao e importante quando se trabalha com dados mistos.
MediaDistancia(Distancias,n,Normatizar=TRUE)
MediaDistancia(Distancias,n,Normatizar=TRUE)
Distancias |
Objeto do tipo list contendo as matrizes de dissimilaridade. |
n |
Vetor com o numero de variaveis consideradas na estimacao de cada medida de dissimilaridade. |
Normatizar |
Valor Logico. Se TRUE a matriz de dissimilaridade sera normatizada para que os valores variem entre 0 e 1. |
Retorna a media ponderada de duas matrizes de dissimilaridade.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
#Obentendo as dados de exemplo DadosQuanti=matrix(rnorm(100,100,5),ncol=4) DadosQuali=matrix(round(runif(200,1,5),0),ncol=8) DadosBin=matrix(round(rbinom(400 ,1,0.5),0),ncol=16) rownames(DadosQuanti)=rownames(DadosQuali)=rownames(DadosBin)=paste("T",1:25,sep="_") #Obentendo as matrizes de dissimilaridade DistQuant=Distancia(DadosQuanti,4) DistQuali=Distancia(DadosQuali,10) Distbin=Distancia(DadosBin,12) #Criando os argumentos Distancias=list(DistQuant,DistQuali,Distbin) n=c(ncol(DadosQuanti),ncol(DadosQuali),ncol(DadosBin)) #obentedo a media ponderada das matrizes Dist=MediaDistancia(Distancias,n,Normatizar = TRUE) Dist
#Obentendo as dados de exemplo DadosQuanti=matrix(rnorm(100,100,5),ncol=4) DadosQuali=matrix(round(runif(200,1,5),0),ncol=8) DadosBin=matrix(round(rbinom(400 ,1,0.5),0),ncol=16) rownames(DadosQuanti)=rownames(DadosQuali)=rownames(DadosBin)=paste("T",1:25,sep="_") #Obentendo as matrizes de dissimilaridade DistQuant=Distancia(DadosQuanti,4) DistQuali=Distancia(DadosQuali,10) Distbin=Distancia(DadosBin,12) #Criando os argumentos Distancias=list(DistQuant,DistQuali,Distbin) n=c(ncol(DadosQuanti),ncol(DadosQuali),ncol(DadosBin)) #obentedo a media ponderada das matrizes Dist=MediaDistancia(Distancias,n,Normatizar = TRUE) Dist
Esta funcao retorna o diagnostico de multicolinearidade. E indicativo de multicolinearidade a presenca de pelo menos um fator de inflacao de variancia maior que 10 ou numero de condicao maior que 100 (Cruz et al.,2014). @name Multicolinearidade
Multicolinearidade(Matriz)
Multicolinearidade(Matriz)
Matriz |
Matriz na qual se deseja verificar a presenca de multicolinearidade. |
A funcao retorna os autovalores,numero de condicao, fator de inflacao de variancia e a determinante da matriz .
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.MED) D=cov(Dados.MED) Multicolinearidade(D)
data(Dados.MED) D=cov(Dados.MED) Multicolinearidade(D)
Este pacote realiza a analise de experimentos por abordagem multivariada. Com este pacote e possivel fazer analises de variancia multivariada, estimar medidas de disimilaridade, fazer dendogramas,componentes principais, variaveis canonicas, etc.
Alcinei Mistico Azevedo: <[email protected]>
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Esta funcao faz a padronizacao da matriz a fim de retirar a escala. Para isso, os valores das matrizes sao calculados a fim de variar entre um "LimiteInferior" e um "LimiteSuperior".
Normatiza(DadosEntrada, DadosBase=NULL, LimiteInferior=0, LimiteSuperior=1,Metodo=1)
Normatiza(DadosEntrada, DadosBase=NULL, LimiteInferior=0, LimiteSuperior=1,Metodo=1)
DadosEntrada |
Matriz contendo os dados sendo normatizados. |
DadosBase |
Matriz contendo o conjunto de dados referencia para a normatizacao. Se for "NULL" essa matriz de referencia sera a propria matriz de entrada. |
LimiteInferior |
Numero cujo menor valor devera corresponder. |
LimiteSuperior |
Numero cujo maior valor devera corresponder. |
Metodo |
indica a forma que a normatizacao sera feita. Pode receber o valor 1 ou 2:
|
Retorna a matriz normatizada.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data("Dados.MED") Dist=Distancia(Dados.MED,3) Dendrograma(Dist) DistN=Normatiza((Dist),LimiteInferior = 0,LimiteSuperior = 1,Metodo = 2) Dendrograma(DistN)
data("Dados.MED") Dist=Distancia(Dados.MED,3) Dendrograma(Dist) DistN=Normatiza((Dist),LimiteInferior = 0,LimiteSuperior = 1,Metodo = 2) Dendrograma(DistN)
Esta funcao retorna o resultado da comparacao multiplas (dois a dois) com abordagem multivariada.
PairComp(MANOVA,adjust="bonferroni",test="Pillai",Sig=0.05)
PairComp(MANOVA,adjust="bonferroni",test="Pillai",Sig=0.05)
MANOVA |
Resultado da funcao MANOVA |
adjust |
Ajuste da significancia para o teste de comparacao multipla. Pode ser: "holm", "hochberg", "hommel", "bonferroni", "BH", "BY", "fdr" ou "none". |
test |
Teste considerado na MANOVA. Pode ser:"Pillai", "Wilks", "Hotelling-Lawley" ou "Roy" |
Sig |
Significancia a ser considerado. Default e 0.05. |
A funcao as comparações multiplas para os tratamentos.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
Da Silva, A.R.; Malafaia, G.; Menezes, I.P.P. (2017) biotools: an R function to predict spatial gene diversity via an individual-based approach. Genetics and Molecular Research, 16: gmr16029655.
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
Krzanowski, W. J. (1988) Principles of Multivariate Analysis. A User's Perspective. Oxford.
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") Res=MANOVA(Dados.DIC,1) PairComp(Res) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) Res=MANOVA(Dados.DBC,2) PairComp(Res) #Delineamento em quadrado latino (DQL) data(Dados.DQL) Res=MANOVA(Dados.DQL,3) PairComp(Res) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) Res=MANOVA(Dados.Fat2.DIC,4) PairComp(Res) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) Res=MANOVA(Dados.Fat2.DBC,5) PairComp(Res) #' #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) Res=MANOVA(Dados.Fat3.DIC,6) PairComp(Res) #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) Res=MANOVA(Dados.Fat3.DBC,7) PairComp(Res)
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") Res=MANOVA(Dados.DIC,1) PairComp(Res) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) Res=MANOVA(Dados.DBC,2) PairComp(Res) #Delineamento em quadrado latino (DQL) data(Dados.DQL) Res=MANOVA(Dados.DQL,3) PairComp(Res) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) Res=MANOVA(Dados.Fat2.DIC,4) PairComp(Res) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) Res=MANOVA(Dados.Fat2.DBC,5) PairComp(Res) #' #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) Res=MANOVA(Dados.Fat3.DIC,6) PairComp(Res) #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) Res=MANOVA(Dados.Fat3.DBC,7) PairComp(Res)
Esta funcao cria um grafico 3d a partir de escores.
plot3d(Obj,names = NULL,lab=NULL,title=NULL,cols=c(1,2,3),size=1)
plot3d(Obj,names = NULL,lab=NULL,title=NULL,cols=c(1,2,3),size=1)
Obj |
Objeto criado pelas funcoes 'ComponentesPrincipais', 'CoordenadasPrincipais' e 'VariaveisCanonicas'. |
names |
Nomes das Variaveis. |
lab |
Nome dos eixos. |
title |
Titulo do grafico. |
cols |
Numeros dos eixos que aparecera no grafico. |
size |
Tamanho das letras. |
Esta funcao retorna um grafico com tres dimensoes.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
##################################### ##### Matriz ################################# data("Dados.MED") data=as.matrix(Dados.MED[,5:7]) plot3d(Obj = data,names = letters[1:10], lab=c("Retencao 75", "Retencao 55", "Retencao fundo"),size =2 ) ##################################### ##### Componentes Principais ################################# data(Dados.MED) cp=ComponentesPrincipais(Dados.MED,layout = 11, CorPlot = TRUE,VarCol = "green") plot3d(Obj = cp,names = letters[1:10], lab=c("Principal Component 1", "Principal Component 2", "Principal Component 3"),size =2 ) ##################################### ##### Variaveis canonicas ################################# data(Dados.DBC) VC=VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red") plot3d(VC) plot3d(VC,names = paste("Var","1:10"), lab=c("Variable component 1", "Variable Component 2", "Variable Component 3"),size =2 ) ##################################### ##### Coordenadas Principais ################################# data=data("Dados.CAT") Dist=Distancia(Dados.CAT,Metodo=10) CO=CoordenadasPrincipais(Dist) plot3d(Obj = CO,names = letters[1:9], lab=c("PCoA 1", "PCoA 2", "PCoA 3"),size =2 )
##################################### ##### Matriz ################################# data("Dados.MED") data=as.matrix(Dados.MED[,5:7]) plot3d(Obj = data,names = letters[1:10], lab=c("Retencao 75", "Retencao 55", "Retencao fundo"),size =2 ) ##################################### ##### Componentes Principais ################################# data(Dados.MED) cp=ComponentesPrincipais(Dados.MED,layout = 11, CorPlot = TRUE,VarCol = "green") plot3d(Obj = cp,names = letters[1:10], lab=c("Principal Component 1", "Principal Component 2", "Principal Component 3"),size =2 ) ##################################### ##### Variaveis canonicas ################################# data(Dados.DBC) VC=VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red") plot3d(VC) plot3d(VC,names = paste("Var","1:10"), lab=c("Variable component 1", "Variable Component 2", "Variable Component 3"),size =2 ) ##################################### ##### Coordenadas Principais ################################# data=data("Dados.CAT") Dist=Distancia(Dados.CAT,Metodo=10) CO=CoordenadasPrincipais(Dist) plot3d(Obj = CO,names = letters[1:9], lab=c("PCoA 1", "PCoA 2", "PCoA 3"),size =2 )
Esta funcao converte dados quantitativos em qualitativos. Para isso, deve-se apenas indicar o numero de classes desejadas. A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.
Quant2Quali(Dados,nclasses)
Quant2Quali(Dados,nclasses)
Dados |
Objeto com os dados quantitativos a serem convertidos em qualitativos. |
nclasses |
Numero maximo de classes desejado. |
A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.Misto) nclasses=5 Dados=Dados.Misto[,c(6,7,10)] Quant2Quali(Dados,nclasses)
data(Dados.Misto) nclasses=5 Dados=Dados.Misto[,c(6,7,10)] Quant2Quali(Dados,nclasses)
Esta funcao define como o endereco da pasta onde esta o scritp atual como o diretorio de trabalho. (This function set the directory of current script as working directory).
setwd_script()
setwd_script()
Esta funcao apresenta informacoes que resumem a matriz de dissimilaridade.
SummaryDistancia(Dist, ndec=2, plot=TRUE, layout="shade", type="full", title=NULL, tl.cex =1, tl.col="black", col=NULL)
SummaryDistancia(Dist, ndec=2, plot=TRUE, layout="shade", type="full", title=NULL, tl.cex =1, tl.col="black", col=NULL)
Dist |
Matriz de dissimilaridade |
ndec |
Valor numerico indicando o numero de casas decimais. |
plot |
Valor logico (TRUE ou FALSE). Indica se o grafico deve ser apresentado. |
layout |
Valor do tipo character indicando como sera preenchido cada casela:
|
type |
Character, 'full' (default), 'upper' or 'lower', display full matrix, lower triangular or upper triangular matrix.
|
title |
Texto referente ao titulo da figura |
tl.cex |
Valor numerico indicando o tamanho das letras no grafico |
tl.col |
Cor das letras. Default ("black") |
col |
Vetor com a paleta de cores. Estas cores devem ser distribuidas uniformemente. se NULL, a paleta de cores sera colorRampPalette(col2)(200), veja exemplo abaixo. |
Retorna informacoes importantes sobre cada tratamento em relacao aos demais como distancia media, menor distancia, maior distancia, tratamento mais proximo, tratamento mais distante etc.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
data(Dados.MED) Dist=Distancia(Dados.MED,1) SummaryDistancia(Dist) #Acrescentando nomes aos tratamentos Dist=as.matrix(Dist$Distancia) rownames(Dist)=colnames(Dist)=paste("Trat",1:nrow(Dist)) SummaryDistancia(Dist) #Diferentes configuracoes SummaryDistancia(Dist,type ="lower") #opcoes de paletas de cores col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F')) col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white', 'cyan', '#007FFF', 'blue','#00007F')) col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582', '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE', '#4393C3', '#2166AC', '#053061')) col3 = colorRampPalette(c('red', 'white', 'blue')) col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F', 'cyan', '#007FFF', 'blue', '#00007F')) SummaryDistancia(Dist,type = "upper",col=col4(200),title = "Medidas de dissimilaridade") SummaryDistancia(Dist,type = "lower",layout = "ellipse",col=col3(200))
data(Dados.MED) Dist=Distancia(Dados.MED,1) SummaryDistancia(Dist) #Acrescentando nomes aos tratamentos Dist=as.matrix(Dist$Distancia) rownames(Dist)=colnames(Dist)=paste("Trat",1:nrow(Dist)) SummaryDistancia(Dist) #Diferentes configuracoes SummaryDistancia(Dist,type ="lower") #opcoes de paletas de cores col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F')) col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white', 'cyan', '#007FFF', 'blue','#00007F')) col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582', '#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE', '#4393C3', '#2166AC', '#053061')) col3 = colorRampPalette(c('red', 'white', 'blue')) col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F', 'cyan', '#007FFF', 'blue', '#00007F')) SummaryDistancia(Dist,type = "upper",col=col4(200),title = "Medidas de dissimilaridade") SummaryDistancia(Dist,type = "lower",layout = "ellipse",col=col3(200))
Esta funcao faz o agrupamento pelo metodo Tocher.
Tocher(Dist, Metodo="original", nperm=999, Plot=1, xlab="Dissimilaridade", ylab="Distancia fenetica", bty="n")
Tocher(Dist, Metodo="original", nperm=999, Plot=1, xlab="Dissimilaridade", ylab="Distancia fenetica", bty="n")
Dist |
Objeto contendo a matriz de dissimilaridade |
Metodo |
Um character indicando o algoritimo de agrupamento. Ha duas possibidades: "original" (default) ou "sequential". O ultimo foi proposto por Vasconcelos et al. (2007), tambem chamando de metodo Tocher modificado. |
nperm |
Numero de permutacoes para identificar a signficancia pelo metodo de Mantel |
Plot |
Numero indicando qual grafico devera ser plotado:
|
xlab |
nome do eixo x do grafico. Deve ser utilizado quando o Plot=2. |
ylab |
nome do eixo y do grafico. Deve ser utilizado quando o Plot=2. |
bty |
deve receber un character indicando o tipo de borda desejado no grafico. Deve ser utilizado quando o Plot=2.
|
A funcao retorna resultados do teste Tocher.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.
Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.
Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.
Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.
data("Dados.MED") Dist=Distancia(Dados.MED,Metodo=6) Tocher(Dist)
data("Dados.MED") Dist=Distancia(Dados.MED,Metodo=6) Tocher(Dist)
Esta funcao faz a analise dos dados pelo metodo de variaveis canonicas. @name VariaveisCanonicas
VariaveisCanonicas(Dados, Modelo=1, Fator=NULL, layout=1, xlab="VC1", ylab="VC2", cols=c(1,2), CR=TRUE, CorPlot=TRUE, CorCol="red", VarCol ="blue", bty="L", Perc=0.1, length = 0.25)
VariaveisCanonicas(Dados, Modelo=1, Fator=NULL, layout=1, xlab="VC1", ylab="VC2", cols=c(1,2), CR=TRUE, CorPlot=TRUE, CorCol="red", VarCol ="blue", bty="L", Perc=0.1, length = 0.25)
Dados |
Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
Modelo |
Valor numerico indicando o delineamento:
|
Fator |
Indica qual fator deve ser estudado na representacao grafica. Tal decisao pode ser feita baseando na significancia da manova. Esse objeto deve receber:
|
layout |
Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente. |
xlab |
nome do eixo x do grafico de variaveis canonicas |
ylab |
nome do eixo y do grafico de variaveis canonicas |
cols |
Numero das variaveis canonicas que se pretende apresentar no grafico. O padrao e 'c(1,2)'. |
CR |
Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo. |
CorPlot |
Valor logico. Se for TRUE sera apresentado no grafico as correlacoes. |
CorCol |
Cor das setas na dispersao grafica da correlacao (default = "black") |
VarCol |
Cor do nome das variavies na dispersao grafica da correlacao (default = "red") |
bty |
deve receber un character indicando o tipo de borda desejado no grafico.
|
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
length |
Refere-se ao tamanho da seta. O default e 0.25. |
A funcao retorna resultados associados as variaveis canonicas.
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") VariaveisCanonicas(Dados.DIC,1) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red") #Delineamento em quadrado latino (DQL) data(Dados.DQL) VariaveisCanonicas(Dados.DQL,3,layout=2) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A:B") VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A",layout=3) VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="B",layout=4) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A:B",layout=5) VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A") VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="B") #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A:B") VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A") VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="B") #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A:B") VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A") VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="B")
#Delineamento inteiramente casualizado (DIC) data("Dados.DIC") VariaveisCanonicas(Dados.DIC,1) #Delineamento em blocos casualizados (DBC) data(Dados.DBC) VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red") #Delineamento em quadrado latino (DQL) data(Dados.DQL) VariaveisCanonicas(Dados.DQL,3,layout=2) #Esquema fatorial duplo em DIC data(Dados.Fat2.DIC) VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A:B") VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A",layout=3) VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="B",layout=4) #Esquema fatorial duplo em DBC data(Dados.Fat2.DBC) VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A:B",layout=5) VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A") VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="B") #Esquema fatorial triplo em DIC data(Dados.Fat3.DIC) VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A:B") VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A") VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="B") #Esquema fatorial triplo em DBC data(Dados.Fat3.DBC) VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A:B") VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A") VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="B")