Package 'MVar.pt'

Title: Analise multivariada (brazilian portuguese)
Description: Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada.
Authors: Paulo Cesar Ossani [aut, cre] , Marcelo Angelo Cirillo [aut]
Maintainer: Paulo Cesar Ossani <[email protected]>
License: GPL-3
Version: 2.2.5
Built: 2025-02-21 06:55:17 UTC
Source: CRAN

Help Index


Analise multivariada (brazilian portuguese).

Description

Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada.

Details

Package: MVar.pt
Type: Package
Version: 2.2.5
Date: 2024-11-22
License: GPL(>=2)
LazyLoad: yes

Author(s)

Paulo Cesar Ossani e Marcelo Angelo Cirillo.

Maintainer: Paulo Cesar Ossani <[email protected]>

References

Abdessemed, L.; Escofier, B.; Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996.

Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.

Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.

Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.

Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.

Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional Data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.

Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual Data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.

Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & Data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004

Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & Data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.

Benzecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.

Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.

Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational Methods for High-Dimensional Rotations in Data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: Data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.

Charnet, R., at al. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.

Cook, D.; Lee, E. K.; Buja, A.; WickmamM, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of Data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.

Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.

Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.

Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for Data Analysis: With R and GGobi. Springer. 2007.

Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.

Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.

Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.

Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.

Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.

Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & Data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994

Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.

Ferreira, D. F. Estatistica multivariada. 2. ed. rev. e ampl. Lavras: UFLA, 2011. 675 p.

Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.

Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.

Hastie, T.; Buja, A.; Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.

Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.

Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.

Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.

Johnson, R. A.; Wichern, D. W. Applied multivariate statistical analysis. 6th ed. New Jersey: Prentice Hall, 2007. 794 p.

Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.

Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.

Lee, E. K., Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.

Martinez, W. L.; Martinez, A. R. Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.

Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory Data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.

Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.

Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.

Pages, J. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.

Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.

Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and Data Analysis, 29:669-687, 1995a.

Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b

Rencher, A.C.; Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.

Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.


Grafico Biplot.

Description

Realiza o grafico Biplot.

Usage

Biplot(data, alpha = 0.5, title = NA, xlabel = NA, ylabel = NA,
       size = 1.1, grid = TRUE, color = TRUE, var = TRUE,
       obs = TRUE, linlab = NA, class = NA, classcolor = NA,
       posleg = 2, boxleg = TRUE, axes = TRUE, savptc = FALSE, 
       width = 3236, height = 2000, res = 300)

Arguments

data

Dados para plotagem.

alpha

Representatividade dos individuos (alpha), representatividade das variaveis (1 - alpha). Sendo 0.5 o default.

title

Titulo para o grafico, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

var

Acrescenta as projecoes das variaveis ao grafico (default = TRUE).

obs

Acrescenta as observacoes ao grafico (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

axes

Plota os eixos X e Y (default = TRUE).

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

Value

Biplot

Grafico Biplot.

Md

Matriz autovalores.

Mu

Matriz U (autovetores).

Mv

Matriz V (autovetores).

coorI

Coordenadas dos individuos.

coorV

Coordenadas das variaveis.

pvar

Proporcao dos componentes principais.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Examples

data(iris) # conjunto de dados

data <- iris[,1:4]

Biplot(data)

cls <- iris[,5]

res <- Biplot(data, alpha = 0.6, title = "Biplot dos Dados\n valorizando os individuos",
              class = cls, classcolor = c("goldenrod3","gray56","red"),
              posleg = 2, boxleg = FALSE, axes = TRUE, savptc = FALSE, 
              width = 3236, height = 2000, res = 300)
print(res$pvar)


res <- Biplot(data, alpha = 0.4, title = "Grafico valorizando as variaveis",
              xlabel = "", ylabel = "", color = FALSE, obs = FALSE, 
              savptc = FALSE, width = 3236, height = 2000, res = 300) 
print(res$pvar)

Analise de correspondencia (CA).

Description

Realiza analise de correspondencia simples (CA) e multipla (MCA) em um conjunto de dados.

Usage

CA(data, typdata = "f", typmatrix = "I")

Arguments

data

Dados a serem analisados (tabela de contingencia).

typdata

"f" para dados de frequencia (default),
"c" para dados qualitativos.

typmatrix

Matriz usada para calculos quando typdata = "c".
"I" para matriz indicadora (default),
"B" para matriz de Burt.

Value

depdata

Verifica se as linhas e colunas sao dependentes, ou independentes pelo teste Qui-quadrado, a nivel 5% de significancia.

typdata

Tipo de dados: "F" frequencia ou "C" qualitativo.

numcood

Numero de coordenadas principais.

mtxP

Matriz da frequencia relativa.

vtrR

Vetor com as somas das linhas.

vtrC

Vetor com as somas das colunas.

mtxPR

Matriz com perfil das linhas.

mtxPC

Matriz com perfil das colunas.

mtxZ

Matriz Z.

mtxU

Matriz com os autovetores U.

mtxV

Matriz com os autovetores V.

mtxL

Matriz com os autovalores.

mtxX

Matriz com as coordenadas principais das linhas.

mtxY

Matriz com as coordenadas principais das colunas.

mtxAutvlr

Matriz das inercias (variancias), com as proporcoes e proporcoes acumuladas.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

See Also

Plot.CA

Examples

data(DataFreq) # conjunto de dados de frequencia

data <- DataFreq[,2:ncol(DataFreq)]

rownames(data) <- as.character(t(DataFreq[1:nrow(DataFreq),1]))

res <- CA(data = data, "f") # realiza CA

print("Existe dependencia entre as linhas e as colunas?"); res$depdata

print("Numero de coordenadas principais:"); res$numcood

print("Coordenadas principais das Linhas:"); round(res$mtxX,2)

print("Coordenadas principais das Colunas:"); round(res$mtxY,2)

print("Inercias das componentes principais:"); round(res$mtxAutvlr,2)

Analise de correlacao canonica (CCA).

Description

Realiza analise de correlacao canonica (CCA) em um conjunto de dados.

Usage

CCA(X = NULL, Y = NULL, type = 1, test = "Bartlett", sign = 0.05)

Arguments

X

Primeiro grupo de variaveis de um conjunto de dados.

Y

Segundo grupo de variaveis de um conjunto de dados.

type

1 para analise utilizando a matriz de covariancia (default),
2 para analise utilizando a matriz de correlacao.

test

teste de significancia da relacao entre o grupo X e Y:
"Bartlett" (default) ou "Rao".

sign

Grau de significancia do teste (default 5%).

Value

Cxx

Matriz de Covariancia ou Correlacao Cxx.

Cyy

Matriz de Covariancia ou Correlacao Cyy.

Cxy

Matriz de Covariancia ou Correlacao Cxy.

Cyx

Matriz de Covariancia ou Correlacao Cyx.

var.UV

Matriz com autovalores (variancias) dos pares cononicos U e V.

corr.UV

Matriz de Correlacao dos pares cononicos U e V.

coef.X

Matriz dos Coeficientes canonicos do grupo X.

coef.Y

Matriz dos Coeficientes canonicos do grupo Y.

corr.X

Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo X.

corr.Y

Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo Y.

score.X

Matriz com os scores do grupo X.

score.Y

Matriz com os scores do grupo Y.

sigtest

Retorna o teste de significancia da relacao entre o grupo X e Y: "Bartlett" (default) ou "Rao".

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Lattin, J.; Carrol, J. D.; Green, P. E. Analise de dados multivariados. 1th. ed. Sao Paulo: Cengage Learning, 2011. 455 p.

See Also

Plot.CCA

Examples

data(DataMix) # conjunto de dados

data <- DataMix[,2:ncol(DataMix)]

rownames(data) <- DataMix[,1]

X <- data[,1:2]

Y <- data[,5:6]

res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05)

print("Matriz com autovalores (variancias) dos pares cononicos U e V:");
round(res$var.UV,3)

print("Matriz de correlacao dos pares cononicos U e V:"); round(res$corr.UV,3)

print("Matriz dos coeficientes canonicos do grupo X:"); round(res$coef.X,3)

print("Matriz dos coeficientes canonicos do grupo Y:"); round(res$coef.Y,3)

print("Matriz das correlacoes entre as variaveis canonicas
       e as variaveis originais do grupo X:"); round(res$corr.X,3)

print("Matriz das correlacoes entre as variaveis canonicas
       e as variaveis originais do grupo Y:"); round(res$corr.Y,3)

print("Matriz com os scores do grupo X:"); round(res$score.X,3)

print("Matriz com os scores do grupo Y:"); round(res$score.Y,3)

print("teste de significancia dos pares canonicos:"); res$sigtest

analysis de cluster.

Description

Realiza analysis de cluster hierarquico e nao hierarquico em um conjunto de dados.

Usage

Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",  
        cor.abs = FALSE, normalize = FALSE, distance = "euclidean",  
        method = "complete", horizontal = FALSE, num.groups = 0,
        lambda = 2, savptc = FALSE, width = 3236, height = 2000, 
        res = 300, casc = TRUE)

Arguments

data

Dados a serem analizados.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

hierarquic

Agrupamentos hierarquicos (default = TRUE), para agrupamentos nao hierarquicos (method K-Means), somente para caso 'analysis' = "Obs".

analysis

"Obs" para analises nas observacoes (default), "Var" para analises nas variaveis.

cor.abs

Matriz de correlacao absoluta caso 'analysis' = "Var" (default = FALSE).

normalize

Normaliza os dados somente para caso 'analysis' = "Obs" (default = FALSE).

distance

Metrica das distancias caso agrupamentos hierarquicos: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". Caso analysis = "Var" a metrica sera a matriz de correlacao, conforme cor.abs.

method

Metodo para analises caso agrupamentos hierarquicos: "complete" (default), "ward.D", "ward.D2", "single", "average", "mcquitty", "median" ou "centroid".

horizontal

Dendrograma na horizontal (default = FALSE).

num.groups

Numero de grupos a formar.

lambda

Valor usado na distancia de minkowski.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Varios graficos.

tab.res

Tabela com as similaridades e distancias dos grupos formados.

groups

Dados originais com os grupos formados.

res.groups

Resultados dos grupos formados.

R.sqt

Resultado do R quadrado.

sum.sqt

Soma do quadrado total.

mtx.dist

Matriz das distancias.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analysis de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Examples

data(DataQuan) # conjunto de dados quantitativos

data <- DataQuan[,2:8]

rownames(data) <- DataQuan[1:nrow(DataQuan),1]

res <- Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs",
               cor.abs = FALSE, normalize = FALSE, distance = "euclidean", 
               method = "ward.D", horizontal = FALSE, num.groups = 2,
               savptc = FALSE, width = 3236, height = 2000, res = 300, 
               casc = FALSE)

print("R quadrado:"); res$R.sqt
# print("Soma do quadrado total:"); res$sum.sqt
print("Grupos formados:"); res$groups
# print("Tabela com as similaridades e distancias:"); res$tab.res
# print("Tabela com os resultados dos grupos:"); res$res.groups
# print("Matriz de distancias:"); res$mtx.dist 

write.table(file=file.path(tempdir(),"SimilarityTable.csv"), res$tab.res, sep=";",
            dec=",",row.names = FALSE) 
write.table(file=file.path(tempdir(),"GroupData.csv"), res$groups, sep=";",
            dec=",",row.names = TRUE) 
write.table(file=file.path(tempdir(),"GroupResults.csv"), res$res.groups, sep=";",
            dec=",",row.names = TRUE)

Coeficiente de variacao dos dados.

Description

Encontra o coeficiente de variacao dos dados, global ou por coluna.

Usage

CoefVar(data, type = 1)

Arguments

data

Dados a serem analisados.

type

1 Coeficiente de variacao global (default),
2 Coeficiente de variacao por coluna.

Value

Coeficiente de variacao, global ou por coluna.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Ferreira, D. F. Estatistica Basica. 2 ed. rev. Lavras: UFLA, 2009. 664 p.

Examples

data(DataQuan) # conjunto de dados 

data <- DataQuan[,2:8]

res <- CoefVar(data = data, type = 1) # coeficiente de variacao global
round(res,2)

res <- CoefVar(data = data, type = 2) # coeficiente de variacao por coluna
round(res,2)

Analise discriminante linear (LDA) e quadratica (QDA).

Description

Realiza analise discriminante linear e quadratica.

Usage

DA(data, class = NA, type = "lda", validation = "learning", 
   method = "moment", prior = NA, testing = NA)

Arguments

data

Dados a serem a classificados.

class

Vetor com os nomes das classes dos dados.

type

"lda": analise discriminante linear (default), ou
"qda": analise discriminante quadratica.

validation

Tipo de validacao:
"learning" - treinamento dos dados (default), ou
"testing" - classifica os dados do vetor "testing".

method

Metodo de classificacao:
"mle" para MLEs,
"mve" para usar cov.mv,
"moment" (default) para estimadores padrao da media e variancia, ou
"t" para estimativas robustas baseadas em uma distribuicao t.

prior

Probabilidades de ocorrencia das classes. Se nao especificado, tomara as proporcoes das classes. Se especificado, as probabilidades devem seguir a ordem dos niveis dos fatores.

testing

Vetor com os indices que serao utilizados em data como teste. Para validation = "learning", tem-se testing = NA.

Value

confusion

Tabela de confusao.

error.rate

Proporcao global de erro.

prior

Probabilidade das classes.

type

Tipo de analise discriminante.

validation

Tipo de validacao.

num.class

Numero de classes.

class.names

Nomes das classes

method

Metodo de classificacao.

num.correct

Numero de observacoes corretas.

results

Matriz com resultados comparativos das classificacoes.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Ripley, B. D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.

Venabless, W. N.; Ripley, B. D. Modern Applied Statistics with S. Fourth edition. Springer, 2002.

Examples

data(iris) # conjunto de dados

data  = iris[,1:4] # dados a serem classificados
class = iris[,5]   # classe dos dados
prior = c(1,1,1)/3 # probabilidade a priori das classes

res <- DA(data, class, type = "lda", validation = "learning", 
          method = "mle", prior = prior, testing = NA)

print("Tabela de confusao:"); res$confusion
print("Proporcao global de acerto:"); 1 - res$error.rate
print("Probabilidade das classes:"); res$prior
print("Metodo de classificacao:"); res$method
print("Tipo analise discriminante:"); res$type
print("Nomes das classes:"); res$class.names
print("Numero de classes:"); res$num.class
print("Tipo de validacao:"); res$validation
print("Numero de observacoes corretas:"); res$num.correct
print("Matriz com os resultados da classificacao:"); res$results


### validacao cruzada ###
amostra   = sample(2, nrow(data), replace = TRUE, prob = c(0.7,0.3))
datatrain = data[amostra == 1,] # dados para treino
datatest  = data[amostra == 2,] # dados para teste

dim(datatrain) # dimensao dados treino
dim(datatest)  # dimensao dados teste

testing  = as.integer(rownames(datatest)) # indice dos dados teste

res <- DA(data, class, type = "qda", validation = "testing", 
          method = "moment", prior = NA, testing = testing)

print("Tabela de confusao:"); res$confusion
print("Proporcao global de acerto:"); 1 - res$error.rate
print("Numero de observacoes corretas:"); res$num.correct
print("Matriz com os resultados da classificacao:"); res$results

Conjunto de dados de frequencia.

Description

Conjunto de dados categorizados por cafes, sobre habilidades sensoriais no consumo de cafes especiais.

Usage

data(Data_Cafes)

Format

Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por cafes. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).

References

Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.

Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.

Examples

data(Data_Cafes) # conjunto de dados categorizados

data <- Data_Cafes[,2:ncol(Data_Cafes)] 

rownames(data) <- as.character(t(Data_Cafes[1:nrow(Data_Cafes),1]))

group.names = c("Cafe A", "Cafe B", "Cafe C", "Cafe D")

mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) 

print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)

print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)

tit <- c("Scree-plot","Individuos", "Individuos/Tipos Cafes", "Inercias Grupos")

Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA,
         posleg = 2, boxleg = FALSE, color = TRUE, 
         namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela

Conjunto de dados de frequencia.

Description

Conjunto de dados categorizados por individuos, sobre habilidades sensoriais no consumo de cafes especiais.

Usage

data(Data_Individuos)

Format

Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por individuos. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).

References

Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.

Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.

Examples

data(Data_Individuos) # conjundo de dados categorizados

data <- Data_Individuos[,2:ncol(Data_Individuos)]

rownames(data) <- as.character(t(Data_Individuos[1:nrow(Data_Individuos),1]))

group.names = c("Grupo 1", "Grupo 2", "Grupo 3", "Grupo 4")

mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) # analise dos dados

print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)

print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)

tit <- c("Scree-plot","Individuos", "Individuos/Grupos Individuos", "Inercias Grupos")

Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA,
         posleg = 2, boxleg = FALSE, color = TRUE, 
         namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela

Conjunto de dados de frequencia.

Description

Conjunto simulado de dados com a frequencia semanal do numero de chicaras de cafes consumidas semanalmente em algumas capitais mundiais.

Usage

data(DataFreq)

Format

Conjunto de dados com 6 linhas e 9 colunas. Sendo 6 observacoes descritas por 9 variaveis: Grupo por sexo e idade, Sao Paulo - Cafe Bourbon, Londres - Cafe Bourbon, Atenas - Cafe Bourbon, Londres - Cafe Acaia, Atenas - Cafe Acaia, Sao Paulo - Cafe Catuai, Londres - Cafe Catuai, Atenas - Cafe Catuai.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

Examples

data(DataFreq)
DataFreq

Conjunto de dados mistos.

Description

Conjunto simulado de dados mistos, sobre consumo de cafes.

Usage

data(DataMix)

Format

Conjunto de dados com 10 linhas e 7 colunas. Sendo 10 observacoes descritas por 7 variaveis: Cooperativas/Degustadores, Medias das notas dadas aos cafes analisados, Anos de trabalho como degustador, Degustador com formacao tecnica, Degustador com dedicacao exclusiva, Frequencia media dos cafes classificados como especiais, Frequencia media dos cafes classificados como comercias.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

Examples

data(DataMix)
DataMix

Conjunto de dados qualitativos.

Description

Conjunto simulado de dados qualitativos, sobre consumo de cafes.

Usage

data(DataQuali)

Format

Conjunto simulado de dados com 12 linhas e 6 colunas. Sendo 12 observacoes descritas por 6 variaveis: Sexo, Idade, Fumante, Estado Civil, Esportista, Estuda.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

Examples

data(DataQuali)
DataQuali

Conjunto de dados quantitativos.

Description

Conjunto simulado de dados quantitativos, sobre notas dadas a algumas caracteristas sensoriais dos cafes.

Usage

data(DataQuan)

Format

Conjunto de dados com 6 linhas e 11 colunas. Sendo 6 observacoes descritas por 11 variaveis: Cafes, Achocolatado, Acaramelado, Maduro, Doce, Delicado, Amendoado, Acaramelado, Achocolatado, Picante, Acaramelado.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

Examples

data(DataQuan)
DataQuan

Analise fatorial (FA).

Description

Realiza analise fatorial (FA) em um conjunto de dados.

Usage

FA(data, method = "PC", type = 2, nfactor = 1, rotation = "None",
   scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, 
   testfit = TRUE)

Arguments

data

Dados a serem analisados.

method

Metodo de analise:
"PC" - Componentes Principais (default),
"PF" - Fator Principal,
"ML" - Maxima Verossimilhanca.

type

1 para analise utilizando a matriz de covariancia,
2 para analise utilizando a matriz de correlacao (default).

rotation

Tipo de rotacao: "None" (default), "Varimax" e "Promax".

nfactor

Numero de fatores (default = 1).

scoresobs

Tipo de scores para as observacoes: "Bartlett" (default) ou "Regression".

converg

Valor limite para convergencia para soma do quadrado dos residuos para metodo de Maxima Verossimilhanca (default = 1e-5).

iteracao

Numero maximo de iteracoes para metodo de Maxima Verossimilhanca (default = 1000).

testfit

Testa o ajuste do modelo para o metodo de Maxima Verossimilhanca (default = TRUE).

Value

mtxMC

Matriz de Correlacao/Covariancia.

mtxAutvlr

Matriz de autovalores.

mtxAutvec

Matriz de autovetores.

mtxvar

Matriz de variancias e proporcoes.

mtxcarga

Matriz de cargas fatoriais.

mtxvaresp

Matriz das variancias especificas.

mtxcomuna

Matriz das comunalidades.

mtxresidue

Matriz dos residuos.

vlrsqrs

Valor limite superior para a soma dos quadrados dos residuos.

vlrsqr

Soma dos quadrados dos residuos.

mtxresult

Matriz com todos os resultados associados.

mtxscores

Matriz com os escores das observacoes.

coefscores

Matriz com os escores dos coeficientes dos fatores.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Kaiser, H. F.The varimax criterion for analytic rotation in factor analysis. Psychometrika 23, 187-200, 1958.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

See Also

Plot.FA

Examples

data(DataQuan) # conjunto de dados

data <- DataQuan[,2:ncol(DataQuan)]

rownames(data) <- DataQuan[,1]

res <- FA(data = data, method = "PC", type = 2, nfactor = 3, rotation = "None",
          scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, 
          testfit = TRUE) 

print("Matriz com todos os resultados associados:"); round(res$mtxresult,3)

print("Soma dos Quadrados dos Residuos:"); round(res$vlrsqr,3)

print("Matriz das Cargas Fatoriais:"); round(res$mtxcarga,3)

print("Matriz com os escores das observacoes:"); round(res$mtxscores,3)

print("Matriz com os escores dos coeficientes dos fatores:"); round(res$coefscores,3)

Tecnica de animacao Grand Tour.

Description

Realiza a exploracao dos dados atraves da tecnica de animacao Grand Tour.

Usage

GrandTour(data, method = "Interpolation", title = NA, xlabel = NA, 
          ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, 
          class = NA, classcolor = NA, posleg = 2, boxleg = TRUE,  
          axesvar = TRUE, axes = TRUE, numrot = 200, choicerot = NA, 
          savptc = FALSE, width = 3236, height = 2000, res = 300)

Arguments

data

Conjunto de dados numericos.

method

Metodo usado para as rotacoes:
"Interpolation" - Metodo Interpolation (default),
"Torus" - Metodo Torus,
"Pseudo" - Metodo Pseudo Grand Tour.

title

Titulo para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

axesvar

Coloca eixos de rotacao das variaveis (default = TRUE).

axes

Plota os eixos X e Y (default = TRUE).

numrot

Numero de rotacoes (default = 200). Se method = "Interpolation", numrot representara o angulo de rotacao.

choicerot

Escolhe rotacao especifica e apresenta na tela, ou salva a imagem se savptc = TRUE.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

Value

Graficos com as rotacoes.

proj.data

Dados projetados.

vector.opt

Vetor projecao.

method

Metodo usado no Grand Tour.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.

Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.

Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.

Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational methods for High-Dimensional Rotations in data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.

Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.

Martinez, W. L.; Martinez, A. R.; Solka, J.; Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.

Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.

Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.

Examples

data(iris) # conjunto de dados

res <- GrandTour(iris[,1:4], method = "Torus", title = NA, xlabel = NA, ylabel = NA,
                 color = TRUE, linlab = NA, class = NA, posleg = 2, boxleg = TRUE, 
                 axesvar = TRUE, axes = FALSE, numrot = 10, choicerot = NA,
                 savptc = FALSE, width = 3236, height = 2000, res = 300)

print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Metodo da projecao Grand Tour:"); res$method

          
res <- GrandTour(iris[,1:4], method = "Interpolation", title = NA, xlabel = NA, ylabel = NA,
                 color = TRUE, linlab = NA, posleg = 2, boxleg = FALSE, axesvar = FALSE, 
                 axes = FALSE, numrot = 10, choicerot = NA, class = iris[,5],
                 classcolor = c("goldenrod3","gray53","red"), savptc = FALSE, 
                 width = 3236, height = 2000, res = 300)
         
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Metodo da projecao Grand Tour:"); res$method

Decomposicao de valor singular generalizada (GSVD).

Description

Dada a matriz AA de ordem nxmnxm, a decomposicao de valor singular generalizada (GSVD), envolve a utilizacao de dois conjuntos de matrizes quadradas positivas de ordem nxnnxn e mxmmxm, respectivamente. Estas duas matrizes expressam restricoes impostas, respectivamente, nas linhas e colunas de AA.

Usage

GSVD(data, plin = NULL, pcol = NULL)

Arguments

data

Matriz usada para a decomposicao.

plin

Peso para as linhas.

pcol

Peso para as colunas.

Details

Se nao for utilizado plin ou pcol, sera calculada como a decomposicao em valor singular usual.

Value

d

Autovalores, isto e, vector linha com os valores singulares da decomposicao.

u

Autovetores referentes as linhas.

v

Autovetores referentes as colunas.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.

Examples

data <- matrix(c(1,2,3,4,5,6,7,8,9,10,11,12), nrow = 4, ncol = 3)

svd(data)  # decomposicao de valor singular usual

GSVD(data) # GSVD com os mesmos resultados anteriores

# GSVD com pesos para linhas e colunas
GSVD(data, plin = c(0.1,0.5,2,1.5), pcol = c(1.3,2,0.8))

Matriz indicadora.

Description

Na matriz indicadora os elementos estao dispostos na forma de variaveis dummy, em outras palavras, 1 para uma categoria escolhida como variavel resposta e 0 para as outras categorias de uma mesma variavel.

Usage

IM(data, names = TRUE)

Arguments

data

Dados categoricos.

names

Inclui os nomes das variaveis nos niveis da Matriz Indicadora (default = TRUE).

Value

mtxIndc

Retorna dados convertidos em matriz indicadora.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Examples

data <- matrix(c("S","S","N","N",1,2,3,4,"N","S","T","N"), nrow = 4, ncol = 3)

IM(data, names = FALSE) 

data(DataQuali) # conjunto de dados qualitativos

IM(DataQuali, names = TRUE)

Funcao para melhor posicao dos rotulos nos graficos.

Description

Funcao para melhor posicao dos rotulos nos graficos.

Usage

LocLab(x, y = NULL, labels = seq(along = x), cex = 1,
       method = c("SANN", "GA"), allowSmallOverlap = FALSE,
       trace = FALSE, shadotext = FALSE, 
       doPlot = TRUE, ...)

Arguments

x

Coordenada x

y

Coordenada y

labels

Os rotulos

cex

cex

method

Nao usado

allowSmallOverlap

Booleana

trace

Booleana

shadotext

Booleana

doPlot

Booleana

...

Outros argumentos passados para ou a partir de outros metodos

Value

Veja o texto da funcao.


Escalonamento multidimensional (MDS).

Description

Realiza o escalonamento multidimensional (MDS) em um conjunto de dados.

Usage

MDS(data, distance = "euclidean", title = NA, xlabel = NA,  
    ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, 
    size = 1.1, grid = TRUE, color = TRUE, linlab = NA, 
    class = NA, classcolor = NA, savptc = FALSE, width = 3236, 
    height = 2000, res = 300)

Arguments

data

Dados a serem analizados.

distance

Metrica das distancias: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski".

title

Titulo do grafico, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

axes

Coloca eixos nos graficos (default = TRUE).

size

Tamanho dos pontos no grafico .

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

Value

Grafico de escalonamento multidimensional.

mtxD

Matriz das distancias.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Examples

data(iris) # conjunto de dados

data <- iris[,1:4]

cls <- iris[,5] # classe dos dados

md <- MDS(data = data, distance = "euclidean", title = NA, xlabel = NA,  
          ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, color = TRUE,  
          linlab = NA, class = cls, classcolor = c("goldenrod3","gray53","red"),
          savptc = FALSE, width = 3236, height = 2000, res = 300)

print("Matriz das distancias:"); md$mtxD

Analise de multiplos fatores (MFA).

Description

Realiza analise de multiplos fatores (MFA) em grupos de variaveis. Os grupos de variaveis podem ser dados quantitativos, qualitativos, de frequencia (MFACT), ou dados mistos.

Usage

MFA(data, groups, typegroups = rep("n", length(groups)), namegroups = NULL)

Arguments

data

Dados a serem analisados.

groups

Numero de colunas para cada grupo em ordem seguindo a ordem dos dados em 'data'.

typegroups

Tipo de grupo:
"n" para dados numericos (default),
"c" para dados categoricos,
"f" para dados de frequencia.

namegroups

Nomes para cada grupo.

Value

vtrG

Vetor com os tamanhos de cada grupo.

vtrNG

Vetor com os nomes de cada grupo.

vtrplin

Vetor com os valores usados para balancear as linhas da matriz Z.

vtrpcol

Vetor com os valores usados para balancear as colunas da matriz Z.

mtxZ

Matriz concatenada e balanceada.

mtxA

Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas.

mtxU

Matriz U da decomposicao singular da matriz Z.

mtxV

Matriz V da decomposicao singular da matriz Z.

mtxF

Matriz global dos escores dos fatores onde as linhas sao as observacoes e as colunas os componentes.

mtxEFG

Matriz dos escores dos fatores por grupo.

mtxCCP

Matriz de correlacao dos componentes principais com as variaveis originais.

mtxEV

Matriz das inercias parciais/escores das variaveis.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Abdessemed, L.; Escofier, B. Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996..

Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.

Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.

Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.

Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.

Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004

Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.

Bezecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.

Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.

Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.

Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.

Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.

Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.

Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994

Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.

Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.

Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.

Pages, J.. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.

See Also

Plot.MFA

Examples

data(DataMix) # conjunto de dados mistos

data <- DataMix[,2:ncol(DataMix)] 

rownames(data) <- DataMix[1:nrow(DataMix),1]

group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes")

mf <- MFA(data = data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA

print("Variancias dos Componentes Principais:"); round(mf$mtxA,2)

print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)

Normaliza os dados.

Description

Funcao que normaliza os dados globalmente, ou por coluna.

Usage

NormData(data, type = 1)

Arguments

data

Dados a serem normalizados.

type

1 normaliza global (default),
2 normaliza por coluna.

Value

dataNorm

Dados normalizados.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

Examples

data(DataQuan) # conjunto de dados quantitativos

data <- DataQuan[,2:8]

res <- NormData(data, type = 1) # normaliza os dados globalmente

res # dados normalizados globalmente

sd(res)   # desvio padrao global

mean(res) # media global


res <- NormData(data, type = 2) # normaliza os dados por coluna

res # dados normalizados por coluna

apply(res, 2, sd) # desvio padrao por coluna

colMeans(res)     # medias das colunas

Teste de normalidade dos dados.

Description

Verificar a normalidade dos dados, baseado no teste de coeficiente de assimetria.

Usage

NormTest(data, sign = 0.05)

Arguments

data

Dados a serem analisados.

sign

Grau de significancia do teste (default 5%).

Value

statistic

Valor Chi-quadrado observado, ou seja, a estatistica do teste.

chisquare

Valor Chi-quadrado calculado.

gl

Grau de liberdade.

p.value

Valor p.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Rencher, A. C. Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Examples

data <- cbind(rnorm(100,2,3), rnorm(100,1,2))

NormTest(data)

plot(density(data))


data <- cbind(rexp(200,3), rexp(200,3))

NormTest(data, sign = 0.01)

plot(density(data))

Analise de componentes principais (PCA).

Description

Realiza analise de componentes principais (PCA) em um conjunto de dados.

Usage

PCA(data, type = 1)

Arguments

data

Dados a serem analizados.

type

1 para analise utilizando a matriz de covariancia (default),
2 para analise utilizando a matriz de correlacao.

Value

mtxC

Matriz de covariancia ou de correlacao conforme "type".

mtxAutvlr

Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas.

mtxAutvec

Matriz de autovetores - componentes principais.

mtxVCP

Matriz da covariancia dos componentes principais com as variaveis originais.

mtxCCP

Matriz da correlacao dos componentes principais com as variaveis originais.

mtxscores

Matriz com os escores dos componentes principais.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.

Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.

Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.. 708 p.

See Also

Plot.PCA

Examples

data(DataQuan) # conjunto de dados quantitativos

data <- DataQuan[,2:8]

rownames(data) <- DataQuan[1:nrow(DataQuan),1]

pc <- PCA(data = data, 2) # executa o PCA

print("Matriz de Covariancia/Correlacao:"); round(pc$mtxC,2)

print("Componentes Principais:"); round(pc$mtxAutvec,2)

print("Variancias dos Componentes Principais:"); round(pc$mtxAutvlr,2)

print("Covariancia dos Componentes Principais:"); round(pc$mtxVCP,2)

print("Correlacao dos Componentes Principais:"); round(pc$mtxCCP,2)

print("Escores dos Componentes Principais:"); round(pc$mtxscores,2)

Graficos da analise de correspondencia (CA) simples e multipla.

Description

Graficos da analise de correspondencia (CA) simples e multipla.

Usage

Plot.CA(CA, titles = NA, xlabel = NA, ylabel = NA,
        size = 1.1, grid = TRUE, color = TRUE, linlab = NA, 
        savptc = FALSE, width = 3236, height = 2000, 
        res = 300, casc = TRUE)

Arguments

CA

Dados da funcao CA.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucaoo nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

CA

Examples

data(DataFreq) # conjunto de dados de frequencia

data <- DataFreq[,2:ncol(DataFreq)]

rownames(data) <- DataFreq[1:nrow(DataFreq),1]

res <- CA(data, "f") # realiza CA

tit <- c("Scree-plot","Observacoes", "Variaveis", "Observacoes/Variaveis")

Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA,
        color = TRUE, linlab = rownames(data), savptc = FALSE,
        width = 3236, height = 2000, res = 300, casc = FALSE)


data(DataQuali) # conjunto de dados qualitativos

data <- DataQuali[,2:ncol(DataQuali)]

res <- CA(data, "c", "b") # realiza CA

tit <- c("","","Grafico das Variaveis")

Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA,
        color = TRUE, linlab = NA, savptc = FALSE, 
        width = 3236, height = 2000, res = 300,
        casc = FALSE)

Graficos da analise de correlacao canonica (CCA).

Description

Graficos da analise de correlacao canonica (CCA).

Usage

Plot.CCA(CCA, titles = NA, xlabel = NA, ylabel = NA,
         size = 1.1, grid = TRUE, color = TRUE, savptc = FALSE, 
         width = 3236, height = 2000, res = 300, casc = TRUE)

Arguments

CCA

Dados da funcao CCA.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

CCA

Examples

data(DataMix) # conjunto de dados

data <- DataMix[,2:ncol(DataMix)]

rownames(data) <- DataMix[,1]

X <- data[,1:2]

Y <- data[,5:6]

res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) # Analise de correlacao canonica

tit <- c("Scree-plot","Correlacoes","Scores do grupo X","Scores do grupo Y")

Plot.CCA(res, titles = tit, xlabel = NA, ylabel = NA,
         color = TRUE, savptc = FALSE, width = 3236, 
         height = 2000, res = 300, casc = TRUE)

Grafico das correlacoes entre as variaveis.

Description

Realiza as correlacoes entre as variaveis de uma base de dados e apresenta em forma de grafico.

Usage

Plot.Cor(data, title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, 
         text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA,
         savptc = FALSE, width = 3236, height = 2000, res = 300)

Arguments

data

Conjunto de dados numericos.

title

Titulo para o grafico, se nao for definido assume texto padrao.

grid

Coloca grade no grafico (default = TRUE).

leg

Coloca a legenda no grafico (default = TRUE)

boxleg

Coloca moldura na legenda (default = FALSE).

text

Coloca os valores das correlacoes nos circulos (default = FALSE).

arrow

Setas das correlacoes positivas (para cima) e negativas (para baixo) (default = TRUE).

color

Graficos coloridos (default = TRUE).

namesvar

Vetor com os nomes das variaveis, se omitido assume os nomes em 'data'.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

Value

Grafico com as correlacoes entre as variaveis em 'data'

Author(s)

Paulo Cesar Ossani

Examples

data(iris) # conjunto de dados

Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, 
         text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE, 
         width = 3236, height = 2000, res = 300)
         
Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, 
         text = TRUE, arrow = TRUE, color = TRUE, namesvar = c("A1","B2","C3","D4"),
         savptc = FALSE, width = 3236, height = 2000, res = 300)

Graficos da analise fatorial (FA).

Description

Graficos da analise fatorial (FA).

Usage

Plot.FA(FA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, 
        grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, 
        classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE,
        width = 3236, height = 2000, res = 300, casc = TRUE)

Arguments

FA

Dados da funcao FA.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

axes

Plota os eixos X e Y (default = TRUE).

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

FA

Examples

data(iris) # conjunto de dados

data <- iris[,1:4]

cls <- iris[,5] # classe dos dados

res <- FA(data, method = "PC", type = 2, nfactor = 3)

tit <- c("Scree-plot","Scores das observacoes","Cargas Fatoriais","Biplot")

cls <- as.character(iris[,5])

Plot.FA(FA = res, titles = tit, xlabel = NA, ylabel = NA,
        color = TRUE, linlab = NA, savptc = FALSE, size = 1.1,
        posleg = 1, boxleg = FALSE, class = cls, axes = TRUE,
        classcolor = c("blue3","red","goldenrod3"),
        width = 3236, height = 2000, res = 300, casc = FALSE)

Graficos da analise de multiplos fatores (MFA).

Description

Graficos da analise de multiplos fatores (MFA).

Usage

Plot.MFA(MFA, titles = NA, xlabel = NA, ylabel = NA,
         posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE, 
         color = TRUE, groupscolor = NA, namarr = FALSE, 
         linlab = NA, savptc = FALSE, width = 3236, 
         height = 2000, res = 300, casc = TRUE)

Arguments

MFA

Dados da funcao MFA.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

posleg

1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

groupscolor

Vetor com as cores dos grupos.

namarr

Coloca nomes nos pontos na nuvem ao redor do centroide no grafico correspondente a analise global dos individuos e variaveis (default = FALSE).

linlab

Vetor com os rotulos para as observacoes, se nao for definido assume texto padrao.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

MFA

Examples

data(DataMix) # conjunto de dados mistos

data <- DataMix[,2:ncol(DataMix)] 

rownames(data) <- DataMix[1:nrow(DataMix),1]

group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes")
           
mf <- MFA(data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA

tit <- c("Scree-plot","Observacoes","Observacoes/Variaveis",
        "Circulo de Correlacoes","Inercias dos Grupos Variaveis")

Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA,
         posleg = 2, boxleg = FALSE, color = TRUE, 
         groupscolor = c("blue3","red","goldenrod3"), 
         namarr = FALSE, linlab = NA, savptc = FALSE,
         width = 3236, height = 2000, res = 300, 
         casc = FALSE) # Plota varios graficos da tela

Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA,
         posleg = 2, boxleg = FALSE, color = TRUE, 
         namarr = FALSE, linlab = rep("A?",10), 
         savptc = FALSE, width = 3236, height = 2000, 
         res = 300, casc = FALSE) # Plota varios graficos da tela

Graficos da analise de componentes principais (PCA).

Description

Graficos da analise de componentes principais (PCA).

Usage

Plot.PCA(PC, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, 
         grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, 
         classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE,
         width = 3236, height = 2000, res = 300, casc = TRUE)

Arguments

PC

Dados da funcao PCA.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

axes

Plota os eixos X e Y (default = TRUE).

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

PCA

Examples

data(iris) # conjunto de dados

data <- iris[,1:4]

cls <- iris[,5] # classe dos dados

pc <- PCA(data, 2) # executa o PCA

tit <- c("Scree-plot","Grafico das Observacoes","Circulo de Correlacoes")

cls <- as.character(iris[,5])

Plot.PCA(PC = pc, titles = tit, xlabel = NA, ylabel = NA,
         color = TRUE, linlab = NA, savptc = FALSE, size = 1.1,
         posleg = 2, boxleg = FALSE, class = cls, axes = TRUE,
         classcolor = c("blue3","red","goldenrod3"),
         width = 3236, height = 2000, res = 300, casc = FALSE)

Graficos da projection pursuit (PP).

Description

Graficos da projection pursuit (PP).

Usage

Plot.PP(PP, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE,
        size = 1.1, grid = TRUE, color = TRUE, classcolor = NA, linlab = NA, 
        axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, 
        res = 300, casc = TRUE)

Arguments

PP

Dados da funcao PP_Optimizer.

titles

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

classcolor

Vetor com as cores das classes.

linlab

Vetor com os rotulos para as observacoes.

axesvar

Coloca eixos de rotacao das variaveis, somente quando dimproj > 1 (default = TRUE).

axes

Plota os eixos X e Y (default = TRUE).

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Grafico da evolucao dos indices, e graficos cujos dados foram reduzidos em duas dimensoes.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

See Also

PP_Optimizer and PP_Index

Examples

data(iris) # conjunto de dados

# Exemplo 1 - Sem as classes nos dados
data <- iris[,1:4]

findex <- "kurtosismax" # funcao indice

dim <- 1 # dimensao da projecao dos dados

sphere <- TRUE # dados esfericos

res <- PP_Optimizer(data = data, class = NA, findex = findex,
                    optmethod = "GTSA", dimproj = dim, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 500, half = 30)

Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE,
        linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, 
        width = 3236, height = 2000, res = 300, casc = FALSE)


# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados

res <- PP_Optimizer(data = data, class = class, findex = findex,
                    optmethod = "GTSA", dimproj = dim, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 500, half = 30)

tit <- c(NA,"Exemplo de grafico") # titulos para os graficos

Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE, 
        classcolor = c("blue3","red","goldenrod3"), linlab = NA, 
        axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, 
        height = 2000, res = 300, casc = FALSE)


# Exemplo 3 - Sem as classes nos dados, mas informando 
#             as classes na funcao plot
res <- PP_Optimizer(data = data, class = NA, findex = "Moment",
                    optmethod = "GTSA", dimproj = 2, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 500, half = 30)

lin <- c(rep("a",50),rep("b",50),rep("c",50)) # classe dos dados

Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE,
        linlab = lin, axesvar = TRUE, axes = TRUE, savptc = FALSE, 
        width = 3236, height = 2000, res = 300, casc = FALSE)


# Exemplo 4 - Com as classes nos dados, mas nao informada na funcao plot
class <- iris[,5] # classe dos dados

dim <- 2 # dimensao da projecao dos dados

findex <- "lda" # funcao indice

res <- PP_Optimizer(data = data, class = class, findex = findex,
                    optmethod = "GTSA", dimproj = dim, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 500, half = 30)

tit <- c("",NA) # titulos para os graficos

Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE,
        linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, 
        width = 3236, height = 2000, res = 300, casc = FALSE)

Graficos dos resultados da regressao linear.

Description

Graficos dos resultados da regressao linear.

Usage

Plot.Regr(Reg, typegraf = "Scatterplot", title = NA, xlabel = NA, 
          ylabel = NA, namevary = NA, namevarx = NA, size = 1.1, 
          grid = TRUE, color = TRUE, intconf = TRUE, intprev = TRUE, 
          savptc = FALSE, width = 3236, height = 2000, res = 300,
          casc = TRUE)

Arguments

Reg

Dados da funcao de regressao.

typegraf

Tipo de grafico:
"Scatterplot" - Grafico de dispersao 2 a 2,
"Regression" - Grafico da regressao linear,
"QQPlot" - Grafico de probabilidade normal dos residuos,
"Histogram" - Histograma dos residuos,
"Fits" - Grafico dos valores ajustados versus os residuos,
"Order" - Grafico da ordem das observacoes versus os residuos.

title

Titulos para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

namevary

Nome da variavel Y, se nao for definido assume texto padrao.

namevarx

Nome da variavel X, ou variaveis X, se nao for definido assume texto padrao.

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

intconf

Caso typegraf = "Regression". Graficos com intervalo de confianca (default = TRUE).

intprev

Caso typegraf = "Regression". Graficos com intervalo de previsao (default = TRUE)

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

casc

Efeito cascata na apresentacao dos graficos (default = TRUE).

Value

Retorna varios graficos.

Author(s)

Paulo Cesar Ossani

See Also

Regr

Examples

data(DataMix)

Y <- DataMix[,2]

X <- DataMix[,7]

name.y <- "Media das notas"

name.x <- "Cafes comerciais"

res <- Regr(Y, X, namevarx = name.x ,intercept = TRUE, sigf = 0.05)

tit <- c("Scatterplot")
Plot.Regr(res, typegraf = "Scatterplot", title = tit,
          namevary = name.y, namevarx = name.x, color = TRUE, 
          savptc = FALSE, width = 3236, height = 2000, res = 300)

tit <- c("Grafico de Dispersao com a \n reta ajustada")
Plot.Regr(res, typegraf = "Regression", title = tit, 
          xlabel = name.x, ylabel = name.y, color = TRUE,
          intconf = TRUE, intprev = TRUE, savptc = FALSE, 
          width = 3236, height = 2000, res = 300)

dev.new() # necessario para nao sobrepor os graficos seguintes ao grafico anterior

par(mfrow = c(2,2)) 

Plot.Regr(res, typegraf = "QQPlot", casc = FALSE)
Plot.Regr(res, typegraf = "Histogram", casc = FALSE)
Plot.Regr(res, typegraf = "Fits", casc = FALSE)
Plot.Regr(res, typegraf = "Order", casc = FALSE)

Funcao para encontrar os indices da projection pursuit (PP).

Description

Funcao usada para encontrar os indices da projection pursuit (PP).

Usage

PP_Index(data, class = NA, vector.proj = NA, 
         findex = "HOLES", dimproj = 2, weight = TRUE, 
         lambda = 0.1, r = 1, ck = NA)

Arguments

data

Conjunto de dados numericos sem a informacao das classes.

class

Vetor com os nomes das classes dos dados.

vector.proj

Vetor projecao.

findex

Funcao indice de projecao a ser usada:
"lda" - Indice LDA,
"pda" - Indice PDA,
"lr" - Indice Lr,
"holes" - Indice holes (default),
"cm" - Indice massa central,
"pca" - Indice PCA,
"friedmantukey" - Indice Friedman Tukey,
"entropy" - Indice entropia,
"legendre" - Indice Legendre,
"laguerrefourier" - Indice Laguerre Fourier,
"hermite" - Indice Hermite,
"naturalhermite" - Indice Hermite natural,
"kurtosismax" - Indice curtose maxima,
"kurtosismin" - Indice curtose minima,
"moment" - Indice momento,
"mf" - Indice MF,
"chi" - Indice qui-quadrado.

dimproj

Dimensao da projecao dos dados (default = 2).

weight

Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE).

lambda

Usado no indice PDA (default = 0.1).

r

Usado no indice Lr (default = 1).

ck

Uso interno da funcao indice CHI.

Value

num.class

Numero de classes.

class.names

Nomes das classes.

findex

Funcao indice de projecao usada.

vector.proj

Vetores de projecao encontrados.

index

Indice de projecao encontrado no processo.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Ossani, P. C.; Figueira, M. R.; Cirillo, M. A. Proposition of a new index for projection pursuit in the multiple factor analysis. Computational and Mathematical Methods, v. 1, p. 1-18, 2020.

Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.

Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.

Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for data Analysis: With R and GGobi. Springer. 2007.

Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.

Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.

Hastie, T., Buja, A., Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.

Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.

Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.

Lee, E. K.; Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.

Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.

Martinez, W. L., Martinez, A. R.; Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.

Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.

Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.

Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and data Analysis, 29:669-687, 1995a.

Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b.

See Also

PP_Optimizer and Plot.PP

Examples

data(iris) # conjunto de dados

data <- iris[,1:4]

# Exemplo 1 - Sem as classes nos dados
ind <- PP_Index(data = data, class = NA, vector.proj = NA, 
                findex = "moment", dimproj = 2, weight = TRUE, 
                lambda = 0.1, r = 1)

print("Numero de classes:"); ind$num.class
print("Nomes das classes:"); ind$class.names
print("Funcao indice de projecao:"); ind$findex
print("Vetores de projecao:"); ind$vector.proj  
print("Indice de projecao:"); ind$index


# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados

findex <- "pda" # funcao indice

sphere <- TRUE # Dados esfericos

res <- PP_Optimizer(data = data, class = class, findex = findex,
                    optmethod = "SA", dimproj = 2, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 1000, half = 30)

# Comparando o resultado obtido
if (match(toupper(findex),c("LDA", "PDA", "LR"), nomatch = 0) > 0) {
  if (sphere) {
     data <- apply(predict(prcomp(data)), 2, scale) # dados esfericos
  }
} else data <- as.matrix(res$proj.data[,1:Dim])

ind <- PP_Index(data = data, class = class, vector.proj = res$vector.opt, 
                findex = findex, dimproj = 2, weight = TRUE, lambda = 0.1,
                r = 1)

print("Numero de classes:"); ind$num.class
print("Nomes das classes:"); ind$class.names
print("Funcao indice de projecao:"); ind$findex
print("Vetores de projecao:"); ind$vector.proj  
print("Indice de projecao:"); ind$index
print("Indice de projecao otimizado:"); res$index[length(res$index)]

Funcao de otimizacao dos indices da projection pursuit (busca de projecao).

Description

Funcao de otimizacao dos indices da projection pursuit (busca de projecao).

Usage

PP_Optimizer(data, class = NA, findex = "HOLES",   
             dimproj = 2, sphere = TRUE, optmethod = "GTSA",   
             weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9,  
             eps = 1e-3, maxiter = 3000, half = 30)

Arguments

data

Conjunto de dados numericos sem a informacao das classes.

class

Vetor com os nomes das classes dos dados.

findex

Funcao indice de projecao a ser usada:
"lda" - Indice LDA,
"pda" - Indice PDA,
"lr" - Indice Lr,
"holes" - Indice holes (default),
"cm" - Indice massa central,
"pca" - Indice PCA,
"friedmantukey" - Indice Friedman Tukey,
"entropy" - Indice entropia,
"legendre" - Indice Legendre,
"laguerrefourier" - Indice Laguerre Fourier,
"hermite" - Indice Hermite,
"naturalhermite" - Indice Hermite natural,
"kurtosismax" - Indice curtose maxima,
"kurtosismin" - Indice curtose minima,
"moment" - Indice momento,
"mf" - Indice MF,
"chi" - Indice qui-quadrado.

dimproj

Dimensao para a projecao dos dados (default = 2).

sphere

Dados esfericos (default = TRUE).

optmethod

Metodo de otimizacao GTSA - Grand Tour Simulated Annealing ou SA - Simulated Annealing (default = "GTSA").

weight

Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE).

lambda

Usado no indice PDA (default = 0.1).

r

Usado no indice Lr (default = 1).

cooling

Taxa de arrefecimento (default = 0.9).

eps

Precisao de aproximacao para cooling (default = 1e-3).

maxiter

Numero maximo de iteracoes do algoritmo (default = 3000).

half

Numero de etapas sem incrementar o indice, para em seguida diminuir o valor do cooling (default = 30).

Value

num.class

Numero de classes.

class.names

Nomes das classes.

proj.data

Dados projetados.

vector.opt

Vetores de projecao encontrados.

index

Vetor com os indices de projecao encontrados no processo, convergindo para o maximo, ou o minimo.

findex

Funcao indice de projecao usada.

Author(s)

Paulo Cesar Ossani

Marcelo Angelo Cirillo

References

Cook, D.; Lee, E. K.; Buja, A.; Wickmam, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.

Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.

See Also

Plot.PP and PP_Index

Examples

data(iris) # conjunto de dados

# Exemplo 1 - Sem as classes nos dados
data <- iris[,1:4]

class <- NA # classe dos dados

findex <- "kurtosismax" # funcao indice

dim <- 1 # dimensao da projecao dos dados

sphere <- TRUE # Dados esfericos

res <- PP_Optimizer(data = data, class = class, findex = findex,
                    optmethod = "GTSA", dimproj = dim, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 1000, half = 30)
 
print("Numero de classes:"); res$num.class
print("Nomes das classes:"); res$class.names
print("Funcao indice de projecao:"); res$findex
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Indices de projecao:"); res$index


# Exemplo 2 - Com as classes nos dados
class <- iris[,5] # classe dos dados

res <- PP_Optimizer(data = data, class = class, findex = findex,
                    optmethod = "GTSA", dimproj = dim, sphere = sphere, 
                    weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, 
                    eps = 1e-3, maxiter = 1000, half = 30)

print("Numero de classes:"); res$num.class
print("Nomes das classes:"); res$class.names
print("Funcao indice de projecao:"); res$findex
print("Dados projetados:"); res$proj.data
print("Vetores de projecao:"); res$vector.opt
print("Indices de projecao:"); res$index

Regressao linear.

Description

Realiza a regressao linear em um conjunto de dados.

Usage

Regr(Y, X, namevarx = NA, intercept = TRUE, sigf = 0.05)

Arguments

Y

Variaveis respotas.

X

Variaveis regressoras.

namevarx

Nome da variavel, ou variaveis X, se nao for definido assume texto padrao.

intercept

Considerar o intercepto na regressao (default = TRUE).

sigf

Nivel de significancia dos testes dos residuos (default = 5%).

Value

Betas

Coeficientes da regressao.

CovBetas

Matriz de covariancias dos coeficientes da regressao.

ICc

Intervalo de confianca dos coeficientes da regressao.

hip.test

Teste de hipoteses dos coeficientes da regressao.

ANOVA

Analise de variancia da regressao.

R

Coeficiente de determinacao.

Rc

Coeficiente de determinacao corrigido.

Ra

Coeficiente de determinacao ajustado.

QME

Variancia dos residuos.

ICQME

Intervalo de confianca da variancia dos residuos.

prev

Previsao do ajuste da regressao.

IPp

Intervalo das previsoes.

ICp

Intervalo de confianca das previsoes.

error

Residuos do ajuste da regressao.

error.test

Retorna a 5% de significancia o teste de independencia, de normalidade e de homogeneidade da variancia dos residuos.

Author(s)

Paulo Cesar Ossani

References

Charnet, R.; at al.. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.

Rencher, A. C.; Schaalje, G. B. Linear models in statisctic. 2th. ed. New Jersey: John & Sons, 2008. 672 p.

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

See Also

Plot.Regr

Examples

data(DataMix)

Y <- DataMix[,2]

X <- DataMix[,6:7]

name.x <- c("Cafes Expeciais","Cafes Comerciais")

res <- Regr(Y, X, namevarx = name.x , intercept = TRUE, sigf = 0.05)

print("Coeficientes da Regressao:"); round(res$Betas,4)
print("Analise de Variancia:"); res$ANOVA
print("Teste de Hipoteses dos Coeficientes da Regressao:"); round(res$hip.test,4)
print("Coeficiente de Determinacao:"); round(res$R,4)
print("Coeficiente de Determinacao Corrigido:"); round(res$Rc,4) 
print("Coeficiente de Determinacao Ajustado:"); round(res$Ra,4)
print("Testes dos Residuos:"); res$error.test

Grafico de dispersao.

Description

Realiza o grafico de dispersao.

Usage

Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE,  
        title = NA, xlabel = NA, ylabel = NA,  posleg = 2, boxleg = TRUE, 
        axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA,   
        class = NA, classcolor = NA, savptc = FALSE, width = 3236, 
        height = 2000, res = 300)

Arguments

data

Dados com as coordenadas x e y.

ellipse

Coloca uma elipse envolta das classes (default = TRUE).

ellipse.level

Nivel de significancia da elipse (defaul = 0.95).

rectangle

Coloca retangulo para diferenciar as classes (default = FALSE).

title

Titulo para os graficos, se nao for definido assume texto padrao.

xlabel

Nomeia o eixo X, se nao for definido assume texto padrao.

ylabel

Nomeia o eixo Y, se nao for definido assume texto padrao.

posleg

0 sem legenda,
1 para legenda no canto superior esquerdo,
2 para legenda no canto superior direito (default),
3 para legenda no canto inferior direito,
4 para legenda no canto inferior esquerdo.

boxleg

Coloca moldura na legenda (default = TRUE).

axes

Plota os eixos X e Y (default = TRUE).

size

Tamanho dos pontos no grafico.

grid

Coloca grade nos graficos (default = TRUE).

color

Graficos coloridos (default = TRUE).

linlab

Vetor com os rotulos para as observacoes.

class

Vetor com os nomes das classes dos dados.

classcolor

Vetor com as cores das classes.

savptc

Salva as imagens dos graficos em arquivos (default = FALSE).

width

Largura do grafico quanto savptc = TRUE (defaul = 3236).

height

Altura do grafico quanto savptc = TRUE (default = 2000).

res

Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300).

Value

Grafico de dispersao.

Author(s)

Paulo Cesar Ossani

References

Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.

Anton, H.; Rorres, C. Elementary linear algebra: applications version. 10th ed. New Jersey: John Wiley & Sons, 2010. 768 p.

Examples

data(iris) # conjunto de dados

data <- iris[,3:4]

cls <- iris[,5] # classe dos dados

Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE,  
        title = NA, xlabel = NA, ylabel = NA,  posleg = 1, boxleg = FALSE, 
        axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, 
        class = cls, classcolor = c("goldenrod3","blue","red"),
        savptc = FALSE, width = 3236, height = 2000, res = 300)

Scatter(data, ellipse = FALSE, ellipse.level = 0.95, rectangle = TRUE,  
        title = NA, xlabel = NA, ylabel = NA,  posleg = 1, boxleg = TRUE, 
        axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, 
        class = cls, classcolor = c("goldenrod3","blue","red"),
        savptc = FALSE, width = 3236, height = 2000, res = 300)