Title: | Analise multivariada (brazilian portuguese) |
---|---|
Description: | Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada. |
Authors: | Paulo Cesar Ossani [aut, cre]
|
Maintainer: | Paulo Cesar Ossani <[email protected]> |
License: | GPL-3 |
Version: | 2.2.5 |
Built: | 2025-02-21 06:55:17 UTC |
Source: | CRAN |
Analise multivariada, tendo funcoes que executam analise de correspondencia simples (CA) e multipla (MCA), analise de componentes principais (PCA), analise de correlacao canonica (CCA), analise fatorial (FA), escalonamento multidimensional (MDS), analise discriminante linear (LDA) e quadratica (QDA), analise de cluster hierarquico e nao hierarquico, regressao linear simples e multipla, analise de multiplos fatores (MFA) para dados quantitativos, qualitativos, de frequencia (MFACT) e dados mistos, biplot, scatter plot, projection pursuit (PP), grant tour e outras funcoes uteis para a analise multivariada.
Package: | MVar.pt |
Type: | Package |
Version: | 2.2.5 |
Date: | 2024-11-22 |
License: | GPL(>=2) |
LazyLoad: | yes |
Paulo Cesar Ossani e Marcelo Angelo Cirillo.
Maintainer: Paulo Cesar Ossani <[email protected]>
Abdessemed, L.; Escofier, B.; Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996.
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.
Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.
Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.
Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional Data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.
Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual Data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.
Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & Data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004
Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & Data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.
Benzecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.
Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.
Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational Methods for High-Dimensional Rotations in Data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: Data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.
Charnet, R., at al. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.
Cook, D.; Lee, E. K.; Buja, A.; WickmamM, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of Data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.
Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.
Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.
Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for Data Analysis: With R and GGobi. Springer. 2007.
Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.
Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.
Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.
Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.
Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.
Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & Data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994
Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.
Ferreira, D. F. Estatistica multivariada. 2. ed. rev. e ampl. Lavras: UFLA, 2011. 675 p.
Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.
Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.
Hastie, T.; Buja, A.; Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.
Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.
Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.
Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.
Johnson, R. A.; Wichern, D. W. Applied multivariate statistical analysis. 6th ed. New Jersey: Prentice Hall, 2007. 794 p.
Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
Lee, E. K., Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.
Martinez, W. L.; Martinez, A. R. Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.
Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory Data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.
Pages, J. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.
Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.
Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and Data Analysis, 29:669-687, 1995a.
Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b
Rencher, A.C.; Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.
Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.
Realiza o grafico Biplot.
Biplot(data, alpha = 0.5, title = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, var = TRUE, obs = TRUE, linlab = NA, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300)
Biplot(data, alpha = 0.5, title = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, var = TRUE, obs = TRUE, linlab = NA, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300)
data |
Dados para plotagem. |
alpha |
Representatividade dos individuos (alpha), representatividade das variaveis (1 - alpha). Sendo 0.5 o default. |
title |
Titulo para o grafico, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
var |
Acrescenta as projecoes das variaveis ao grafico (default = TRUE). |
obs |
Acrescenta as observacoes ao grafico (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Biplot |
Grafico Biplot. |
Md |
Matriz autovalores. |
Mu |
Matriz U (autovetores). |
Mv |
Matriz V (autovetores). |
coorI |
Coordenadas dos individuos. |
coorV |
Coordenadas das variaveis. |
pvar |
Proporcao dos componentes principais. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(iris) # conjunto de dados data <- iris[,1:4] Biplot(data) cls <- iris[,5] res <- Biplot(data, alpha = 0.6, title = "Biplot dos Dados\n valorizando os individuos", class = cls, classcolor = c("goldenrod3","gray56","red"), posleg = 2, boxleg = FALSE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) print(res$pvar) res <- Biplot(data, alpha = 0.4, title = "Grafico valorizando as variaveis", xlabel = "", ylabel = "", color = FALSE, obs = FALSE, savptc = FALSE, width = 3236, height = 2000, res = 300) print(res$pvar)
data(iris) # conjunto de dados data <- iris[,1:4] Biplot(data) cls <- iris[,5] res <- Biplot(data, alpha = 0.6, title = "Biplot dos Dados\n valorizando os individuos", class = cls, classcolor = c("goldenrod3","gray56","red"), posleg = 2, boxleg = FALSE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) print(res$pvar) res <- Biplot(data, alpha = 0.4, title = "Grafico valorizando as variaveis", xlabel = "", ylabel = "", color = FALSE, obs = FALSE, savptc = FALSE, width = 3236, height = 2000, res = 300) print(res$pvar)
Realiza analise de correspondencia simples (CA) e multipla (MCA) em um conjunto de dados.
CA(data, typdata = "f", typmatrix = "I")
CA(data, typdata = "f", typmatrix = "I")
data |
Dados a serem analisados (tabela de contingencia). |
typdata |
"f" para dados de frequencia (default), |
typmatrix |
Matriz usada para calculos quando typdata = "c". |
depdata |
Verifica se as linhas e colunas sao dependentes, ou independentes pelo teste Qui-quadrado, a nivel 5% de significancia. |
typdata |
Tipo de dados: "F" frequencia ou "C" qualitativo. |
numcood |
Numero de coordenadas principais. |
mtxP |
Matriz da frequencia relativa. |
vtrR |
Vetor com as somas das linhas. |
vtrC |
Vetor com as somas das colunas. |
mtxPR |
Matriz com perfil das linhas. |
mtxPC |
Matriz com perfil das colunas. |
mtxZ |
Matriz Z. |
mtxU |
Matriz com os autovetores U. |
mtxV |
Matriz com os autovetores V. |
mtxL |
Matriz com os autovalores. |
mtxX |
Matriz com as coordenadas principais das linhas. |
mtxY |
Matriz com as coordenadas principais das colunas. |
mtxAutvlr |
Matriz das inercias (variancias), com as proporcoes e proporcoes acumuladas. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(DataFreq) # conjunto de dados de frequencia data <- DataFreq[,2:ncol(DataFreq)] rownames(data) <- as.character(t(DataFreq[1:nrow(DataFreq),1])) res <- CA(data = data, "f") # realiza CA print("Existe dependencia entre as linhas e as colunas?"); res$depdata print("Numero de coordenadas principais:"); res$numcood print("Coordenadas principais das Linhas:"); round(res$mtxX,2) print("Coordenadas principais das Colunas:"); round(res$mtxY,2) print("Inercias das componentes principais:"); round(res$mtxAutvlr,2)
data(DataFreq) # conjunto de dados de frequencia data <- DataFreq[,2:ncol(DataFreq)] rownames(data) <- as.character(t(DataFreq[1:nrow(DataFreq),1])) res <- CA(data = data, "f") # realiza CA print("Existe dependencia entre as linhas e as colunas?"); res$depdata print("Numero de coordenadas principais:"); res$numcood print("Coordenadas principais das Linhas:"); round(res$mtxX,2) print("Coordenadas principais das Colunas:"); round(res$mtxY,2) print("Inercias das componentes principais:"); round(res$mtxAutvlr,2)
Realiza analise de correlacao canonica (CCA) em um conjunto de dados.
CCA(X = NULL, Y = NULL, type = 1, test = "Bartlett", sign = 0.05)
CCA(X = NULL, Y = NULL, type = 1, test = "Bartlett", sign = 0.05)
X |
Primeiro grupo de variaveis de um conjunto de dados. |
Y |
Segundo grupo de variaveis de um conjunto de dados. |
type |
1 para analise utilizando a matriz de covariancia (default), |
test |
teste de significancia da relacao entre o grupo X e Y: |
sign |
Grau de significancia do teste (default 5%). |
Cxx |
Matriz de Covariancia ou Correlacao Cxx. |
Cyy |
Matriz de Covariancia ou Correlacao Cyy. |
Cxy |
Matriz de Covariancia ou Correlacao Cxy. |
Cyx |
Matriz de Covariancia ou Correlacao Cyx. |
var.UV |
Matriz com autovalores (variancias) dos pares cononicos U e V. |
corr.UV |
Matriz de Correlacao dos pares cononicos U e V. |
coef.X |
Matriz dos Coeficientes canonicos do grupo X. |
coef.Y |
Matriz dos Coeficientes canonicos do grupo Y. |
corr.X |
Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo X. |
corr.Y |
Matriz das Correlacoes entre as variaveis canonicas e as variaveis originais do grupo Y. |
score.X |
Matriz com os scores do grupo X. |
score.Y |
Matriz com os scores do grupo Y. |
sigtest |
Retorna o teste de significancia da relacao entre o grupo X e Y: "Bartlett" (default) ou "Rao". |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Lattin, J.; Carrol, J. D.; Green, P. E. Analise de dados multivariados. 1th. ed. Sao Paulo: Cengage Learning, 2011. 455 p.
data(DataMix) # conjunto de dados data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[,1] X <- data[,1:2] Y <- data[,5:6] res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) print("Matriz com autovalores (variancias) dos pares cononicos U e V:"); round(res$var.UV,3) print("Matriz de correlacao dos pares cononicos U e V:"); round(res$corr.UV,3) print("Matriz dos coeficientes canonicos do grupo X:"); round(res$coef.X,3) print("Matriz dos coeficientes canonicos do grupo Y:"); round(res$coef.Y,3) print("Matriz das correlacoes entre as variaveis canonicas e as variaveis originais do grupo X:"); round(res$corr.X,3) print("Matriz das correlacoes entre as variaveis canonicas e as variaveis originais do grupo Y:"); round(res$corr.Y,3) print("Matriz com os scores do grupo X:"); round(res$score.X,3) print("Matriz com os scores do grupo Y:"); round(res$score.Y,3) print("teste de significancia dos pares canonicos:"); res$sigtest
data(DataMix) # conjunto de dados data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[,1] X <- data[,1:2] Y <- data[,5:6] res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) print("Matriz com autovalores (variancias) dos pares cononicos U e V:"); round(res$var.UV,3) print("Matriz de correlacao dos pares cononicos U e V:"); round(res$corr.UV,3) print("Matriz dos coeficientes canonicos do grupo X:"); round(res$coef.X,3) print("Matriz dos coeficientes canonicos do grupo Y:"); round(res$coef.Y,3) print("Matriz das correlacoes entre as variaveis canonicas e as variaveis originais do grupo X:"); round(res$corr.X,3) print("Matriz das correlacoes entre as variaveis canonicas e as variaveis originais do grupo Y:"); round(res$corr.Y,3) print("Matriz com os scores do grupo X:"); round(res$score.X,3) print("Matriz com os scores do grupo Y:"); round(res$score.Y,3) print("teste de significancia dos pares canonicos:"); res$sigtest
Realiza analysis de cluster hierarquico e nao hierarquico em um conjunto de dados.
Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs", cor.abs = FALSE, normalize = FALSE, distance = "euclidean", method = "complete", horizontal = FALSE, num.groups = 0, lambda = 2, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs", cor.abs = FALSE, normalize = FALSE, distance = "euclidean", method = "complete", horizontal = FALSE, num.groups = 0, lambda = 2, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
data |
Dados a serem analizados. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
hierarquic |
Agrupamentos hierarquicos (default = TRUE), para agrupamentos nao hierarquicos (method K-Means), somente para caso 'analysis' = "Obs". |
analysis |
"Obs" para analises nas observacoes (default), "Var" para analises nas variaveis. |
cor.abs |
Matriz de correlacao absoluta caso 'analysis' = "Var" (default = FALSE). |
normalize |
Normaliza os dados somente para caso 'analysis' = "Obs" (default = FALSE). |
distance |
Metrica das distancias caso agrupamentos hierarquicos: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". Caso analysis = "Var" a metrica sera a matriz de correlacao, conforme cor.abs. |
method |
Metodo para analises caso agrupamentos hierarquicos: "complete" (default), "ward.D", "ward.D2", "single", "average", "mcquitty", "median" ou "centroid". |
horizontal |
Dendrograma na horizontal (default = FALSE). |
num.groups |
Numero de grupos a formar. |
lambda |
Valor usado na distancia de minkowski. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Varios graficos.
tab.res |
Tabela com as similaridades e distancias dos grupos formados. |
groups |
Dados originais com os grupos formados. |
res.groups |
Resultados dos grupos formados. |
R.sqt |
Resultado do R quadrado. |
sum.sqt |
Soma do quadrado total. |
mtx.dist |
Matriz das distancias. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analysis de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] rownames(data) <- DataQuan[1:nrow(DataQuan),1] res <- Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs", cor.abs = FALSE, normalize = FALSE, distance = "euclidean", method = "ward.D", horizontal = FALSE, num.groups = 2, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) print("R quadrado:"); res$R.sqt # print("Soma do quadrado total:"); res$sum.sqt print("Grupos formados:"); res$groups # print("Tabela com as similaridades e distancias:"); res$tab.res # print("Tabela com os resultados dos grupos:"); res$res.groups # print("Matriz de distancias:"); res$mtx.dist write.table(file=file.path(tempdir(),"SimilarityTable.csv"), res$tab.res, sep=";", dec=",",row.names = FALSE) write.table(file=file.path(tempdir(),"GroupData.csv"), res$groups, sep=";", dec=",",row.names = TRUE) write.table(file=file.path(tempdir(),"GroupResults.csv"), res$res.groups, sep=";", dec=",",row.names = TRUE)
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] rownames(data) <- DataQuan[1:nrow(DataQuan),1] res <- Cluster(data, titles = NA, hierarquic = TRUE, analysis = "Obs", cor.abs = FALSE, normalize = FALSE, distance = "euclidean", method = "ward.D", horizontal = FALSE, num.groups = 2, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) print("R quadrado:"); res$R.sqt # print("Soma do quadrado total:"); res$sum.sqt print("Grupos formados:"); res$groups # print("Tabela com as similaridades e distancias:"); res$tab.res # print("Tabela com os resultados dos grupos:"); res$res.groups # print("Matriz de distancias:"); res$mtx.dist write.table(file=file.path(tempdir(),"SimilarityTable.csv"), res$tab.res, sep=";", dec=",",row.names = FALSE) write.table(file=file.path(tempdir(),"GroupData.csv"), res$groups, sep=";", dec=",",row.names = TRUE) write.table(file=file.path(tempdir(),"GroupResults.csv"), res$res.groups, sep=";", dec=",",row.names = TRUE)
Encontra o coeficiente de variacao dos dados, global ou por coluna.
CoefVar(data, type = 1)
CoefVar(data, type = 1)
data |
Dados a serem analisados. |
type |
1 Coeficiente de variacao global (default), |
Coeficiente de variacao, global ou por coluna.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Ferreira, D. F. Estatistica Basica. 2 ed. rev. Lavras: UFLA, 2009. 664 p.
data(DataQuan) # conjunto de dados data <- DataQuan[,2:8] res <- CoefVar(data = data, type = 1) # coeficiente de variacao global round(res,2) res <- CoefVar(data = data, type = 2) # coeficiente de variacao por coluna round(res,2)
data(DataQuan) # conjunto de dados data <- DataQuan[,2:8] res <- CoefVar(data = data, type = 1) # coeficiente de variacao global round(res,2) res <- CoefVar(data = data, type = 2) # coeficiente de variacao por coluna round(res,2)
Realiza analise discriminante linear e quadratica.
DA(data, class = NA, type = "lda", validation = "learning", method = "moment", prior = NA, testing = NA)
DA(data, class = NA, type = "lda", validation = "learning", method = "moment", prior = NA, testing = NA)
data |
Dados a serem a classificados. |
class |
Vetor com os nomes das classes dos dados. |
type |
"lda": analise discriminante linear (default), ou |
validation |
Tipo de validacao: |
method |
Metodo de classificacao: |
prior |
Probabilidades de ocorrencia das classes. Se nao especificado, tomara as proporcoes das classes. Se especificado, as probabilidades devem seguir a ordem dos niveis dos fatores. |
testing |
Vetor com os indices que serao utilizados em data como teste. Para validation = "learning", tem-se testing = NA. |
confusion |
Tabela de confusao. |
error.rate |
Proporcao global de erro. |
prior |
Probabilidade das classes. |
type |
Tipo de analise discriminante. |
validation |
Tipo de validacao. |
num.class |
Numero de classes. |
class.names |
Nomes das classes |
method |
Metodo de classificacao. |
num.correct |
Numero de observacoes corretas. |
results |
Matriz com resultados comparativos das classificacoes. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ripley, B. D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.
Venabless, W. N.; Ripley, B. D. Modern Applied Statistics with S. Fourth edition. Springer, 2002.
data(iris) # conjunto de dados data = iris[,1:4] # dados a serem classificados class = iris[,5] # classe dos dados prior = c(1,1,1)/3 # probabilidade a priori das classes res <- DA(data, class, type = "lda", validation = "learning", method = "mle", prior = prior, testing = NA) print("Tabela de confusao:"); res$confusion print("Proporcao global de acerto:"); 1 - res$error.rate print("Probabilidade das classes:"); res$prior print("Metodo de classificacao:"); res$method print("Tipo analise discriminante:"); res$type print("Nomes das classes:"); res$class.names print("Numero de classes:"); res$num.class print("Tipo de validacao:"); res$validation print("Numero de observacoes corretas:"); res$num.correct print("Matriz com os resultados da classificacao:"); res$results ### validacao cruzada ### amostra = sample(2, nrow(data), replace = TRUE, prob = c(0.7,0.3)) datatrain = data[amostra == 1,] # dados para treino datatest = data[amostra == 2,] # dados para teste dim(datatrain) # dimensao dados treino dim(datatest) # dimensao dados teste testing = as.integer(rownames(datatest)) # indice dos dados teste res <- DA(data, class, type = "qda", validation = "testing", method = "moment", prior = NA, testing = testing) print("Tabela de confusao:"); res$confusion print("Proporcao global de acerto:"); 1 - res$error.rate print("Numero de observacoes corretas:"); res$num.correct print("Matriz com os resultados da classificacao:"); res$results
data(iris) # conjunto de dados data = iris[,1:4] # dados a serem classificados class = iris[,5] # classe dos dados prior = c(1,1,1)/3 # probabilidade a priori das classes res <- DA(data, class, type = "lda", validation = "learning", method = "mle", prior = prior, testing = NA) print("Tabela de confusao:"); res$confusion print("Proporcao global de acerto:"); 1 - res$error.rate print("Probabilidade das classes:"); res$prior print("Metodo de classificacao:"); res$method print("Tipo analise discriminante:"); res$type print("Nomes das classes:"); res$class.names print("Numero de classes:"); res$num.class print("Tipo de validacao:"); res$validation print("Numero de observacoes corretas:"); res$num.correct print("Matriz com os resultados da classificacao:"); res$results ### validacao cruzada ### amostra = sample(2, nrow(data), replace = TRUE, prob = c(0.7,0.3)) datatrain = data[amostra == 1,] # dados para treino datatest = data[amostra == 2,] # dados para teste dim(datatrain) # dimensao dados treino dim(datatest) # dimensao dados teste testing = as.integer(rownames(datatest)) # indice dos dados teste res <- DA(data, class, type = "qda", validation = "testing", method = "moment", prior = NA, testing = testing) print("Tabela de confusao:"); res$confusion print("Proporcao global de acerto:"); 1 - res$error.rate print("Numero de observacoes corretas:"); res$num.correct print("Matriz com os resultados da classificacao:"); res$results
Conjunto de dados categorizados por cafes, sobre habilidades sensoriais no consumo de cafes especiais.
data(Data_Cafes)
data(Data_Cafes)
Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por cafes. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
data(Data_Cafes) # conjunto de dados categorizados data <- Data_Cafes[,2:ncol(Data_Cafes)] rownames(data) <- as.character(t(Data_Cafes[1:nrow(Data_Cafes),1])) group.names = c("Cafe A", "Cafe B", "Cafe C", "Cafe D") mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2) tit <- c("Scree-plot","Individuos", "Individuos/Tipos Cafes", "Inercias Grupos") Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
data(Data_Cafes) # conjunto de dados categorizados data <- Data_Cafes[,2:ncol(Data_Cafes)] rownames(data) <- as.character(t(Data_Cafes[1:nrow(Data_Cafes),1])) group.names = c("Cafe A", "Cafe B", "Cafe C", "Cafe D") mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2) tit <- c("Scree-plot","Individuos", "Individuos/Tipos Cafes", "Inercias Grupos") Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
Conjunto de dados categorizados por individuos, sobre habilidades sensoriais no consumo de cafes especiais.
data(Data_Individuos)
data(Data_Individuos)
Conjunto de dados de uma pesquisa feita com o proposito de avaliar a concordancia entre as respostas de diferentes grupos de consumidores com diferentes habilidades sensoriais. O experimento relaciona a analise sensorial de cafes especiais definidos por (A) Bourbon Amarelo, cultivado a altitudes maiores do que 1200 m.; (D) idem a (A) diferenciando apenas no preparo das amostras; (B) Acaia cultivados a altitude menores do que 1.100m; (C) idem ao (B) porem diferenciando o preparo das amostras. Aqui os dados estao categorizados por individuos. O exemplo dado demonstra os resultados encontrados em OSSANI et al. (2017).
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Ossani, P. C. Qualidade de cafes especiais e nao especiais por meio da analise de multiplos fatores para tabelas de contingencias. 2015. 107 p. Dissertacao (Mestrado em Estatistica e Experimentacao Agropecuaria) - Universidade Federal de Lavras, Lavras, 2015.
data(Data_Individuos) # conjundo de dados categorizados data <- Data_Individuos[,2:ncol(Data_Individuos)] rownames(data) <- as.character(t(Data_Individuos[1:nrow(Data_Individuos),1])) group.names = c("Grupo 1", "Grupo 2", "Grupo 3", "Grupo 4") mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) # analise dos dados print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2) tit <- c("Scree-plot","Individuos", "Individuos/Grupos Individuos", "Inercias Grupos") Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
data(Data_Individuos) # conjundo de dados categorizados data <- Data_Individuos[,2:ncol(Data_Individuos)] rownames(data) <- as.character(t(Data_Individuos[1:nrow(Data_Individuos),1])) group.names = c("Grupo 1", "Grupo 2", "Grupo 3", "Grupo 4") mf <- MFA(data, c(16,16,16,16), c(rep("f",4)), group.names) # analise dos dados print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2) tit <- c("Scree-plot","Individuos", "Individuos/Grupos Individuos", "Inercias Grupos") Plot.MFA(mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = NA, casc = FALSE) # Imprime varios graficos da tela
Conjunto simulado de dados com a frequencia semanal do numero de chicaras de cafes consumidas semanalmente em algumas capitais mundiais.
data(DataFreq)
data(DataFreq)
Conjunto de dados com 6 linhas e 9 colunas. Sendo 6 observacoes descritas por 9 variaveis: Grupo por sexo e idade, Sao Paulo - Cafe Bourbon, Londres - Cafe Bourbon, Atenas - Cafe Bourbon, Londres - Cafe Acaia, Atenas - Cafe Acaia, Sao Paulo - Cafe Catuai, Londres - Cafe Catuai, Atenas - Cafe Catuai.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataFreq) DataFreq
data(DataFreq) DataFreq
Conjunto simulado de dados mistos, sobre consumo de cafes.
data(DataMix)
data(DataMix)
Conjunto de dados com 10 linhas e 7 colunas. Sendo 10 observacoes descritas por 7 variaveis: Cooperativas/Degustadores, Medias das notas dadas aos cafes analisados, Anos de trabalho como degustador, Degustador com formacao tecnica, Degustador com dedicacao exclusiva, Frequencia media dos cafes classificados como especiais, Frequencia media dos cafes classificados como comercias.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataMix) DataMix
data(DataMix) DataMix
Conjunto simulado de dados qualitativos, sobre consumo de cafes.
data(DataQuali)
data(DataQuali)
Conjunto simulado de dados com 12 linhas e 6 colunas. Sendo 12 observacoes descritas por 6 variaveis: Sexo, Idade, Fumante, Estado Civil, Esportista, Estuda.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataQuali) DataQuali
data(DataQuali) DataQuali
Conjunto simulado de dados quantitativos, sobre notas dadas a algumas caracteristas sensoriais dos cafes.
data(DataQuan)
data(DataQuan)
Conjunto de dados com 6 linhas e 11 colunas. Sendo 6 observacoes descritas por 11 variaveis: Cafes, Achocolatado, Acaramelado, Maduro, Doce, Delicado, Amendoado, Acaramelado, Achocolatado, Picante, Acaramelado.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataQuan) DataQuan
data(DataQuan) DataQuan
Realiza analise fatorial (FA) em um conjunto de dados.
FA(data, method = "PC", type = 2, nfactor = 1, rotation = "None", scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, testfit = TRUE)
FA(data, method = "PC", type = 2, nfactor = 1, rotation = "None", scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, testfit = TRUE)
data |
Dados a serem analisados. |
method |
Metodo de analise: |
type |
1 para analise utilizando a matriz de covariancia, |
rotation |
Tipo de rotacao: "None" (default), "Varimax" e "Promax". |
nfactor |
Numero de fatores (default = 1). |
scoresobs |
Tipo de scores para as observacoes: "Bartlett" (default) ou "Regression". |
converg |
Valor limite para convergencia para soma do quadrado dos residuos para metodo de Maxima Verossimilhanca (default = 1e-5). |
iteracao |
Numero maximo de iteracoes para metodo de Maxima Verossimilhanca (default = 1000). |
testfit |
Testa o ajuste do modelo para o metodo de Maxima Verossimilhanca (default = TRUE). |
mtxMC |
Matriz de Correlacao/Covariancia. |
mtxAutvlr |
Matriz de autovalores. |
mtxAutvec |
Matriz de autovetores. |
mtxvar |
Matriz de variancias e proporcoes. |
mtxcarga |
Matriz de cargas fatoriais. |
mtxvaresp |
Matriz das variancias especificas. |
mtxcomuna |
Matriz das comunalidades. |
mtxresidue |
Matriz dos residuos. |
vlrsqrs |
Valor limite superior para a soma dos quadrados dos residuos. |
vlrsqr |
Soma dos quadrados dos residuos. |
mtxresult |
Matriz com todos os resultados associados. |
mtxscores |
Matriz com os escores das observacoes. |
coefscores |
Matriz com os escores dos coeficientes dos fatores. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Kaiser, H. F.The varimax criterion for analytic rotation in factor analysis. Psychometrika 23, 187-200, 1958.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
data(DataQuan) # conjunto de dados data <- DataQuan[,2:ncol(DataQuan)] rownames(data) <- DataQuan[,1] res <- FA(data = data, method = "PC", type = 2, nfactor = 3, rotation = "None", scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, testfit = TRUE) print("Matriz com todos os resultados associados:"); round(res$mtxresult,3) print("Soma dos Quadrados dos Residuos:"); round(res$vlrsqr,3) print("Matriz das Cargas Fatoriais:"); round(res$mtxcarga,3) print("Matriz com os escores das observacoes:"); round(res$mtxscores,3) print("Matriz com os escores dos coeficientes dos fatores:"); round(res$coefscores,3)
data(DataQuan) # conjunto de dados data <- DataQuan[,2:ncol(DataQuan)] rownames(data) <- DataQuan[,1] res <- FA(data = data, method = "PC", type = 2, nfactor = 3, rotation = "None", scoresobs = "Bartlett", converg = 1e-5, iteracao = 1000, testfit = TRUE) print("Matriz com todos os resultados associados:"); round(res$mtxresult,3) print("Soma dos Quadrados dos Residuos:"); round(res$vlrsqr,3) print("Matriz das Cargas Fatoriais:"); round(res$mtxcarga,3) print("Matriz com os escores das observacoes:"); round(res$mtxscores,3) print("Matriz com os escores dos coeficientes dos fatores:"); round(res$coefscores,3)
Realiza a exploracao dos dados atraves da tecnica de animacao Grand Tour.
GrandTour(data, method = "Interpolation", title = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, axesvar = TRUE, axes = TRUE, numrot = 200, choicerot = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
GrandTour(data, method = "Interpolation", title = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, axesvar = TRUE, axes = TRUE, numrot = 200, choicerot = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
data |
Conjunto de dados numericos. |
method |
Metodo usado para as rotacoes: |
title |
Titulo para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axesvar |
Coloca eixos de rotacao das variaveis (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
numrot |
Numero de rotacoes (default = 200). Se method = "Interpolation", numrot representara o angulo de rotacao. |
choicerot |
Escolhe rotacao especifica e apresenta na tela, ou salva a imagem se savptc = TRUE. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Graficos com as rotacoes.
proj.data |
Dados projetados. |
vector.opt |
Vetor projecao. |
method |
Metodo usado no Grand Tour. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Asimov, D. The Grand Tour: A Tool for Viewing Multidimensional data. SIAM Journal of Scientific and Statistical Computing, 6(1), 128-143, 1985.
Asimov, D.; Buja, A. The grand tour via geodesic interpolation of 2-frames. in Visual data Exploration and Analysis. Symposium on Electronic Imaging Science and Technology, IS&T/SPIE. 1994.
Buja, A.; Asimov, D. Grand tour methods: An outline. Computer Science and Statistics, 17:63-67. 1986.
Buja, A.; Cook, D.; Asimov, D.; Hurley, C. Computational methods for High-Dimensional Rotations in data Visualization, in C. R. Rao, E. J. Wegman & J. L. Solka, eds, "Handbook of Statistics: data Mining and Visualization", Elsevier/North Holland, http://www.elsevier.com, pp. 391-413. 2005.
Hurley, C.; Buja, A. Analyzing high-dimensional data with motion graphics, SIAM Journal of Scientific and Statistical Computing, 11 (6), 1193-1211. 1990.
Martinez, W. L.; Martinez, A. R.; Solka, J.; Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Young, F. W.; Rheingans P. Visualizing structure in high-dimensional multivariate data, IBM Journal of Research and Development, 35:97-107, 1991.
Young, F. W.; Faldowski R. A.; McFarlane M. M. Multivariate statistical visualization, in Handbook of Statistics, Vol 9, C. R. Rao (ed.), The Netherlands: Elsevier Science Publishers, 959-998, 1993.
data(iris) # conjunto de dados res <- GrandTour(iris[,1:4], method = "Torus", title = NA, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, class = NA, posleg = 2, boxleg = TRUE, axesvar = TRUE, axes = FALSE, numrot = 10, choicerot = NA, savptc = FALSE, width = 3236, height = 2000, res = 300) print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Metodo da projecao Grand Tour:"); res$method res <- GrandTour(iris[,1:4], method = "Interpolation", title = NA, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, posleg = 2, boxleg = FALSE, axesvar = FALSE, axes = FALSE, numrot = 10, choicerot = NA, class = iris[,5], classcolor = c("goldenrod3","gray53","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Metodo da projecao Grand Tour:"); res$method
data(iris) # conjunto de dados res <- GrandTour(iris[,1:4], method = "Torus", title = NA, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, class = NA, posleg = 2, boxleg = TRUE, axesvar = TRUE, axes = FALSE, numrot = 10, choicerot = NA, savptc = FALSE, width = 3236, height = 2000, res = 300) print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Metodo da projecao Grand Tour:"); res$method res <- GrandTour(iris[,1:4], method = "Interpolation", title = NA, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, posleg = 2, boxleg = FALSE, axesvar = FALSE, axes = FALSE, numrot = 10, choicerot = NA, class = iris[,5], classcolor = c("goldenrod3","gray53","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Metodo da projecao Grand Tour:"); res$method
Dada a matriz de ordem
, a decomposicao de valor singular generalizada (GSVD), envolve a utilizacao de dois conjuntos de matrizes quadradas positivas de ordem
e
, respectivamente. Estas duas matrizes expressam restricoes impostas, respectivamente, nas linhas e colunas de
.
GSVD(data, plin = NULL, pcol = NULL)
GSVD(data, plin = NULL, pcol = NULL)
data |
Matriz usada para a decomposicao. |
plin |
Peso para as linhas. |
pcol |
Peso para as colunas. |
Se nao for utilizado plin ou pcol, sera calculada como a decomposicao em valor singular usual.
d |
Autovalores, isto e, vector linha com os valores singulares da decomposicao. |
u |
Autovetores referentes as linhas. |
v |
Autovetores referentes as colunas. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
data <- matrix(c(1,2,3,4,5,6,7,8,9,10,11,12), nrow = 4, ncol = 3) svd(data) # decomposicao de valor singular usual GSVD(data) # GSVD com os mesmos resultados anteriores # GSVD com pesos para linhas e colunas GSVD(data, plin = c(0.1,0.5,2,1.5), pcol = c(1.3,2,0.8))
data <- matrix(c(1,2,3,4,5,6,7,8,9,10,11,12), nrow = 4, ncol = 3) svd(data) # decomposicao de valor singular usual GSVD(data) # GSVD com os mesmos resultados anteriores # GSVD com pesos para linhas e colunas GSVD(data, plin = c(0.1,0.5,2,1.5), pcol = c(1.3,2,0.8))
Na matriz indicadora os elementos estao dispostos na forma de variaveis dummy, em outras palavras, 1 para uma categoria escolhida como variavel resposta e 0 para as outras categorias de uma mesma variavel.
IM(data, names = TRUE)
IM(data, names = TRUE)
data |
Dados categoricos. |
names |
Inclui os nomes das variaveis nos niveis da Matriz Indicadora (default = TRUE). |
mtxIndc |
Retorna dados convertidos em matriz indicadora. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data <- matrix(c("S","S","N","N",1,2,3,4,"N","S","T","N"), nrow = 4, ncol = 3) IM(data, names = FALSE) data(DataQuali) # conjunto de dados qualitativos IM(DataQuali, names = TRUE)
data <- matrix(c("S","S","N","N",1,2,3,4,"N","S","T","N"), nrow = 4, ncol = 3) IM(data, names = FALSE) data(DataQuali) # conjunto de dados qualitativos IM(DataQuali, names = TRUE)
Funcao para melhor posicao dos rotulos nos graficos.
LocLab(x, y = NULL, labels = seq(along = x), cex = 1, method = c("SANN", "GA"), allowSmallOverlap = FALSE, trace = FALSE, shadotext = FALSE, doPlot = TRUE, ...)
LocLab(x, y = NULL, labels = seq(along = x), cex = 1, method = c("SANN", "GA"), allowSmallOverlap = FALSE, trace = FALSE, shadotext = FALSE, doPlot = TRUE, ...)
x |
Coordenada x |
y |
Coordenada y |
labels |
Os rotulos |
cex |
cex |
method |
Nao usado |
allowSmallOverlap |
Booleana |
trace |
Booleana |
shadotext |
Booleana |
doPlot |
Booleana |
... |
Outros argumentos passados para ou a partir de outros metodos |
Veja o texto da funcao.
Realiza o escalonamento multidimensional (MDS) em um conjunto de dados.
MDS(data, distance = "euclidean", title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
MDS(data, distance = "euclidean", title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
data |
Dados a serem analizados. |
distance |
Metrica das distancias: "euclidean" (default), "maximum", "manhattan", "canberra", "binary" ou "minkowski". |
title |
Titulo do grafico, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Coloca eixos nos graficos (default = TRUE). |
size |
Tamanho dos pontos no grafico . |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Grafico de escalonamento multidimensional.
mtxD |
Matriz das distancias. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados md <- MDS(data = data, distance = "euclidean", title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","gray53","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) print("Matriz das distancias:"); md$mtxD
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados md <- MDS(data = data, distance = "euclidean", title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","gray53","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) print("Matriz das distancias:"); md$mtxD
Realiza analise de multiplos fatores (MFA) em grupos de variaveis. Os grupos de variaveis podem ser dados quantitativos, qualitativos, de frequencia (MFACT), ou dados mistos.
MFA(data, groups, typegroups = rep("n", length(groups)), namegroups = NULL)
MFA(data, groups, typegroups = rep("n", length(groups)), namegroups = NULL)
data |
Dados a serem analisados. |
groups |
Numero de colunas para cada grupo em ordem seguindo a ordem dos dados em 'data'. |
typegroups |
Tipo de grupo: |
namegroups |
Nomes para cada grupo. |
vtrG |
Vetor com os tamanhos de cada grupo. |
vtrNG |
Vetor com os nomes de cada grupo. |
vtrplin |
Vetor com os valores usados para balancear as linhas da matriz Z. |
vtrpcol |
Vetor com os valores usados para balancear as colunas da matriz Z. |
mtxZ |
Matriz concatenada e balanceada. |
mtxA |
Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas. |
mtxU |
Matriz U da decomposicao singular da matriz Z. |
mtxV |
Matriz V da decomposicao singular da matriz Z. |
mtxF |
Matriz global dos escores dos fatores onde as linhas sao as observacoes e as colunas os componentes. |
mtxEFG |
Matriz dos escores dos fatores por grupo. |
mtxCCP |
Matriz de correlacao dos componentes principais com as variaveis originais. |
mtxEV |
Matriz das inercias parciais/escores das variaveis. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Abdessemed, L.; Escofier, B. Analyse factorielle multiple de tableaux de frequencies: comparaison avec l'analyse canonique des correspondences. Journal de la Societe de Statistique de Paris, Paris, v. 137, n. 2, p. 3-18, 1996..
Abdi, H. Singular Value Decomposition (SVD) and Generalized Singular Value Decomposition (GSVD). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 907-912.
Abdi, H.; Valentin, D. Multiple factor analysis (MFA). In: SALKIND, N. J. (Ed.). Encyclopedia of measurement and statistics. Thousand Oaks: Sage, 2007. p. 657-663.
Abdi, H.; Williams, L. Principal component analysis. WIREs Computational Statatistics, New York, v. 2, n. 4, p. 433-459, July/Aug. 2010.
Abdi, H.; Williams, L.; Valentin, D. Multiple factor analysis: principal component analysis for multitable and multiblock data sets. WIREs Computational Statatistics, New York, v. 5, n. 2, p. 149-179, Feb. 2013.
Becue-Bertaut, M.; Pages, J. A principal axes method for comparing contingency tables: MFACT. Computational Statistics & data Analysis, New York, v. 45, n. 3, p. 481-503, Feb. 2004
Becue-Bertaut, M.; Pages, J. Multiple factor analysis and clustering of a mixture of quantitative, categorical and frequency data. Computational Statistics & data Analysis, New York, v. 52, n. 6, p. 3255-3268, Feb. 2008.
Bezecri, J. Analyse de l'inertie intraclasse par l'analyse d'un tableau de contingence: intra-classinertia analysis through the analysis of a contingency table. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 3, p. 351-358, 1983.
Escofier, B. Analyse factorielle en reference a un modele: application a l'analyse d'un tableau d'echanges. Revue de Statistique Appliquee, Paris, v. 32, n. 4, p. 25-36, 1984.
Escofier, B.; Drouet, D. Analyse des differences entre plusieurs tableaux de frequence. Les Cahiers de l'Analyse des Donnees, Paris, v. 8, n. 4, p. 491-499, 1983.
Escofier, B.; Pages, J. Analyse factorielles simples et multiples. Paris: Dunod, 1990. 267 p.
Escofier, B.; Pages, J. Analyses factorielles simples et multiples: objectifs, methodes et interpretation. 4th ed. Paris: Dunod, 2008. 318 p.
Escofier, B.; Pages, J. Comparaison de groupes de variables definies sur le meme ensemble d'individus: un exemple d'applications. Le Chesnay: Institut National de Recherche en Informatique et en Automatique, 1982. 121 p.
Escofier, B.; Pages, J. Multiple factor analysis (AFUMULT package). Computational Statistics & data Analysis, New York, v. 18, n. 1, p. 121-140, Aug. 1994
Greenacre, M.; Blasius, J. Multiple correspondence analysis and related methods. New York: Taylor and Francis, 2006. 607 p.
Ossani, P. C.; Cirillo, M. A.; Borem, F. M.; Ribeiro, D. E.; Cortez, R. M. Quality of specialty coffees: a sensory evaluation by consumers using the MFACT technique. Revista Ciencia Agronomica (UFC. Online), v. 48, p. 92-100, 2017.
Pages, J. Analyse factorielle multiple appliquee aux variables qualitatives et aux donnees mixtes. Revue de Statistique Appliquee, Paris, v. 50, n. 4, p. 5-37, 2002.
Pages, J.. Multiple factor analysis: main features and application to sensory data. Revista Colombiana de Estadistica, Bogota, v. 27, n. 1, p. 1-26, 2004.
data(DataMix) # conjunto de dados mistos data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[1:nrow(DataMix),1] group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes") mf <- MFA(data = data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)
data(DataMix) # conjunto de dados mistos data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[1:nrow(DataMix),1] group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes") mf <- MFA(data = data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA print("Variancias dos Componentes Principais:"); round(mf$mtxA,2) print("Matriz das Inercias Parciais/Escores das Variaveis:"); round(mf$mtxEV,2)
Funcao que normaliza os dados globalmente, ou por coluna.
NormData(data, type = 1)
NormData(data, type = 1)
data |
Dados a serem normalizados. |
type |
1 normaliza global (default), |
dataNorm |
Dados normalizados. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] res <- NormData(data, type = 1) # normaliza os dados globalmente res # dados normalizados globalmente sd(res) # desvio padrao global mean(res) # media global res <- NormData(data, type = 2) # normaliza os dados por coluna res # dados normalizados por coluna apply(res, 2, sd) # desvio padrao por coluna colMeans(res) # medias das colunas
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] res <- NormData(data, type = 1) # normaliza os dados globalmente res # dados normalizados globalmente sd(res) # desvio padrao global mean(res) # media global res <- NormData(data, type = 2) # normaliza os dados por coluna res # dados normalizados por coluna apply(res, 2, sd) # desvio padrao por coluna colMeans(res) # medias das colunas
Verificar a normalidade dos dados, baseado no teste de coeficiente de assimetria.
NormTest(data, sign = 0.05)
NormTest(data, sign = 0.05)
data |
Dados a serem analisados. |
sign |
Grau de significancia do teste (default 5%). |
statistic |
Valor Chi-quadrado observado, ou seja, a estatistica do teste. |
chisquare |
Valor Chi-quadrado calculado. |
gl |
Grau de liberdade. |
p.value |
Valor p. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Rencher, A. C. Methods of Multivariate Analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
data <- cbind(rnorm(100,2,3), rnorm(100,1,2)) NormTest(data) plot(density(data)) data <- cbind(rexp(200,3), rexp(200,3)) NormTest(data, sign = 0.01) plot(density(data))
data <- cbind(rnorm(100,2,3), rnorm(100,1,2)) NormTest(data) plot(density(data)) data <- cbind(rexp(200,3), rexp(200,3)) NormTest(data, sign = 0.01) plot(density(data))
Realiza analise de componentes principais (PCA) em um conjunto de dados.
PCA(data, type = 1)
PCA(data, type = 1)
data |
Dados a serem analizados. |
type |
1 para analise utilizando a matriz de covariancia (default), |
mtxC |
Matriz de covariancia ou de correlacao conforme "type". |
mtxAutvlr |
Matriz de autovalores (variancias) com as proporcoes e proporcoes acumuladas. |
mtxAutvec |
Matriz de autovetores - componentes principais. |
mtxVCP |
Matriz da covariancia dos componentes principais com as variaveis originais. |
mtxCCP |
Matriz da correlacao dos componentes principais com as variaveis originais. |
mtxscores |
Matriz com os escores dos componentes principais. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Hotelling, H. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology, Arlington, v. 24, p. 417-441, Sept. 1933.
Mingoti, S. A. Analise de dados atraves de metodos de estatistica multivariada: uma abordagem aplicada. Belo Horizonte: UFMG, 2005. 297 p.
Ferreira, D. F. Estatistica Multivariada. 2a ed. revisada e ampliada. Lavras: Editora UFLA, 2011. 676 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.. 708 p.
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] rownames(data) <- DataQuan[1:nrow(DataQuan),1] pc <- PCA(data = data, 2) # executa o PCA print("Matriz de Covariancia/Correlacao:"); round(pc$mtxC,2) print("Componentes Principais:"); round(pc$mtxAutvec,2) print("Variancias dos Componentes Principais:"); round(pc$mtxAutvlr,2) print("Covariancia dos Componentes Principais:"); round(pc$mtxVCP,2) print("Correlacao dos Componentes Principais:"); round(pc$mtxCCP,2) print("Escores dos Componentes Principais:"); round(pc$mtxscores,2)
data(DataQuan) # conjunto de dados quantitativos data <- DataQuan[,2:8] rownames(data) <- DataQuan[1:nrow(DataQuan),1] pc <- PCA(data = data, 2) # executa o PCA print("Matriz de Covariancia/Correlacao:"); round(pc$mtxC,2) print("Componentes Principais:"); round(pc$mtxAutvec,2) print("Variancias dos Componentes Principais:"); round(pc$mtxAutvlr,2) print("Covariancia dos Componentes Principais:"); round(pc$mtxVCP,2) print("Correlacao dos Componentes Principais:"); round(pc$mtxCCP,2) print("Escores dos Componentes Principais:"); round(pc$mtxscores,2)
Graficos da analise de correspondencia (CA) simples e multipla.
Plot.CA(CA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.CA(CA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
CA |
Dados da funcao CA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucaoo nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataFreq) # conjunto de dados de frequencia data <- DataFreq[,2:ncol(DataFreq)] rownames(data) <- DataFreq[1:nrow(DataFreq),1] res <- CA(data, "f") # realiza CA tit <- c("Scree-plot","Observacoes", "Variaveis", "Observacoes/Variaveis") Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = rownames(data), savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) data(DataQuali) # conjunto de dados qualitativos data <- DataQuali[,2:ncol(DataQuali)] res <- CA(data, "c", "b") # realiza CA tit <- c("","","Grafico das Variaveis") Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE)
data(DataFreq) # conjunto de dados de frequencia data <- DataFreq[,2:ncol(DataFreq)] rownames(data) <- DataFreq[1:nrow(DataFreq),1] res <- CA(data, "f") # realiza CA tit <- c("Scree-plot","Observacoes", "Variaveis", "Observacoes/Variaveis") Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = rownames(data), savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) data(DataQuali) # conjunto de dados qualitativos data <- DataQuali[,2:ncol(DataQuali)] res <- CA(data, "c", "b") # realiza CA tit <- c("","","Grafico das Variaveis") Plot.CA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos da analise de correlacao canonica (CCA).
Plot.CCA(CCA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.CCA(CCA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
CCA |
Dados da funcao CCA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataMix) # conjunto de dados data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[,1] X <- data[,1:2] Y <- data[,5:6] res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) # Analise de correlacao canonica tit <- c("Scree-plot","Correlacoes","Scores do grupo X","Scores do grupo Y") Plot.CCA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
data(DataMix) # conjunto de dados data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[,1] X <- data[,1:2] Y <- data[,5:6] res <- CCA(X, Y, type = 2, test = "Bartlett", sign = 0.05) # Analise de correlacao canonica tit <- c("Scree-plot","Correlacoes","Scores do grupo X","Scores do grupo Y") Plot.CCA(res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Realiza as correlacoes entre as variaveis de uma base de dados e apresenta em forma de grafico.
Plot.Cor(data, title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
Plot.Cor(data, title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
data |
Conjunto de dados numericos. |
title |
Titulo para o grafico, se nao for definido assume texto padrao. |
grid |
Coloca grade no grafico (default = TRUE). |
leg |
Coloca a legenda no grafico (default = TRUE) |
boxleg |
Coloca moldura na legenda (default = FALSE). |
text |
Coloca os valores das correlacoes nos circulos (default = FALSE). |
arrow |
Setas das correlacoes positivas (para cima) e negativas (para baixo) (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
namesvar |
Vetor com os nomes das variaveis, se omitido assume os nomes em 'data'. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Grafico com as correlacoes entre as variaveis em 'data'
Paulo Cesar Ossani
data(iris) # conjunto de dados Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE, width = 3236, height = 2000, res = 300) Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = TRUE, arrow = TRUE, color = TRUE, namesvar = c("A1","B2","C3","D4"), savptc = FALSE, width = 3236, height = 2000, res = 300)
data(iris) # conjunto de dados Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = FALSE, arrow = TRUE, color = TRUE, namesvar = NA, savptc = FALSE, width = 3236, height = 2000, res = 300) Plot.Cor(data = iris[,1:4], title = NA, grid = TRUE, leg = TRUE, boxleg = FALSE, text = TRUE, arrow = TRUE, color = TRUE, namesvar = c("A1","B2","C3","D4"), savptc = FALSE, width = 3236, height = 2000, res = 300)
Graficos da analise fatorial (FA).
Plot.FA(FA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.FA(FA, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
FA |
Dados da funcao FA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
axes |
Plota os eixos X e Y (default = TRUE). |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados res <- FA(data, method = "PC", type = 2, nfactor = 3) tit <- c("Scree-plot","Scores das observacoes","Cargas Fatoriais","Biplot") cls <- as.character(iris[,5]) Plot.FA(FA = res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, size = 1.1, posleg = 1, boxleg = FALSE, class = cls, axes = TRUE, classcolor = c("blue3","red","goldenrod3"), width = 3236, height = 2000, res = 300, casc = FALSE)
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados res <- FA(data, method = "PC", type = 2, nfactor = 3) tit <- c("Scree-plot","Scores das observacoes","Cargas Fatoriais","Biplot") cls <- as.character(iris[,5]) Plot.FA(FA = res, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, size = 1.1, posleg = 1, boxleg = FALSE, class = cls, axes = TRUE, classcolor = c("blue3","red","goldenrod3"), width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos da analise de multiplos fatores (MFA).
Plot.MFA(MFA, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE, color = TRUE, groupscolor = NA, namarr = FALSE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.MFA(MFA, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE, color = TRUE, groupscolor = NA, namarr = FALSE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
MFA |
Dados da funcao MFA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
1 para legenda no canto superior esquerdo, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
groupscolor |
Vetor com as cores dos grupos. |
namarr |
Coloca nomes nos pontos na nuvem ao redor do centroide no grafico correspondente a analise global dos individuos e variaveis (default = FALSE). |
linlab |
Vetor com os rotulos para as observacoes, se nao for definido assume texto padrao. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(DataMix) # conjunto de dados mistos data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[1:nrow(DataMix),1] group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes") mf <- MFA(data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA tit <- c("Scree-plot","Observacoes","Observacoes/Variaveis", "Circulo de Correlacoes","Inercias dos Grupos Variaveis") Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, groupscolor = c("blue3","red","goldenrod3"), namarr = FALSE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Plota varios graficos da tela Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = rep("A?",10), savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Plota varios graficos da tela
data(DataMix) # conjunto de dados mistos data <- DataMix[,2:ncol(DataMix)] rownames(data) <- DataMix[1:nrow(DataMix),1] group.names = c("Notas Cafes/Trabalho", "Formacao/Dedicacao", "Cafes") mf <- MFA(data, c(2,2,2), typegroups = c("n","c","f"), group.names) # realiza MFA tit <- c("Scree-plot","Observacoes","Observacoes/Variaveis", "Circulo de Correlacoes","Inercias dos Grupos Variaveis") Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, groupscolor = c("blue3","red","goldenrod3"), namarr = FALSE, linlab = NA, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Plota varios graficos da tela Plot.MFA(MFA = mf, titles = tit, xlabel = NA, ylabel = NA, posleg = 2, boxleg = FALSE, color = TRUE, namarr = FALSE, linlab = rep("A?",10), savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Plota varios graficos da tela
Graficos da analise de componentes principais (PCA).
Plot.PCA(PC, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.PCA(PC, titles = NA, xlabel = NA, ylabel = NA, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, axes = TRUE, class = NA, classcolor = NA, posleg = 2, boxleg = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
PC |
Dados da funcao PCA. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
axes |
Plota os eixos X e Y (default = TRUE). |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados pc <- PCA(data, 2) # executa o PCA tit <- c("Scree-plot","Grafico das Observacoes","Circulo de Correlacoes") cls <- as.character(iris[,5]) Plot.PCA(PC = pc, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, size = 1.1, posleg = 2, boxleg = FALSE, class = cls, axes = TRUE, classcolor = c("blue3","red","goldenrod3"), width = 3236, height = 2000, res = 300, casc = FALSE)
data(iris) # conjunto de dados data <- iris[,1:4] cls <- iris[,5] # classe dos dados pc <- PCA(data, 2) # executa o PCA tit <- c("Scree-plot","Grafico das Observacoes","Circulo de Correlacoes") cls <- as.character(iris[,5]) Plot.PCA(PC = pc, titles = tit, xlabel = NA, ylabel = NA, color = TRUE, linlab = NA, savptc = FALSE, size = 1.1, posleg = 2, boxleg = FALSE, class = cls, axes = TRUE, classcolor = c("blue3","red","goldenrod3"), width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos da projection pursuit (PP).
Plot.PP(PP, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE, color = TRUE, classcolor = NA, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.PP(PP, titles = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, size = 1.1, grid = TRUE, color = TRUE, classcolor = NA, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
PP |
Dados da funcao PP_Optimizer. |
titles |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
classcolor |
Vetor com as cores das classes. |
linlab |
Vetor com os rotulos para as observacoes. |
axesvar |
Coloca eixos de rotacao das variaveis, somente quando dimproj > 1 (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Grafico da evolucao dos indices, e graficos cujos dados foram reduzidos em duas dimensoes.
Paulo Cesar Ossani
Marcelo Angelo Cirillo
PP_Optimizer
and PP_Index
data(iris) # conjunto de dados # Exemplo 1 - Sem as classes nos dados data <- iris[,1:4] findex <- "kurtosismax" # funcao indice dim <- 1 # dimensao da projecao dos dados sphere <- TRUE # dados esfericos res <- PP_Optimizer(data = data, class = NA, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) tit <- c(NA,"Exemplo de grafico") # titulos para os graficos Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE, classcolor = c("blue3","red","goldenrod3"), linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 3 - Sem as classes nos dados, mas informando # as classes na funcao plot res <- PP_Optimizer(data = data, class = NA, findex = "Moment", optmethod = "GTSA", dimproj = 2, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) lin <- c(rep("a",50),rep("b",50),rep("c",50)) # classe dos dados Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE, linlab = lin, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 4 - Com as classes nos dados, mas nao informada na funcao plot class <- iris[,5] # classe dos dados dim <- 2 # dimensao da projecao dos dados findex <- "lda" # funcao indice res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) tit <- c("",NA) # titulos para os graficos Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE)
data(iris) # conjunto de dados # Exemplo 1 - Sem as classes nos dados data <- iris[,1:4] findex <- "kurtosismax" # funcao indice dim <- 1 # dimensao da projecao dos dados sphere <- TRUE # dados esfericos res <- PP_Optimizer(data = data, class = NA, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) tit <- c(NA,"Exemplo de grafico") # titulos para os graficos Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE, classcolor = c("blue3","red","goldenrod3"), linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 3 - Sem as classes nos dados, mas informando # as classes na funcao plot res <- PP_Optimizer(data = data, class = NA, findex = "Moment", optmethod = "GTSA", dimproj = 2, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) lin <- c(rep("a",50),rep("b",50),rep("c",50)) # classe dos dados Plot.PP(res, titles = NA, posleg = 1, boxleg = FALSE, color = TRUE, linlab = lin, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE) # Exemplo 4 - Com as classes nos dados, mas nao informada na funcao plot class <- iris[,5] # classe dos dados dim <- 2 # dimensao da projecao dos dados findex <- "lda" # funcao indice res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 500, half = 30) tit <- c("",NA) # titulos para os graficos Plot.PP(res, titles = tit, posleg = 1, boxleg = FALSE, color = TRUE, linlab = NA, axesvar = TRUE, axes = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = FALSE)
Graficos dos resultados da regressao linear.
Plot.Regr(Reg, typegraf = "Scatterplot", title = NA, xlabel = NA, ylabel = NA, namevary = NA, namevarx = NA, size = 1.1, grid = TRUE, color = TRUE, intconf = TRUE, intprev = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Plot.Regr(Reg, typegraf = "Scatterplot", title = NA, xlabel = NA, ylabel = NA, namevary = NA, namevarx = NA, size = 1.1, grid = TRUE, color = TRUE, intconf = TRUE, intprev = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300, casc = TRUE)
Reg |
Dados da funcao de regressao. |
typegraf |
Tipo de grafico: |
title |
Titulos para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
namevary |
Nome da variavel Y, se nao for definido assume texto padrao. |
namevarx |
Nome da variavel X, ou variaveis X, se nao for definido assume texto padrao. |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
intconf |
Caso typegraf = "Regression". Graficos com intervalo de confianca (default = TRUE). |
intprev |
Caso typegraf = "Regression". Graficos com intervalo de previsao (default = TRUE) |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
casc |
Efeito cascata na apresentacao dos graficos (default = TRUE). |
Retorna varios graficos.
Paulo Cesar Ossani
data(DataMix) Y <- DataMix[,2] X <- DataMix[,7] name.y <- "Media das notas" name.x <- "Cafes comerciais" res <- Regr(Y, X, namevarx = name.x ,intercept = TRUE, sigf = 0.05) tit <- c("Scatterplot") Plot.Regr(res, typegraf = "Scatterplot", title = tit, namevary = name.y, namevarx = name.x, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) tit <- c("Grafico de Dispersao com a \n reta ajustada") Plot.Regr(res, typegraf = "Regression", title = tit, xlabel = name.x, ylabel = name.y, color = TRUE, intconf = TRUE, intprev = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) dev.new() # necessario para nao sobrepor os graficos seguintes ao grafico anterior par(mfrow = c(2,2)) Plot.Regr(res, typegraf = "QQPlot", casc = FALSE) Plot.Regr(res, typegraf = "Histogram", casc = FALSE) Plot.Regr(res, typegraf = "Fits", casc = FALSE) Plot.Regr(res, typegraf = "Order", casc = FALSE)
data(DataMix) Y <- DataMix[,2] X <- DataMix[,7] name.y <- "Media das notas" name.x <- "Cafes comerciais" res <- Regr(Y, X, namevarx = name.x ,intercept = TRUE, sigf = 0.05) tit <- c("Scatterplot") Plot.Regr(res, typegraf = "Scatterplot", title = tit, namevary = name.y, namevarx = name.x, color = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) tit <- c("Grafico de Dispersao com a \n reta ajustada") Plot.Regr(res, typegraf = "Regression", title = tit, xlabel = name.x, ylabel = name.y, color = TRUE, intconf = TRUE, intprev = TRUE, savptc = FALSE, width = 3236, height = 2000, res = 300) dev.new() # necessario para nao sobrepor os graficos seguintes ao grafico anterior par(mfrow = c(2,2)) Plot.Regr(res, typegraf = "QQPlot", casc = FALSE) Plot.Regr(res, typegraf = "Histogram", casc = FALSE) Plot.Regr(res, typegraf = "Fits", casc = FALSE) Plot.Regr(res, typegraf = "Order", casc = FALSE)
Funcao usada para encontrar os indices da projection pursuit (PP).
PP_Index(data, class = NA, vector.proj = NA, findex = "HOLES", dimproj = 2, weight = TRUE, lambda = 0.1, r = 1, ck = NA)
PP_Index(data, class = NA, vector.proj = NA, findex = "HOLES", dimproj = 2, weight = TRUE, lambda = 0.1, r = 1, ck = NA)
data |
Conjunto de dados numericos sem a informacao das classes. |
class |
Vetor com os nomes das classes dos dados. |
vector.proj |
Vetor projecao. |
findex |
Funcao indice de projecao a ser usada: |
dimproj |
Dimensao da projecao dos dados (default = 2). |
weight |
Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE). |
lambda |
Usado no indice PDA (default = 0.1). |
r |
Usado no indice Lr (default = 1). |
ck |
Uso interno da funcao indice CHI. |
num.class |
Numero de classes. |
class.names |
Nomes das classes. |
findex |
Funcao indice de projecao usada. |
vector.proj |
Vetores de projecao encontrados. |
index |
Indice de projecao encontrado no processo. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Ossani, P. C.; Figueira, M. R.; Cirillo, M. A. Proposition of a new index for projection pursuit in the multiple factor analysis. Computational and Mathematical Methods, v. 1, p. 1-18, 2020.
Cook, D.; Buja, A.; Cabrera, J. Projection pursuit indexes based on orthonormal function expansions. Journal of Computational and Graphical Statistics, 2(3):225-250, 1993.
Cook, D.; Buja, A.; Cabrera, J.; Hurley, C. Grand tour and projection pursuit, Journal of Computational and Graphical Statistics, 4(3), 155-172, 1995.
Cook, D.; Swayne, D. F. Interactive and Dynamic Graphics for data Analysis: With R and GGobi. Springer. 2007.
Espezua, S.; Villanueva, E.; Maciel, C. D.; Carvalho, A. A projection pursuit framework for supervised dimension reduction of high dimensional small sample datasets. Neurocomputing, 149, 767-776, 2015.
Friedman, J. H., Tukey, J. W. A projection pursuit algorithm for exploratory data analysis. IEEE Transaction on Computers, 23(9):881-890, 1974.
Hastie, T., Buja, A., Tibshirani, R. Penalized discriminant analysis. The Annals of Statistics. 23(1), 73-102 . 1995.
Huber, P. J. Projection pursuit. Annals of Statistics, 13(2):435-475, 1985.
Jones, M. C.; Sibson, R. What is projection pursuit, (with discussion), Journal of the Royal Statistical Society, Series A 150, 1-36, 1987.
Lee, E. K.; Cook, D. A projection pursuit index for large p small n data. Statistics and Computing, 20(3):381-392, 2010.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
Martinez, W. L., Martinez, A. R.; Computational Statistics Handbook with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2007. 794 p.
Martinez, W. L.; Martinez, A. R.; Solka, J. Exploratory data Analysis with MATLAB, 2th. ed. New York: Chapman & Hall/CRC, 2010. 499 p.
Pena, D.; Prieto, F. Cluster identification using projections. Journal of the American Statistical Association, 96(456):1433-1445, 2001.
Posse, C. Projection pursuit exploratory data analysis, Computational Statistics and data Analysis, 29:669-687, 1995a.
Posse, C. Tools for two-dimensional exploratory projection pursuit, Journal of Computational and Graphical Statistics, 4:83-100, 1995b.
PP_Optimizer
and Plot.PP
data(iris) # conjunto de dados data <- iris[,1:4] # Exemplo 1 - Sem as classes nos dados ind <- PP_Index(data = data, class = NA, vector.proj = NA, findex = "moment", dimproj = 2, weight = TRUE, lambda = 0.1, r = 1) print("Numero de classes:"); ind$num.class print("Nomes das classes:"); ind$class.names print("Funcao indice de projecao:"); ind$findex print("Vetores de projecao:"); ind$vector.proj print("Indice de projecao:"); ind$index # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados findex <- "pda" # funcao indice sphere <- TRUE # Dados esfericos res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "SA", dimproj = 2, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) # Comparando o resultado obtido if (match(toupper(findex),c("LDA", "PDA", "LR"), nomatch = 0) > 0) { if (sphere) { data <- apply(predict(prcomp(data)), 2, scale) # dados esfericos } } else data <- as.matrix(res$proj.data[,1:Dim]) ind <- PP_Index(data = data, class = class, vector.proj = res$vector.opt, findex = findex, dimproj = 2, weight = TRUE, lambda = 0.1, r = 1) print("Numero de classes:"); ind$num.class print("Nomes das classes:"); ind$class.names print("Funcao indice de projecao:"); ind$findex print("Vetores de projecao:"); ind$vector.proj print("Indice de projecao:"); ind$index print("Indice de projecao otimizado:"); res$index[length(res$index)]
data(iris) # conjunto de dados data <- iris[,1:4] # Exemplo 1 - Sem as classes nos dados ind <- PP_Index(data = data, class = NA, vector.proj = NA, findex = "moment", dimproj = 2, weight = TRUE, lambda = 0.1, r = 1) print("Numero de classes:"); ind$num.class print("Nomes das classes:"); ind$class.names print("Funcao indice de projecao:"); ind$findex print("Vetores de projecao:"); ind$vector.proj print("Indice de projecao:"); ind$index # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados findex <- "pda" # funcao indice sphere <- TRUE # Dados esfericos res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "SA", dimproj = 2, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) # Comparando o resultado obtido if (match(toupper(findex),c("LDA", "PDA", "LR"), nomatch = 0) > 0) { if (sphere) { data <- apply(predict(prcomp(data)), 2, scale) # dados esfericos } } else data <- as.matrix(res$proj.data[,1:Dim]) ind <- PP_Index(data = data, class = class, vector.proj = res$vector.opt, findex = findex, dimproj = 2, weight = TRUE, lambda = 0.1, r = 1) print("Numero de classes:"); ind$num.class print("Nomes das classes:"); ind$class.names print("Funcao indice de projecao:"); ind$findex print("Vetores de projecao:"); ind$vector.proj print("Indice de projecao:"); ind$index print("Indice de projecao otimizado:"); res$index[length(res$index)]
Funcao de otimizacao dos indices da projection pursuit (busca de projecao).
PP_Optimizer(data, class = NA, findex = "HOLES", dimproj = 2, sphere = TRUE, optmethod = "GTSA", weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 3000, half = 30)
PP_Optimizer(data, class = NA, findex = "HOLES", dimproj = 2, sphere = TRUE, optmethod = "GTSA", weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 3000, half = 30)
data |
Conjunto de dados numericos sem a informacao das classes. |
class |
Vetor com os nomes das classes dos dados. |
findex |
Funcao indice de projecao a ser usada: |
dimproj |
Dimensao para a projecao dos dados (default = 2). |
sphere |
Dados esfericos (default = TRUE). |
optmethod |
Metodo de otimizacao GTSA - Grand Tour Simulated Annealing ou SA - Simulated Annealing (default = "GTSA"). |
weight |
Usado nos indice LDA, PDA e Lr, para ponderar os calculos pelo numero de elementos em cada classe (default = TRUE). |
lambda |
Usado no indice PDA (default = 0.1). |
r |
Usado no indice Lr (default = 1). |
cooling |
Taxa de arrefecimento (default = 0.9). |
eps |
Precisao de aproximacao para cooling (default = 1e-3). |
maxiter |
Numero maximo de iteracoes do algoritmo (default = 3000). |
half |
Numero de etapas sem incrementar o indice, para em seguida diminuir o valor do cooling (default = 30). |
num.class |
Numero de classes. |
class.names |
Nomes das classes. |
proj.data |
Dados projetados. |
vector.opt |
Vetores de projecao encontrados. |
index |
Vetor com os indices de projecao encontrados no processo, convergindo para o maximo, ou o minimo. |
findex |
Funcao indice de projecao usada. |
Paulo Cesar Ossani
Marcelo Angelo Cirillo
Cook, D.; Lee, E. K.; Buja, A.; Wickmam, H. Grand tours, projection pursuit guided tours and manual controls. In Chen, Chunhouh, Hardle, Wolfgang, Unwin, e Antony (Eds.), Handbook of data Visualization, Springer Handbooks of Computational Statistics, chapter III.2, p. 295-314. Springer, 2008.
Lee, E.; Cook, D.; Klinke, S.; Lumley, T. Projection pursuit for exploratory supervised classification. Journal of Computational and Graphical Statistics, 14(4):831-846, 2005.
data(iris) # conjunto de dados # Exemplo 1 - Sem as classes nos dados data <- iris[,1:4] class <- NA # classe dos dados findex <- "kurtosismax" # funcao indice dim <- 1 # dimensao da projecao dos dados sphere <- TRUE # Dados esfericos res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) print("Numero de classes:"); res$num.class print("Nomes das classes:"); res$class.names print("Funcao indice de projecao:"); res$findex print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Indices de projecao:"); res$index # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) print("Numero de classes:"); res$num.class print("Nomes das classes:"); res$class.names print("Funcao indice de projecao:"); res$findex print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Indices de projecao:"); res$index
data(iris) # conjunto de dados # Exemplo 1 - Sem as classes nos dados data <- iris[,1:4] class <- NA # classe dos dados findex <- "kurtosismax" # funcao indice dim <- 1 # dimensao da projecao dos dados sphere <- TRUE # Dados esfericos res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) print("Numero de classes:"); res$num.class print("Nomes das classes:"); res$class.names print("Funcao indice de projecao:"); res$findex print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Indices de projecao:"); res$index # Exemplo 2 - Com as classes nos dados class <- iris[,5] # classe dos dados res <- PP_Optimizer(data = data, class = class, findex = findex, optmethod = "GTSA", dimproj = dim, sphere = sphere, weight = TRUE, lambda = 0.1, r = 1, cooling = 0.9, eps = 1e-3, maxiter = 1000, half = 30) print("Numero de classes:"); res$num.class print("Nomes das classes:"); res$class.names print("Funcao indice de projecao:"); res$findex print("Dados projetados:"); res$proj.data print("Vetores de projecao:"); res$vector.opt print("Indices de projecao:"); res$index
Realiza a regressao linear em um conjunto de dados.
Regr(Y, X, namevarx = NA, intercept = TRUE, sigf = 0.05)
Regr(Y, X, namevarx = NA, intercept = TRUE, sigf = 0.05)
Y |
Variaveis respotas. |
X |
Variaveis regressoras. |
namevarx |
Nome da variavel, ou variaveis X, se nao for definido assume texto padrao. |
intercept |
Considerar o intercepto na regressao (default = TRUE). |
sigf |
Nivel de significancia dos testes dos residuos (default = 5%). |
Betas |
Coeficientes da regressao. |
CovBetas |
Matriz de covariancias dos coeficientes da regressao. |
ICc |
Intervalo de confianca dos coeficientes da regressao. |
hip.test |
Teste de hipoteses dos coeficientes da regressao. |
ANOVA |
Analise de variancia da regressao. |
R |
Coeficiente de determinacao. |
Rc |
Coeficiente de determinacao corrigido. |
Ra |
Coeficiente de determinacao ajustado. |
QME |
Variancia dos residuos. |
ICQME |
Intervalo de confianca da variancia dos residuos. |
prev |
Previsao do ajuste da regressao. |
IPp |
Intervalo das previsoes. |
ICp |
Intervalo de confianca das previsoes. |
error |
Residuos do ajuste da regressao. |
error.test |
Retorna a 5% de significancia o teste de independencia, de normalidade e de homogeneidade da variancia dos residuos. |
Paulo Cesar Ossani
Charnet, R.; at al.. Analise de modelos de regressao lienar, 2a ed. Campinas: Editora da Unicamp, 2008. 357 p.
Rencher, A. C.; Schaalje, G. B. Linear models in statisctic. 2th. ed. New Jersey: John & Sons, 2008. 672 p.
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
data(DataMix) Y <- DataMix[,2] X <- DataMix[,6:7] name.x <- c("Cafes Expeciais","Cafes Comerciais") res <- Regr(Y, X, namevarx = name.x , intercept = TRUE, sigf = 0.05) print("Coeficientes da Regressao:"); round(res$Betas,4) print("Analise de Variancia:"); res$ANOVA print("Teste de Hipoteses dos Coeficientes da Regressao:"); round(res$hip.test,4) print("Coeficiente de Determinacao:"); round(res$R,4) print("Coeficiente de Determinacao Corrigido:"); round(res$Rc,4) print("Coeficiente de Determinacao Ajustado:"); round(res$Ra,4) print("Testes dos Residuos:"); res$error.test
data(DataMix) Y <- DataMix[,2] X <- DataMix[,6:7] name.x <- c("Cafes Expeciais","Cafes Comerciais") res <- Regr(Y, X, namevarx = name.x , intercept = TRUE, sigf = 0.05) print("Coeficientes da Regressao:"); round(res$Betas,4) print("Analise de Variancia:"); res$ANOVA print("Teste de Hipoteses dos Coeficientes da Regressao:"); round(res$hip.test,4) print("Coeficiente de Determinacao:"); round(res$R,4) print("Coeficiente de Determinacao Corrigido:"); round(res$Rc,4) print("Coeficiente de Determinacao Ajustado:"); round(res$Ra,4) print("Testes dos Residuos:"); res$error.test
Realiza o grafico de dispersao.
Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE, title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE, title = NA, xlabel = NA, ylabel = NA, posleg = 2, boxleg = TRUE, axes = TRUE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = NA, classcolor = NA, savptc = FALSE, width = 3236, height = 2000, res = 300)
data |
Dados com as coordenadas x e y. |
ellipse |
Coloca uma elipse envolta das classes (default = TRUE). |
ellipse.level |
Nivel de significancia da elipse (defaul = 0.95). |
rectangle |
Coloca retangulo para diferenciar as classes (default = FALSE). |
title |
Titulo para os graficos, se nao for definido assume texto padrao. |
xlabel |
Nomeia o eixo X, se nao for definido assume texto padrao. |
ylabel |
Nomeia o eixo Y, se nao for definido assume texto padrao. |
posleg |
0 sem legenda, |
boxleg |
Coloca moldura na legenda (default = TRUE). |
axes |
Plota os eixos X e Y (default = TRUE). |
size |
Tamanho dos pontos no grafico. |
grid |
Coloca grade nos graficos (default = TRUE). |
color |
Graficos coloridos (default = TRUE). |
linlab |
Vetor com os rotulos para as observacoes. |
class |
Vetor com os nomes das classes dos dados. |
classcolor |
Vetor com as cores das classes. |
savptc |
Salva as imagens dos graficos em arquivos (default = FALSE). |
width |
Largura do grafico quanto savptc = TRUE (defaul = 3236). |
height |
Altura do grafico quanto savptc = TRUE (default = 2000). |
res |
Resolucao nominal em ppi do grafico quanto savptc = TRUE (default = 300). |
Grafico de dispersao.
Paulo Cesar Ossani
Rencher, A. C. Methods of multivariate analysis. 2th. ed. New York: J.Wiley, 2002. 708 p.
Anton, H.; Rorres, C. Elementary linear algebra: applications version. 10th ed. New Jersey: John Wiley & Sons, 2010. 768 p.
data(iris) # conjunto de dados data <- iris[,3:4] cls <- iris[,5] # classe dos dados Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE, title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = FALSE, axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","blue","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) Scatter(data, ellipse = FALSE, ellipse.level = 0.95, rectangle = TRUE, title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = TRUE, axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","blue","red"), savptc = FALSE, width = 3236, height = 2000, res = 300)
data(iris) # conjunto de dados data <- iris[,3:4] cls <- iris[,5] # classe dos dados Scatter(data, ellipse = TRUE, ellipse.level = 0.95, rectangle = FALSE, title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = FALSE, axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","blue","red"), savptc = FALSE, width = 3236, height = 2000, res = 300) Scatter(data, ellipse = FALSE, ellipse.level = 0.95, rectangle = TRUE, title = NA, xlabel = NA, ylabel = NA, posleg = 1, boxleg = TRUE, axes = FALSE, size = 1.1, grid = TRUE, color = TRUE, linlab = NA, class = cls, classcolor = c("goldenrod3","blue","red"), savptc = FALSE, width = 3236, height = 2000, res = 300)