quarta-feira, 28 de junho de 2017

Graficos de Unifirmidade

Como procurar qualquer assunto no SAS:

Exemplo:
sas quality contyrol sample
Formato geral

sas <assunto de interesse> sample



The ANOM Procedure
Overview
Getting StartedAlternar menu suspenso SyntaxAlternar menu suspenso DetailsAlternar menu suspenso ExamplesAlternar menu suspenso
Creating ANOM Boxcharts from Group Summary Data

(View the complete code for this example.)


Note: See Creating BOXCHARTS from Group Summary Data in the SAS/QC Sample Library.

The previous example illustrates how you can create ANOM charts for means using measurement data. However, in many applications, the data are provided as group summary statistics. This example illustrates how you can use the BOXCHART statement with data of this type.

The following data set (Labels) provides the data from the preceding example in summarized form:


data Labels;
   input Position DeviationL Deviation1 DeviationX
         DeviationM Deviation3 DeviationH DeviationS;
   DeviationN = 10;
   datalines;
1  -0.0647  -0.0362  -0.02234  -0.02620  -0.0016  0.0094  0.02281
2  -0.0332  -0.0201   0.01625   0.02045   0.0438  0.0564  0.03347
3  -0.0440  -0.0139   0.00604   0.00570   0.0285  0.0486  0.02885
4   0.0362   0.0530   0.06473   0.06030   0.0755  0.1073  0.02150
5  -0.0464  -0.0074   0.00813   0.00760   0.0302  0.0374  0.02593
6  -0.0384  -0.0285  -0.01283  -0.00950   0.0017  0.0071  0.01599
;
A listing of Labels is shown in Figure 5.4. There is exactly one observation for each group (note that the groups are still indexed by Position). There are eight summary variables in Labels.

DeviationL contains the group minimums (low values).

Deviation1 contains the 25th percentile (first quartile) of each group.

DeviationX contains the group means.

DeviationM contains the group medians.

Deviation3 contains the 75th percentile (third quartile) of each group.

DeviationH contains the group maximums (high values).

DeviationS contains the group standard deviations.

DeviationN contains the group sample sizes (these are all 10 in this case).


Figure 5.4: The Summary Data Set Labels

The Data Set Labels

Position               DeviationL          Deviation1          DeviationX         DeviationM        Deviation3          DeviationH                DeviationS          DeviationN
1             -0.0647 -0.0362 -0.02234              -0.02620              -0.0016 0.0094   0.02281 10
2             -0.0332 -0.0201 0.01625 0.02045 0.0438   0.0564   0.03347 10
3             -0.0440 -0.0139 0.00604 0.00570 0.0285   0.0486   0.02885 10
4             0.0362   0.0530   0.06473 0.06030 0.0755   0.1073   0.02150 10
5             -0.0464 -0.0074 0.00813 0.00760 0.0302   0.0374   0.02593 10
6             -0.0384 -0.0285 -0.01283              -0.00950              0.0017   0.0071   0.01599 10



You can read this data set by specifying it as a SUMMARY= data set in the PROC ANOM statement, as follows:

ods graphics on;
title 'Analysis of Label Deviations';
proc anom summary=Labels;
   boxchart Deviation*Position / odstitle=title1;
run;
The resulting ANOM boxchart is shown in Figure 5.5.

Note that Deviation is not the name of a SAS variable in the data set but is, instead, the common prefix for the names of the eight summary variables. The suffix characters L, 1, X, M, 3, H, S, and N indicate the contents of the variable. For example, the suffix characters 1 and 3 indicate first and third quartiles. Thus, you can specify three group summary variables in a SUMMARY= data set with a single name (Deviation), which is referred to as the response. The name Position specified after the asterisk is the name of the group-variable.

Figure 5.5: ANOM Chart for Means in Data Set Labels

ANOM Chart for Means in Data Set Labels


In general, a SUMMARY= input data set used with the BOXCHART statement must contain the following variables:


group variable

quarta-feira, 21 de junho de 2017

Penúltima Aula 21/6 - Agenda 2 Ultimas Aulas e Disciplina Residencia em Analises Estatísticas

Penúltima Aula 21/6 - Agenda 2 Ultimas Aulas e Disciplina Residencia em Analises Estatísticas

Preparação Conjunta das Últimas duas Aulas:
·        Quem puder e achar necessário investir mais em Estatística:
o   Disciplina Residência em Analises Estatísticas:  
§  Marcaremos uma aula dessa disciplina para discutirmos Pressuposições da ANOVA, utilizando o SAS Web Gratuito (Tadeu ou Sonia)
§  Não Tem Programa
§  Aborda somente itens de interesse dos alunos
§  Sempre tem 3 professores (Sonia, Tadeu e Gabriel) na sala de aulas
§  Sempre tem alunos de PG da Estatísticas ( ~ 70 estão cursando)
§  Terças Feiras das 15 às 18h
§  Não tem reprovação por nota
·        Pratica profissionalizante:
o   Começar em Agosto, para podermos gerenciar essa atividade de forma participativa
o   Ir lendo TQM de Oakland (o Sistema Toyota de Gestão é um casso particular do TQM) ou sites que tenham conteúdo ou outros livros e material sobre a ISO 9000
·        Duas Ultimas Aulas:
o   Mostrar rapidamente ferramentas de raciocínio logico matemático para teses, trabalhos, etc. Exemplo no goconqr
o   Empregabilidade e Competitividade:
§  Habilidades de mercado
§  Networking:
·        Banco de Dados:
o   PC: Access
o   Celular:
§  Sheets - Google
§  Presentations – Google
§  Estou querendo saber mais. O que podemos fazer no celular
o   Exemplos de Regressão (Ênfase em Robusta). Na Web. Fazermos diagnostico de outliers e normalidade. Uma aula da Residência.
o   Pressuposições Gauss Markov (programa João) ok esta no blog
o   Gráficos de Controle de Processos e Capacidade de Processos
o   Kruskal Wallis (Anova one way robusto)
o   Se der tempo Regressão Múltipla já temos uma postagem com programa para isso
o    


Regressão Robusta 21/6

Regressão Robusta


data com;
input x y;
cards;
30   430
21   335
35   520
42   490
37   470
2    210
8    195
17   270
35   400
25   480
20   4000
;
/* Com orlier Y = 4000 */

data sem;
input x1 y1;
cards;
30   430
21   335
35   520
42   490
37   470
2    210
8    195
17   270
35   400
25   480
;

proc print data = com;
run;

proc print data = sem;
run;
title "Com Outlier";
proc reg data = com;
model y = x;
run;
/* Analise Errada porque tem Outlier Y = 4000
Nao podemos ter outliers na proc reg */


proc reg data = sem;
model y1 = x1;
run;
/* Para a Gente nao descartar, eliminar, dados podemos utilizar
regressao robusta proc robustreg, o aulier na afeta à analise, nao
temos nescesidade de normalidade nem ausencia de outliers */

proc robustreg data = com method = m;
model y = x;
run;

proc robustreg data = sem method = m;
model y1 = x1;

run;

Ferramentas para Analise de Situaçoes

- Mapa Mental
- Diagrama de Nashi Sneiderman
- Pseudocódigo





Dianostico

data FQ_Sup_2;
input Area $ Areia Log_Arei;
cards;
FF 30.9 1.490492235
FF 25.1 1.399362164
FF 24.0 1.379668034
PA 29.0 1.461963486
PA 17.5 1.243360548
PA 79.9 1.902307553
FS1 30.3 1.481456961
FS1 19.5 1.290012339
FS1 47.8 1.679782093
FS2 43.0 1.633902533
FS2 31.5 1.498186452
FS2 37.9 1.578902686
FS3 74.2 1.870439022
FS3 34.9 1.542626278
FS3 74.4 1.871666322
;

proc anova;
class Area;
model  Areia Log_Arei = Area;
means Area / Duncan alpha=0.1 lines;
run;

proc glm data=fq_sup_2 plots=all; *gráficos dos resídduos, olhar gráfico de valores preditos contra resíduo padronizado (independência dos erros)) e outlyers (boxplot);;
class Area;
model Log_Arei = Area; 
means Area / Duncan alpha=0.1 lines;
output out= res1 r=res;
run;

*teste de homogeneidade de variâncias;
proc glm data=res1 plots=all; 
class Area;
model res= Area; 
means Area/hovtest=levene;
run;

*teste de normalidade;
proc univariate data=res1 plots normal;
var res;
run;
/*
proc npar1way data=FQ_Super wilcoxon ;
 class Area;
 var Areia;
run;

terça-feira, 13 de junho de 2017

Aula 14/6/2017 - Regr. Robusta e Multipla - Mapa Mental - e Lados do Cerebro


https://www.goconqr.com/pt-BR/p/9276678



Lados do Cérebro - Mapa Mental
    https://www.ted.com/talks/jill_bolte_taylor_s_powerful_stroke_of_insight?language=pt-br

- ExemTime (software para Mapa Mental)






Simulação de Mercado de Trabalho:

  • A: Empregabilidade
    • Área de Interesse sua e das empresas
    • Conteúdo de minha área: Gestão, CIQ, BI e SI
      • Ver Postagem sobre assuntos indispensáveis
§  Gestão: Estratégica, Tática e Operacional
  • B: Competitividade - Empreendedorismo (Utopia do Capitalismo)
    • Proposta de
      Comercial
      (Breefing)
    • Habilidades de Mercado e Networking (Banco de dados para gerenciar networking)
    • Gestão: Estratégica, Tática e Operacional
    • Conteúdo de minha área: Gestão, CIQ, BI e SI
      • Ver Postagem sobre assuntos indispensáveis
    • Foco em Plano de Negocio (Estimar Viabilidade Econômica), Canvas, Lean Startups, Lean Canvas etc.
    • Contabilidade Gerencial (Contabilidade de Custos - Custos - Custo/beneficio - Lucro Liquido)
      • Custo real de cada item: exemplo Um Carro para Visitar Empresas (simular de 20.000 e 40.000 $R)
  • C: Empreendedorismo Universitário Associativo:
    •  Sinergia e Antagonismo:
      • Importância na Vida Profissional
      • Equacionamento
      • Exemplos Segunda Guerra



Regressão Robusta

data com;
input x y;
cards;
30   430
21   335
35   520
42   490
37   470
2    210
8    195
17   270
35   400
25   480
20   4000
;

data sem;
input x1 y1;
cards;
30   430
21   335
35   520
42   490
37   470
2    210
8    195
17   270
35   400
25   480
;

proc print data = com;
run;

proc print data = sem;
run;

proc reg data = com;
model y = x;
run;

proc reg data = sem;
model y1 = x1;
run;

proc robustreg data = com method = m;
model y = x;
run;

proc robustreg data = sem method = m;
model y1 = x1;

run;

quarta-feira, 7 de junho de 2017

Lados do Cérebro - Mapa Mental

Lados do Cérebro - Mapa Mental
    https://www.ted.com/talks/jill_bolte_taylor_s_powerful_stroke_of_insight?language=pt-br

- ExemTime (software para Mapa Mental)



Publicação de Notas (para fazer qualificação)

Publicação de Notas (para fazer qualificação)
22/6/2017

A priori teríamos aulas ate dia 28/6


( 7/6/2017) - Fatorial analisado como ONE WAY ANOVA

Fatorial analisado como ONE WAY ANOVA

data Combin;
input Trat $ IMC;
cards;
F_AT 19.7
F_AT 20.3
F_AT 19.3
F_AT 20.9
F_SEM 22.4
F_SEM 21.9
F_SEM 23.8
F_SEM 24.1
F_SED 26.3
F_SED 23.5
F_SED 24.8
F_SED 26.6
F_PR 26.2
F_PR 24.2
F_PR 25.4
F_PR 24.9
M_AT 20.2
M_AT 21.3
M_AT 19.3
M_AT 21.1
M_SEM 21.2
M_SEM 20.1
M_SEM 19.7
M_SEM 21.1
M_SED 27.3
M_SED 23.4
M_SED 25.2
M_SED 26.4
M_PR 22.3
M_PR 22.2
M_PR 22.1
M_PR 23.3
;
proc anova;
class Trat;
model IMC = Trat;
means Trat / Tukey lines;
run;

Deu Problema Quando Copiamos do Blog para o Excel e Depois para o SAS:
Captura de Telas Explicando

  1. Dados Originais do Blog:
    1. data fatorial;
      input Genero $ Categ $ IMC;
      /* Fatorial 2 x 4 */
      cards;
      F AT 19.7
      F AT 20.3
      F AT 19.3
      F AT 20.9
      F SEM 22.4
      F SEM 21.9
      F SEM 23.8
      F SEM 24.1
      F SED  26.3
      F SED  23.5
      F SED  24.8
      F SED  26.6
      F PR 26.2
      F PR 24.2
      F PR 25.4
      F PR 24.9
      M AT 20.2
      M AT 21.3
      M AT 19.3
      M AT 21.1
      M SEM 21.2
      M SEM 20.1
      M SEM 19.7
      M SEM 21.1
      M SED  27.3
      M SED  23.4
      M SED  25.2
      M SED  26.4
      M PR 22.3
      M PR 22.2
      M PR 22.1
      M PR 23.3
      ;
      proc print;
      run;
      Proc glm;
      /* glm : General Liner Models */
      class Genero Categ;
      /* Agora são 2 Fatores
      Clasificatorios no One Way ANOVA 
      era somente um Ex. Somente Categorias
      nao tinha Genero */
      model IMC = Genero Categ Genero*Categ;
      run;
  2. Resultado da Copia do Banco de Dados para o Excel


Comando em Excel para Concatenação:
Problema de Exportação para o SAS (Substituir no Word):
Fizemos isso no Word.








Fatorial Sem Interação (7/6)


Exemplo Sem Interação Significativa

Autora: Ana Carolina Donofre (Dados simulados)





data fatorial;

input Linhagem $ Densidade $ GP;

cards;

C 10 2.44

C 10 2.39

C 10 2.42

C 10 2.45

C 14 2.03

C 14 1.99

C 14 2.05

C 14 2.07

C 18 1.78

C 18 1.83

C 18 1.81

C 18 1.73

R 10 2.37

R 10 2.30

R 10 2.34

R 10 2.38

R 14 1.88

R 14 1.90

R 14 1.87

R 14 1.92

R 18 1.65

R 18 1.69

R 18 1.70

R 18 1.67

;

proc print;

run;
Proc glm;
class Linhagem Densidade;
model GP = Linhagem Densidade Linhagem*Densidade;
means Linhagem / Tukey lines;
means Densidade / Tukey lines;
run;

Arquivo para Download Sem Interação:



Resultados SAS Sem Interação







Outro Exemplo Sem Interação


data consumo;
input Trat $ Imp $ Cons;
cards;
1 a 17.2
1 a 18.3
1 a 17.5
1 a 18.4
1 b 20.3
1 b 21.3
1 b 22.1
1 b 19.5
2 a 22.1
2 a 23.5
2 a 24.5
2 a 21.5
2 b 25.5
2 b 26.4
2 b 27.3
2 b 26.1
3 a 20.2
3 a 23.2
3 a 21.5
3 a 20.1
3 b 22.2
3 b 22.3
3 b 24.5
3 b 26.1
4 a 19.8
4 a 18.8
4 a 19.5
4 a 20.2
4 b 24.3
4 b 23.4
4 b 22.1
4 b 22.7
;
proc print;
run;
proc glm;
class Trat Imp;
model Cons = Trat Imp Trat*Imp;
lsmeans Trat*Imp / slice=Trat adjust=tukey PDIFF=all;
lsmeans Trat*Imp / slice=Imp adjust=tukey PDIFF=all;
run;


/*
means Trat / tukey lines;
means Imp / tukey lines;
*/

Saida:
The SAS System

ObsTratImpCons
11a17.2
21a18.3
31a17.5
41a18.4
51b20.3
61b21.3
71b22.1
81b19.5
92a22.1
102a23.5
112a24.5
122a21.5
132b25.5
142b26.4
152b27.3
162b26.1
173a20.2
183a23.2
193a21.5
203a20.1
213b22.2
223b22.3
233b24.5
243b26.1
254a19.8
264a18.8
274a19.5
284a20.2
294b24.3
304b23.4
314b22.1
324b22.7



The SAS System

The ANOVA Procedure
Class Level Information
ClassLevelsValues
Trat41 2 3 4
Imp2a b


Number of Observations Read32
Number of Observations Used32




The SAS System

The ANOVA Procedure
Dependent Variable: Cons
SourceDFSum of SquaresMean SquareF ValuePr > F
Model7196.070000028.010000020.53<.0001
Error2432.75000001.3645833
Corrected Total31228.8200000


R-SquareCoeff VarRoot MSECons Mean
0.8568745.3218851.16815421.95000


SourceDFAnova SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088




The SAS System

The ANOVA Procedure





The SAS System

The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for Cons


Note:This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ.
Alpha0.05
Error Degrees of Freedom24
Error Mean Square1.364583
Critical Value of Studentized Range3.90126
Minimum Significant Difference1.6112


Means with the same letter
are not significantly different.
Tukey GroupingMeanNTrat
A24.612582
B22.512583
B
B21.350084
C19.325081




The SAS System

The ANOVA Procedure





The SAS System

The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for Cons


Note:This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ.
Alpha0.05
Error Degrees of Freedom24
Error Mean Square1.364583
Critical Value of Studentized Range2.91879
Minimum Significant Difference0.8524


Means with the same letter
are not significantly different.
Tukey GroupingMeanNImp
A23.506316b
B20.393816a



The SAS System

ObsTratImpCons
11a17.2
21a18.3
31a17.5
41a18.4
51b20.3
61b21.3
71b22.1
81b19.5
92a22.1
102a23.5
112a24.5
122a21.5
132b25.5
142b26.4
152b27.3
162b26.1
173a20.2
183a23.2
193a21.5
203a20.1
213b22.2
223b22.3
233b24.5
243b26.1
254a19.8
264a18.8
274a19.5
284a20.2
294b24.3
304b23.4
314b22.1
324b22.7



The SAS System

The GLM Procedure
Class Level Information
ClassLevelsValues
Trat41 2 3 4
Imp2a b


Number of Observations Read32
Number of Observations Used32




The SAS System

The GLM Procedure
Dependent Variable: Cons
SourceDFSum of SquaresMean SquareF ValuePr > F
Model7196.070000028.010000020.53<.0001
Error2432.75000001.3645833
Corrected Total31228.8200000


R-SquareCoeff VarRoot MSECons Mean
0.8568745.3218851.16815421.95000


SourceDFType I SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088


SourceDFType III SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088







The SAS System

The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
TratImpCons LSMEANLSMEAN Number
1a17.85000001
1b20.80000002
2a22.90000003
2b26.32500004
3a21.25000005
3b23.77500006
4a19.57500007
4b23.12500008


Least Squares Means for effect Trat*Imp
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: Cons
i/j12345678
10.0282<.0001<.00010.0080<.00010.4493<.0001
20.02820.2256<.00010.99920.02630.80870.1378
3<.00010.22560.00740.50360.95930.00991.0000
4<.0001<.00010.0074<.00010.0803<.00010.0141
50.00800.99920.5036<.00010.08550.48530.3489
6<.00010.02630.95930.08030.08550.00080.9923
70.44930.80870.0099<.00010.48530.00080.0052
8<.00010.13781.00000.01410.34890.99230.0052













The SAS System

The GLM Procedure
Least Squares Means
Trat*Imp Effect Sliced by Trat for Cons
TratDFSum of SquaresMean SquareF ValuePr > F
1117.40500017.40500012.750.0015
2123.46125023.46125017.190.0004
3112.75125012.7512509.340.0054
4125.20500025.20500018.470.0002




The SAS System

The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
TratImpCons LSMEANLSMEAN Number
1a17.85000001
1b20.80000002
2a22.90000003
2b26.32500004
3a21.25000005
3b23.77500006
4a19.57500007
4b23.12500008


Least Squares Means for effect Trat*Imp
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: Cons
i/j12345678
10.0282<.0001<.00010.0080<.00010.4493<.0001
20.02820.2256<.00010.99920.02630.80870.1378
3<.00010.22560.00740.50360.95930.00991.0000
4<.0001<.00010.0074<.00010.0803<.00010.0141
50.00800.99920.5036<.00010.08550.48530.3489
6<.00010.02630.95930.08030.08550.00080.9923
70.44930.80870.0099<.00010.48530.00080.0052
8<.00010.13781.00000.01410.34890.99230.0052













The SAS System

The GLM Procedure
Least Squares Means
Trat*Imp Effect Sliced by Imp for Cons
ImpDFSum of SquaresMean SquareF ValuePr > F
a356.62187518.87395813.83<.0001
b361.94687520.64895815.13<.0001