terça-feira, 18 de junho de 2019

Fatorial analisado como ONE WAY ANOVA

Fatorial analisado como ONE WAY ANOVA

data Combin;
input Trat $ IMC;
cards;
F_AT 19.7
F_AT 20.3
F_AT 19.3
F_AT 20.9
F_SEM 22.4
F_SEM 21.9
F_SEM 23.8
F_SEM 24.1
F_SED 26.3
F_SED 23.5
F_SED 24.8
F_SED 26.6
F_PR 26.2
F_PR 24.2
F_PR 25.4
F_PR 24.9
M_AT 20.2
M_AT 21.3
M_AT 19.3
M_AT 21.1
M_SEM 21.2
M_SEM 20.1
M_SEM 19.7
M_SEM 21.1
M_SED 27.3
M_SED 23.4
M_SED 25.2
M_SED 26.4
M_PR 22.3
M_PR 22.2
M_PR 22.1
M_PR 23.3
;
proc anova;
class Trat;
model IMC = Trat;
means Trat / Tukey lines;
run;

Arranjo Fatorial de Tratamentos e Interação

Arranjo Fatorial de Tratamentos e Interação


- Fatorial - Interação
Arranjo Fatorial de Tratamentos

- Interação (ou relacionamento entre os fatores) no Fatorial
  - Comparações de um fator dentro do outro 

Sites Legais:
http://paginapessoal.utfpr.edu.br/sheilaro/AULA11DelineamentoFatorial.pdf/at_download/file
 http://sweet.ua.pt/andreia.hall/Bioestat%C3%ADstica/ANOVAcontinua.pdf
- Livro Montgomery - Experimental Designs
   https://2alamen.files.wordpress.com/2008/10/design-and-analysis-of-experiments-5th-edition-douglas-c-montgomery.pdf
   https://www.sas.com/storefront/aux/en/spdesignanlysisjmp/66584_excerpt.pdf.

https://2alamen.files.wordpress.com/2008/10/design-and-analysis-of-experiments-5th-edition-douglas-c-montgomery.pdf
data fatorial;
input Genero $ Categ $ IMC;
/* Fatorial 2 x 4 */
cards;
F AT 19.7
F AT 20.3
F AT 19.3
F AT 20.9
F SEM 22.4
F SEM 21.9
F SEM 23.8
F SEM 24.1
F SED  26.3
F SED  23.5
F SED  24.8
F SED  26.6
F PR 26.2
F PR 24.2
F PR 25.4
F PR 24.9
M AT 20.2
M AT 21.3
M AT 19.3
M AT 21.1
M SEM 21.2
M SEM 20.1
M SEM 19.7
M SEM 21.1
M SED  27.3
M SED  23.4
M SED  25.2
M SED  26.4
M PR 22.3
M PR 22.2
M PR 22.1
M PR 23.3
;
proc print;
run;
Proc glm;
/* glm : General Liner Models */
class Genero Categ;
/* Agora são 2 Fatores
Clasificatorios no One Way ANOVA 
era somente um Ex. Somente Categorias
nao tinha Genero */
model IMC = Genero Categ Genero*Categ;
run;

/*lsmeans Genero*Categ / slice=Genero adjust=tukey PDIFF=all;
lsmeans Genero*Categ / slice=Categ adjust=tukey PDIFF=all;
run;*/


Variações do programa:
Proc glm;
class Genero Categ;
model IMC = Genero Categ Genero*Categ;

lsmeans Genero*Categ / slice=Genero adjust=tukey PDIFF=all;
lsmeans Genero*Categ / slice=Categ adjust=tukey PDIFF=all;
/*
lsmeans Categ;
means Categ / Tukey lines;

means Genero*Categ / tukey lines;
*/

run;



Para Calculo de Efeitos Principais:
Proc anova;
class Genero Categ;
model IMC = Genero Categ Genero*Categ;
means Categ / Tukey lines;

run;
Arquivo de Saida (Tipo Word) para download:




Fazer os gráficos no Excel utilizando tabela dinâmica.

Gráficos para comparação de Categorias de Atividade Física dentro de cada um dos níveis do Fator Gênero, ou seja comparação de Nível de Atividade Física dento do Gênero Feminino e mesma coisa dentro do Nível Masculino:






Agora colocando as Letras das Comparações Múltiplas:



Podemos ver que os gráficos são diferentes, e que as concussões estatísticas também o são.
Veja que no gráfico do gênero feminino professor e sedentário não diferem (as duas barras, medias aritméticas tem a letra A).
No gratifico do Gênero Masculino as categorias Sedentário Professor diferem (Sedentário tem letra A e Professor letra B).





Gráficos para Comparação entre Gêneros dentro de Categorias de Atividade Física:









Veja que tivemos resultados diferentes entre sexos, considerando as categorias Atletas e Professores:
No primeiro gráfico de comparação entre gêneros, dentro da categoria Atletas, temos que a media de Masculino foi maior do que Feminino e que não existem diferenças estatisticamente significativas entre os gêneros (somente a Letra A).
Essa inversão de medias e a falta de diferença significativa dentro do Nível Atleta para os Gêneros e diferença significativa entre os gêneros para a Categoria Professores, indicam a presença de interação, o que corrobora a significância de interação (p < 0.0063) no quadro de ANOVA.

No segundo gráfico para a categoria Professores, temos uma inversão de medias, a maior foi para o Gênero Feminino, sendo que a diferença é significativa estatisticamente.




Foto das Louças Onde Discutimos os Resultados







Agora Podemos Analisar o Fatorial como Um One Way ANOVA com 2*4 = 8 Níveis de um único fator:

Fazermos isso! Resultado para Download, colocar!

Exemplo Sem Interação Significativa

Autora: Ana Carolina Donofre (Dados simulados)





data fatorial;

input Linhagem $ Densidade $ GP;

cards;

C 10 2.44

C 10 2.39

C 10 2.42

C 10 2.45

C 14 2.03

C 14 1.99

C 14 2.05

C 14 2.07

C 18 1.78

C 18 1.83

C 18 1.81

C 18 1.73

R 10 2.37

R 10 2.30

R 10 2.34

R 10 2.38

R 14 1.88

R 14 1.90

R 14 1.87

R 14 1.92

R 18 1.65

R 18 1.69

R 18 1.70

R 18 1.67

;

proc print;

run;
Proc glm;
class Linhagem Densidade;
model GP = Linhagem Densidade Linhagem*Densidade;
/*
lsmeans Linhagem*Densidade / slice=Linhagem adjust=tukey PDIFF=all;
lsmeans Linhagem*Densidade/ slice=Densidade adjust=tukey PDIFF=all;
*/means Linhagem / Tukey lines;
means Densidade / Tukey lines;

run;

Arquivo para Download Sem Interação:



Resultados SAS Sem Interação







Outro Exemplo Sem Interação


data consumo;
input Trat $ Imp $ Cons;
cards;
1 a 17.2
1 a 18.3
1 a 17.5
1 a 18.4
1 b 20.3
1 b 21.3
1 b 22.1
1 b 19.5
2 a 22.1
2 a 23.5
2 a 24.5
2 a 21.5
2 b 25.5
2 b 26.4
2 b 27.3
2 b 26.1
3 a 20.2
3 a 23.2
3 a 21.5
3 a 20.1
3 b 22.2
3 b 22.3
3 b 24.5
3 b 26.1
4 a 19.8
4 a 18.8
4 a 19.5
4 a 20.2
4 b 24.3
4 b 23.4
4 b 22.1
4 b 22.7
;
proc print;
run;
proc glm;
class Trat Imp;
model Cons = Trat Imp Trat*Imp;
lsmeans Trat*Imp / slice=Trat adjust=tukey PDIFF=all;
lsmeans Trat*Imp / slice=Imp adjust=tukey PDIFF=all;
run;


/*
means Trat / tukey lines;
means Imp / tukey lines;
*/

Saida:
The SAS System

ObsTratImpCons
11a17.2
21a18.3
31a17.5
41a18.4
51b20.3
61b21.3
71b22.1
81b19.5
92a22.1
102a23.5
112a24.5
122a21.5
132b25.5
142b26.4
152b27.3
162b26.1
173a20.2
183a23.2
193a21.5
203a20.1
213b22.2
223b22.3
233b24.5
243b26.1
254a19.8
264a18.8
274a19.5
284a20.2
294b24.3
304b23.4
314b22.1
324b22.7



The SAS System

The ANOVA Procedure
Class Level Information
ClassLevelsValues
Trat41 2 3 4
Imp2a b


Number of Observations Read32
Number of Observations Used32




The SAS System

The ANOVA Procedure
Dependent Variable: Cons
SourceDFSum of SquaresMean SquareF ValuePr > F
Model7196.070000028.010000020.53<.0001
Error2432.75000001.3645833
Corrected Total31228.8200000


R-SquareCoeff VarRoot MSECons Mean
0.8568745.3218851.16815421.95000


SourceDFAnova SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088




The SAS System

The ANOVA Procedure





The SAS System

The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for Cons


Note:This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ.
Alpha0.05
Error Degrees of Freedom24
Error Mean Square1.364583
Critical Value of Studentized Range3.90126
Minimum Significant Difference1.6112


Means with the same letter
are not significantly different.
Tukey GroupingMeanNTrat
A24.612582
B22.512583
B
B21.350084
C19.325081




The SAS System

The ANOVA Procedure





The SAS System

The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for Cons


Note:This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ.
Alpha0.05
Error Degrees of Freedom24
Error Mean Square1.364583
Critical Value of Studentized Range2.91879
Minimum Significant Difference0.8524


Means with the same letter
are not significantly different.
Tukey GroupingMeanNImp
A23.506316b
B20.393816a



The SAS System

ObsTratImpCons
11a17.2
21a18.3
31a17.5
41a18.4
51b20.3
61b21.3
71b22.1
81b19.5
92a22.1
102a23.5
112a24.5
122a21.5
132b25.5
142b26.4
152b27.3
162b26.1
173a20.2
183a23.2
193a21.5
203a20.1
213b22.2
223b22.3
233b24.5
243b26.1
254a19.8
264a18.8
274a19.5
284a20.2
294b24.3
304b23.4
314b22.1
324b22.7



The SAS System

The GLM Procedure
Class Level Information
ClassLevelsValues
Trat41 2 3 4
Imp2a b


Number of Observations Read32
Number of Observations Used32




The SAS System

The GLM Procedure
Dependent Variable: Cons
SourceDFSum of SquaresMean SquareF ValuePr > F
Model7196.070000028.010000020.53<.0001
Error2432.75000001.3645833
Corrected Total31228.8200000


R-SquareCoeff VarRoot MSECons Mean
0.8568745.3218851.16815421.95000


SourceDFType I SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088


SourceDFType III SSMean SquareF ValuePr > F
Trat3117.247500039.082500028.64<.0001
Imp177.501250077.501250056.79<.0001
Trat*Imp31.32125000.44041670.320.8088







The SAS System

The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
TratImpCons LSMEANLSMEAN Number
1a17.85000001
1b20.80000002
2a22.90000003
2b26.32500004
3a21.25000005
3b23.77500006
4a19.57500007
4b23.12500008


Least Squares Means for effect Trat*Imp
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: Cons
i/j12345678
10.0282<.0001<.00010.0080<.00010.4493<.0001
20.02820.2256<.00010.99920.02630.80870.1378
3<.00010.22560.00740.50360.95930.00991.0000
4<.0001<.00010.0074<.00010.0803<.00010.0141
50.00800.99920.5036<.00010.08550.48530.3489
6<.00010.02630.95930.08030.08550.00080.9923
70.44930.80870.0099<.00010.48530.00080.0052
8<.00010.13781.00000.01410.34890.99230.0052













The SAS System

The GLM Procedure
Least Squares Means
Trat*Imp Effect Sliced by Trat for Cons
TratDFSum of SquaresMean SquareF ValuePr > F
1117.40500017.40500012.750.0015
2123.46125023.46125017.190.0004
3112.75125012.7512509.340.0054
4125.20500025.20500018.470.0002




The SAS System

The GLM Procedure
Least Squares Means
Adjustment for Multiple Comparisons: Tukey
TratImpCons LSMEANLSMEAN Number
1a17.85000001
1b20.80000002
2a22.90000003
2b26.32500004
3a21.25000005
3b23.77500006
4a19.57500007
4b23.12500008


Least Squares Means for effect Trat*Imp
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: Cons
i/j12345678
10.0282<.0001<.00010.0080<.00010.4493<.0001
20.02820.2256<.00010.99920.02630.80870.1378
3<.00010.22560.00740.50360.95930.00991.0000
4<.0001<.00010.0074<.00010.0803<.00010.0141
50.00800.99920.5036<.00010.08550.48530.3489
6<.00010.02630.95930.08030.08550.00080.9923
70.44930.80870.0099<.00010.48530.00080.0052
8<.00010.13781.00000.01410.34890.99230.0052













The SAS System

The GLM Procedure
Least Squares Means
Trat*Imp Effect Sliced by Imp for Cons
ImpDFSum of SquaresMean SquareF ValuePr > F
a356.62187518.87395813.83<.0001
b361.94687520.64895815.13<.0001


quarta-feira, 12 de junho de 2019

Horários de Consultas Skype e Whatsapp

Horários de Consultas Skype e Whatsapp

Valem também nas ferias!


hc_gabriel ---> Usuario Skype

Sabados: 14:15 as 15:15
Domingos: 21:15 as 23:15

Whatsapp: 019 - 988 - 627 - 438 

Não mandar texto, ligar por VOIP!

Videoaulas de Regressão - Macro em Excel - EXCEL AVANÇADO

Videoaulas de Regressão - Macro em Excel  - EXCEL AVANÇADO

Videoaula 1 - Resolvendo Graficamente e Sem Probabilidade ( Sem Macros em Excel)

https://www.youtube.com/watch?v=HWnrEfMHOZw&feature=youtu.be





Videoaula 2 - Resolvendo com Probabilidade, Margem de Erro e Margem de Confiança, Inferência Estatística - Macro de Regressão em Excel


https://www.youtube.com/watch?v=qLbziQKSeB8&feature=youtu.be


 Propaganda - Vendas 

Arquivo para Download




Regressão Linear é um dos modelos mais atrativos devido a sua representação entendível, no caso da regressão linear simples sua utilização é mais para aprendizado, já que na prática ela não é muito aplicada, visto que, em muitos casos a gama de variáveis de entradas é maior, fazendo-se uso da Regressão Linear Multivariável, ao qual não adentraremos nesse post. O modelo de representação da regressão linear simples é a tradicional equação conhecida como equação da reta ou em inglês slope-intercept form, usaremos a notação mais utilizada em exemplos de Machine Learning e não da matemática, mas você pode saber mais sobre a própria equação neste link.
Temos o y a variável dependente que representa a predição, as letras gregas β (Beta), também conhecidos como coeficientes, que são a representação das variáveis que o algoritmo irá utilizar para “aprender” a produzir as previsões mais precisas e o x a variável independente que representa o dado de entrada. As letras gregas β também são conhecidas como inclinação e interceptação ou em inglês intercept-slope.

Função de custo


Função de custo, no inglês cost function ou ainda ordinary least squares é uma função utilizada para medir o quão errado o modelo está, os chamados resíduos. Isto é, consiste no cálculo da distância de cada ponto (distância essa entre as variáveis x e y) em relação a reta de regressão, esse valor é elevado ao quadrado e somado, o total é a quantidade média de erro do modelo.

Projeto Inteligência Artificial, Ciência de Dados e Gestão Sistêmica & 4.0 - Quarta Revolução Industrial

https://ia-cd-gs-esalq-usp.blogspot.com/


Projeto Inteligência Artificial, Ciência de Dados e Gestão Sistêmica & 4.0 - Quarta Revolução Industrial















Coordenador: Prof. Gabriel Sarriés


- Estão todos convidados, acompanhem nosso blog (https://ia-cd-gs-esalq-usp.blogspot.com) e participem de nossas reuniões, próxima reuniao dia 10/7 (neste mês não da pelo fim do semestre) as 15h no Laboratório A do LCE ou por Youtube, ver endereço no blog do projeto, transmitiremos on line e também ficará gravado em streaming, gravado no blog;

- Estaremos discutindo permanentemente a forma de nos adaptar a esse Mundo da Inteligencia Artificial e da Industria, Gestão e Serviços 4.0, Quarta Revolução Industrial (Alemanha 2013);

- Surgirão e desaparecerão especialidades, mudanças profundas nas profissões, estaremos monitorando o mercado em parceria com o setor produtivo;



- Iremos orientar alunos de graduação e pós-graduação profissionalizante na implantação de ferramentas modernas em empresas, nessas duas situações vocês terão pleno acesso a todas as empresas, podemos ser coorientadores, flexibilidade total;


Temos contatos com universidades, empresas e institutos de pesquisa no Brasil e exterior:

Núcleo de Inovação Tecnológica Qualidade e Metrologia na Agropecuária NIT-Q&M (CENA-ESALQ-CNPq); CRM-Agro - Centro Colaborador em Defesa Agropecuária: Produção de Materiais de Referência  e Organização de Ensaios de Proficiência para Agricultura, Pecuária e Toxicologia (CENA – ESALQ / USP EMBRAPA, FCFRP  MAPA e CNPq). Brazilian Satellite Centre of Trace Element Institute for UNESCO BSC/UNESCO, Laboratório de Radioisótopos do CENA (ISO 17025), Instituto de Matemática e Ciência da Computação de São Carlos da USP (Estatística, Inteligencia Artificial e Ciência de Dados); Laboratório de Análises Estatísticas do Departamento de Ciências Exatas da ESALQ/USP , CERTI (fundação para Inovação, Hiperinovação, Competitividade e Metrologia de Floreanólopis), IPT, INMETRO, NIST (maior instituto de padronização do mundo, temos uma integrante do projeto fazendo parte do posdutorado no NIST), Delft University, International Atomic Energy Agency (IAEA), American Nuclear Society (ANS), International Committee on Activation Analysis (ICAA) Inorganic Analytical Working Group (IAWG), Consultative Committee for Amount of Substance (CCQM), Bureau International des Poids et Mesures (BIPM), BRICS (projetos de pesquisa em conjunto), Núcleo de Pesquisa em Tecnologia e Inovação para Sustentabilidade da Agricultura - NAPTISA - CENA/USP, Fundação Getúlio Vargas, UNIMEP, Universidad de Buenos Aires (UBA) Fundación Barcelo (Medicina), Universidad Nacional de Arequipa Peru (Economia, Administración e Ingenierias), Informa Economics (maior empresa de informação de agribusines), Sky (AT&T, maior empresa de comunições), Hospital Albert Einstein (cardiologia), Raizen (maior empresa de açúcar e álcool do mundo), JBS (maior empresa de processamento de carne do mundo), Free Boi,  Nestle, Beef Pasion, Limex, Faz, M&Q Solutions, Ikom, Sanavita, Bioagri, Monsanto, Nestle, Unilever, Danone, Cargill (maior empresa do agronegócio brasileiro e uma das maiores do mundo), Aprosoja (uma das maiores associações de produtores de soja e milho do mundo), Fundação Mato Groso (produtores de genética de soja no Centro Oeste do Brasil), HOLAMBRA (flores e grãos), Sindicato Patronal de Primavera do Leste MT (grandes produtores de soja, milho e boi), Jacto (multinacional de maquinas agrícolas com matriz no Brasil),  Viação Piracicabana (TQM Toyota ISO 9001-14001, Universidade do Ônibus, referencia nacional), GOL (aviação), Viação Limeirense, Siemens, Petrobras, Shell, Madeireira Martins, Grupo Lúcio Miranda (Soja-Milho-Trigo-Aveia-Boi, 14 fazendas e uma transportadora), AIEA - Agencia Internacional de Energia Atômica (Peter Bode - meu Coach-ISO 17025 - ha 28 anos-Fukushima tsunami, reatores nucleares- Irão, auditoria de laboratórios que trabalham com energia nuclear), etc.

- Estamos convidando a todos os professores da ESALQ e CENA  a participar do projeto, também de outras universidades, empresas e institutos de pesquisa.

- Pretendo trabalhar neste projeto ate ficar gaga, não como coordenador, é muito ambicioso e eu estou na ultima parte da carreira, porem no momento não conheço ninguém na USP de Piracicaba que tenha meu conhecimento como para coordenar este projeto, logicamente nos próximos anos as pessoas se qualificarão, quero delegar a coordenação o antes possível;

- Já tentei colocar outro coordenador mas as pessoas não se sentem preparadas ainda, são áreas muito amplas, tal vez de aqui a um ou dois anos;