quarta-feira, 18 de março de 2015

Aula III (25/3) - Tomada de Decisão



- Pessoal de Rio Claro e Cabo Frio Instalar o SAS de Estudantes, utilizaremos em 2 ou 3 semanas.

- Não Aulas em Semana Santa





Tomada de Decisão em Pesquisa e Inteligência Organizacional


Livro Básico - Infer. Estat. Indutiva - Download












- Exemplo: Arquivo do Excel para Download:

           







Aparentemente há diferenças, as medias aritméticas são diferentes, umas maiores ou menores que as outras. Por exemplo o DBO da Área Urbana é 9,7 mg/l e da Área Semiurbana 7,2 mg/l. Essa informação é suficiente para tomar a decisão de falar que são diferentes?

Não, essa diferença de medias aritméticas é matemática, não estatística, para falar que são diferentes devemos aplicar um teste de hipótese estatístico (que faz parte da Inferência Estatística Indutiva), por exemplo o Teste T de Student (se os dados tiverem distribuição Normal) ou U de Mann–Whitney (Estatística Robusta) se tivermos problemas de normalidade, heterocedasticidade ou presença de outliers (dados fora de contexto), o se simplesmente não quisermos ou podermos, testar todas essas pressuposições.


Esses testes nos fornecerão uma Margem de Erro (probabilidade) e uma Margem de Confiança, para tomarmos a decisão da melhor maneira possível, por exemplo em ciência (teses, papers, congressos. Etc.) não são aceitas as tomadas de decisão sem os endossos probabilísticos.


OK, vamos fazer a primeira analise desses dados no Excel, utilizando macros analíticas (programas dentro do programa Excel). Uma dessas macros é Teste T de Student para Duas Amostras Independente com Variâncias Desconhecidas.

O teste T é a ferramenta mais importante para a tomada de decisão em gestão, inteligência e certificação internacional da qualidade.
Na área de pesquisa a principal ferramenta de tomada de decisão é ANOVA. ANOVA é uma generalização do Teste T, quando existem mais do que dois níveis do fator tratamentos, o Teste T é somente para dois níveis.



Em primeira instancia devemos ativar as macros analíticas do Excel, normalmente compramos o Excel e utilizamos somente uma parte dele, o mais frequente é não estarem ativadas (como comprar um apartamento de 3 quartos e utilizar somente um ou dois), nos departamentos, laboratóriosempresas, etc.



Vídeo para Ativar as Macros Analíticas do Excel:





Vídeo para Rodar a Macro Analitica Teste T de Student para Amostras Independentes em Excel:








·      Ho: Hipótese de Nulidade ou de Igualdade
o    DBO Reg. Urbana = DBO Reg. Semiurbana
o    DBO Reg. Urbana - DBO Reg. Semiurbana = 0
o     
·      H1:  Hipótese de Alternativa
o    H1a: Uni caudal: 
§  DBO Reg. Urbana > DBO Reg. Semiurbana
o    H1b: Bicaudal:
§  DBO Reg. Urbana    ≠ DBO Reg. Semiur.
·         H1a: Uni caudal - Demanda Informação Confiável Previa
·         H1b: Bicaudal - Sem Informação Previa

Teste-t: duas amostras presumindo variâncias diferentes
DBO - Urbana
DBO Semiurbana
Média
9,666667
7,166666667
Variância
2,333333
1,583333333
Observações
3
3
Hipótese da diferença de média
0
gl
4
Stat t
2,187975
P(T<=t) uni-caudal
0,046952
Margem de Erro
t crítico uni-caudal
2,131847
P(T<=t) bi-caudal
0,093904
Margem de Erro
t crítico bi-caudal
2,776445


Margem de Erro Uni caudal =4,7 %      
  • Demanda Informação Previa Confiável
    • Publicação (Academia)    
    •  Sumario Executivo (Empresa Privada)                                     

                                                                                                         
Margem de Erro Bi caudal = 9,4   %       

  • Não Demanda Informação Previa Confiável                

Resultados e Discussão (de um documento cientifico – Iniciação, TCC, Mestrado, Doutorado, Pós-doutorado, publicação):
Com Informação Previa Confiável:
A média aritmética para DBO dos ribeirões da região urbana (9,7 mg/l) foi maior significativamente ( p <  0,04695) do que media dos ribeirões da região semiurbana ( 7,2 mg/l).
Sem Informação Previa Confiável:
Não foram conseguidos argumentos suficientes para se rejeitar a hipótese de igualdade ( p < 0,093904151)


Tabela 32: Erros possíveis associados a teste de hipóteses
SituaçãoConclusão do teste
realRejeitar $ H_0$Não rejeitar $ H_0$
$ H_0$ Verdadeiraerro tipo Idecisão correta
$ H_0$ Falsadecisão corretaerro tipo II


Sumario Executivo (Empresa):
Com Informação Previa Confiável:
O DBO da área urbana (9,7 ) é maior do que o DBO da área semiurbana (7,2) com 95,3% de confiança;

Sem Informação Previa Confiável:
Não existe evidencia significativa de diferença na quantidade de DBO nas duas situações analisadas (margem de confiança insuficiente 91%)







Exercício  III - Tomada de Decisão em Pesquisa, Inteligencia Organizacional, etc. DL 1/4/2015


      

Exercícios Atualizados

Exercícios Atualizados

Horários de Consulta

Nos Laboratórios A, B ou C do Departamento de Ciências Exatas ou no Skype hc_gabriel.
Conformar presença com antecedência com o Gabriel, no Skype será publicada qualquer restrição de horários esporádicas (por bancas, reuniões de conselho, etc.)

Quintas e Sextas das 15 as 17
Sábados das 14 as 15.

Mandar para o e-mail:
estat.robus.esalq@gmail.com
codigo 09 ou 08
Telefones:
    - 34294144 Ramal 227 - Mayara
    - Vivo: 99663-0402
   
    - Recados em Whatsapp (Oi):
       Eric - 988005351


Exercício 1Criar um exemplo para utilização de regressão Linear (crescente ou decrescente). DL (Prazo):  1 / 4 / 2015.

Exercício 2. Criar um exemplo para utilização de regressão Polinomial (Grau II, parábola). DL (Prazo):  8 / 4 / 2015.




Exercício 3. Teste T para Amostras Independentes, criar um exemplo individual DL: 29/4



Exercício 4 Teste T para Amostras Pareadas, criar um exemplo individual DL: 29/4


Exercício 5 - Elaborar um exemplo para aplicar Gráfico de ParetoDL: 29/4

Exercício 6 - Elaborar um exemplo para aplicar ANOVA e Teste de Compara coes Múltiplas de TukeyDL: 29/4 (para Piracicaba e Cabo Frio).

Exercício 7 - Elaborar um exemplo para aplicar MANOVA e Cluster Analysis. DL: 3/6


Exercício 8 - Elaborar um exemplo para aplicar RANOVA ONE WAY e Teste de Comparações Múltiplas (Kruskal Wallis). DL: 3/6.


Exercício 9 - Elaborar um exemplo para aplicar Gráfico de Controle de Processos. DL: 10/6.










segunda-feira, 16 de março de 2015

Aula II (18/3/2015) – Regr. Polinomial e Tomada de Decisão

Aula II de Regressão (18/3/2015) – Regr. Polinomial e Tomada de Decisão


Regr. Polinomial 



Este exemplo relaciona nível salarial e qualidade de vida. Os dados são fictícios. 
Dados do Exemplo


Salário (US$)
Q.Vida (0-10)
1460
8,1
1575
8,1
1689
8,2
1900
8,5
2150
8,6
2320
8,6
2467
8,6
3000
8,6
3400
8,4
3500
8,4
3900
8,4





Vemos no Diagrama de Dispersão dos Dados, que eles seguem uma distribuição que apresenta curvatura, assim não podemos utilizar o polinômio de primeiro grau, a reta. Podemos tentar ajustar um polinômio de segundo grau, uma parábola.


Vídeo contendo a da sequencia de passos para realizar uma regressão quadrática, clicar no arquivo a seguir:







Resultado da Analise





O modelo ajustado pode ser considerado muito bom (R² = 0,8116). 
Agora acharemos o ponto de Maximo, ou seja qual salário maximiza a qualidade de vida, segundo os dados deste exemplo.
Para calcularmos o ponto de Maximo, temos que derivar o polinômio e igualar o resultado a zero.
Polinômio derivado:
Y’ = (-3E-07x2 + 0,0017x + 6,3124)’ =
    = -3E-07* 2 * x + 0,0017 = 0
Assim  x = -0,0017 / (-3E-07* 2) = 2833,3 US$ é o salário que maximiza a função polinomial.








Tomada de Decisão em Pesquisa e Inteligência Organizacional


Livro Básico - Infer. Estat. Indutiva - Download












- Exemplo: Arquivo do Excel para Download:

           







Aparentemente há diferenças, as medias aritméticas são diferentes, umas maiores ou menores que as outras. Por exemplo o DBO da Área Urbana é 9,7 mg/l e da Área Semiurbana 7,2 mg/l. Essa informação é suficiente para tomar a decisão de falar que são diferentes?

Não, essa diferença de medias aritméticas é matemática, não estatística, para falar que são diferentes devemos aplicar um teste de hipótese estatístico (que faz parte da Inferência Estatística Indutiva), por exemplo o Teste T de Student (se os dados tiverem distribuição Normal) ou U de Mann–Whitney (Estatística Robusta) se tivermos problemas de normalidade, heterocedasticidade ou presença de outliers (dados fora de contexto), o se simplesmente não quisermos ou podermos, testar todas essas pressuposições.


Esses testes nos fornecerão uma Margem de Erro (probabilidade) e uma Margem de Confiança, para tomarmos a decisão da melhor maneira possível, por exemplo em ciência (teses, papers, congressos. Etc.) não são aceitas as tomadas de decisão sem os endossos probabilísticos.


OK, vamos fazer a primeira analise desses dados no Excel, utilizando macros analíticas (programas dentro do programa Excel). Uma dessas macros é Teste T de Student para Duas Amostras Independente com Variâncias Desconhecidas.

O teste T é a ferramenta mais importante para a tomada de decisão em gestão, inteligência e certificação internacional da qualidade.
Na área de pesquisa a principal ferramenta de tomada de decisão é ANOVA. ANOVA é uma generalização do Teste T, quando existem mais do que dois níveis do fator tratamentos, o Teste T é somente para dois níveis.



Em primeira instancia devemos ativar as macros analíticas do Excel, normalmente compramos o Excel e utilizamos somente uma parte dele, o mais frequente é não estarem ativadas (como comprar um apartamento de 3 quartos e utilizar somente um ou dois), nos departamentos, laboratóriosempresas, etc.



Vídeo para Ativar as Macros Analíticas do Excel:





Vídeo para Rodar a Macro Analitica Teste T de Student para Amostras Independentes em Excel:








·      Ho: Hipótese de Nulidade ou de Igualdade
o    DBO Reg. Urbana = DBO Reg. Semiurbana
o    DBO Reg. Urbana - DBO Reg. Semiurbana = 0
o     
·      H1:  Hipótese de Alternativa
o    H1a: Uni caudal: 
§  DBO Reg. Urbana > DBO Reg. Semiurbana
o    H1b: Bicaudal:
§  DBO Reg. Urbana    ≠ DBO Reg. Semiur.
·         H1a: Uni caudal - Demanda Informação Confiável Previa
·         H1b: Bicaudal - Sem Informação Previa

Teste-t: duas amostras presumindo variâncias diferentes
DBO - Urbana
DBO Semiurbana
Média
9,666667
7,166666667
Variância
2,333333
1,583333333
Observações
3
3
Hipótese da diferença de média
0
gl
4
Stat t
2,187975
P(T<=t) uni-caudal
0,046952
Margem de Erro
t crítico uni-caudal
2,131847
P(T<=t) bi-caudal
0,093904
Margem de Erro
t crítico bi-caudal
2,776445



Margem de Erro Uni caudal =4,7 %      
  • Demanda Informação Previa Confiável
    • Publicação (Academia)    
    •  Sumario Executivo (Empresa Privada)                                     

                                                                                                         
Margem de Erro Bi caudal = 9,4   %       

  • Não Demanda Informação Previa Confiável                



Resultados e Discussão (de um documento cientifico – Iniciação, TCC, Mestrado, Doutorado, Pós-doutorado, publicação):
Com Informação Previa Confiável:
A média aritmética para DBO dos ribeirões da região urbana (9,7 mg/l) foi maior significativamente ( p <  0,04695) do que media dos ribeirões da região semiurbana ( 7,2 mg/l).
Sem Informação Previa Confiável:
Não foram conseguidos argumentos suficientes para se rejeitar a hipótese de igualdade ( p < 0,093904151)

Sumario Executivo (Empresa):
Com Informação Previa Confiável:
O DBO da área urbana (9,7 ) é maior do que o DBO da área semiurbana (7,2) com 95,3% de confiança;

Sem Informação Previa Confiável:
Não existe evidencia significativa de diferença na quantidade de DBO nas duas situações analisadas (margem de confiança insuficiente 91%)







Exercício  III - Tomada de Decisão em Pesquisa, Inteligencia Organizacional, etc. DL 1/4/2015