segunda-feira, 16 de março de 2015

Aula II (18/3/2015) – Regr. Polinomial e Tomada de Decisão

Aula II de Regressão (18/3/2015) – Regr. Polinomial e Tomada de Decisão


Regr. Polinomial 



Este exemplo relaciona nível salarial e qualidade de vida. Os dados são fictícios. 
Dados do Exemplo


Salário (US$)
Q.Vida (0-10)
1460
8,1
1575
8,1
1689
8,2
1900
8,5
2150
8,6
2320
8,6
2467
8,6
3000
8,6
3400
8,4
3500
8,4
3900
8,4





Vemos no Diagrama de Dispersão dos Dados, que eles seguem uma distribuição que apresenta curvatura, assim não podemos utilizar o polinômio de primeiro grau, a reta. Podemos tentar ajustar um polinômio de segundo grau, uma parábola.


Vídeo contendo a da sequencia de passos para realizar uma regressão quadrática, clicar no arquivo a seguir:







Resultado da Analise





O modelo ajustado pode ser considerado muito bom (R² = 0,8116). 
Agora acharemos o ponto de Maximo, ou seja qual salário maximiza a qualidade de vida, segundo os dados deste exemplo.
Para calcularmos o ponto de Maximo, temos que derivar o polinômio e igualar o resultado a zero.
Polinômio derivado:
Y’ = (-3E-07x2 + 0,0017x + 6,3124)’ =
    = -3E-07* 2 * x + 0,0017 = 0
Assim  x = -0,0017 / (-3E-07* 2) = 2833,3 US$ é o salário que maximiza a função polinomial.








Tomada de Decisão em Pesquisa e Inteligência Organizacional


Livro Básico - Infer. Estat. Indutiva - Download












- Exemplo: Arquivo do Excel para Download:

           







Aparentemente há diferenças, as medias aritméticas são diferentes, umas maiores ou menores que as outras. Por exemplo o DBO da Área Urbana é 9,7 mg/l e da Área Semiurbana 7,2 mg/l. Essa informação é suficiente para tomar a decisão de falar que são diferentes?

Não, essa diferença de medias aritméticas é matemática, não estatística, para falar que são diferentes devemos aplicar um teste de hipótese estatístico (que faz parte da Inferência Estatística Indutiva), por exemplo o Teste T de Student (se os dados tiverem distribuição Normal) ou U de Mann–Whitney (Estatística Robusta) se tivermos problemas de normalidade, heterocedasticidade ou presença de outliers (dados fora de contexto), o se simplesmente não quisermos ou podermos, testar todas essas pressuposições.


Esses testes nos fornecerão uma Margem de Erro (probabilidade) e uma Margem de Confiança, para tomarmos a decisão da melhor maneira possível, por exemplo em ciência (teses, papers, congressos. Etc.) não são aceitas as tomadas de decisão sem os endossos probabilísticos.


OK, vamos fazer a primeira analise desses dados no Excel, utilizando macros analíticas (programas dentro do programa Excel). Uma dessas macros é Teste T de Student para Duas Amostras Independente com Variâncias Desconhecidas.

O teste T é a ferramenta mais importante para a tomada de decisão em gestão, inteligência e certificação internacional da qualidade.
Na área de pesquisa a principal ferramenta de tomada de decisão é ANOVA. ANOVA é uma generalização do Teste T, quando existem mais do que dois níveis do fator tratamentos, o Teste T é somente para dois níveis.



Em primeira instancia devemos ativar as macros analíticas do Excel, normalmente compramos o Excel e utilizamos somente uma parte dele, o mais frequente é não estarem ativadas (como comprar um apartamento de 3 quartos e utilizar somente um ou dois), nos departamentos, laboratóriosempresas, etc.



Vídeo para Ativar as Macros Analíticas do Excel:





Vídeo para Rodar a Macro Analitica Teste T de Student para Amostras Independentes em Excel:








·      Ho: Hipótese de Nulidade ou de Igualdade
o    DBO Reg. Urbana = DBO Reg. Semiurbana
o    DBO Reg. Urbana - DBO Reg. Semiurbana = 0
o     
·      H1:  Hipótese de Alternativa
o    H1a: Uni caudal: 
§  DBO Reg. Urbana > DBO Reg. Semiurbana
o    H1b: Bicaudal:
§  DBO Reg. Urbana    ≠ DBO Reg. Semiur.
·         H1a: Uni caudal - Demanda Informação Confiável Previa
·         H1b: Bicaudal - Sem Informação Previa

Teste-t: duas amostras presumindo variâncias diferentes
DBO - Urbana
DBO Semiurbana
Média
9,666667
7,166666667
Variância
2,333333
1,583333333
Observações
3
3
Hipótese da diferença de média
0
gl
4
Stat t
2,187975
P(T<=t) uni-caudal
0,046952
Margem de Erro
t crítico uni-caudal
2,131847
P(T<=t) bi-caudal
0,093904
Margem de Erro
t crítico bi-caudal
2,776445



Margem de Erro Uni caudal =4,7 %      
  • Demanda Informação Previa Confiável
    • Publicação (Academia)    
    •  Sumario Executivo (Empresa Privada)                                     

                                                                                                         
Margem de Erro Bi caudal = 9,4   %       

  • Não Demanda Informação Previa Confiável                



Resultados e Discussão (de um documento cientifico – Iniciação, TCC, Mestrado, Doutorado, Pós-doutorado, publicação):
Com Informação Previa Confiável:
A média aritmética para DBO dos ribeirões da região urbana (9,7 mg/l) foi maior significativamente ( p <  0,04695) do que media dos ribeirões da região semiurbana ( 7,2 mg/l).
Sem Informação Previa Confiável:
Não foram conseguidos argumentos suficientes para se rejeitar a hipótese de igualdade ( p < 0,093904151)

Sumario Executivo (Empresa):
Com Informação Previa Confiável:
O DBO da área urbana (9,7 ) é maior do que o DBO da área semiurbana (7,2) com 95,3% de confiança;

Sem Informação Previa Confiável:
Não existe evidencia significativa de diferença na quantidade de DBO nas duas situações analisadas (margem de confiança insuficiente 91%)







Exercício  III - Tomada de Decisão em Pesquisa, Inteligencia Organizacional, etc. DL 1/4/2015


      

Nenhum comentário:

Postar um comentário