quarta-feira, 31 de março de 2021

Tomada de Decisão em Inteligência Organizacional - E-Book e Videoaulas - Outro Exemplo Limitrofe

 







Tomada de Decisão em Inteligência Organizacional



Videoaula 1






Videoaula 2






Livro Básico - Infer. Estat. Indutiva - Download












- Exemplo: Arquivo do Excel para Download:

           







Aparentemente há diferenças, as medias aritméticas são diferentes, umas maiores ou menores que as outras. Por exemplo o DBO da Área Urbana é 9,7 mg/l e da Área Semiurbana 7,2 mg/l. Essa informação é suficiente para tomar a decisão de falar que são diferentes?

Não, essa diferença de medias aritméticas é matemática, 


não estatística, para falar que são diferentes devemos


 aplicar um teste de hipótese estatístico (que faz parte da


 Inferência Estatística Indutiva), por exemplo o Teste T de


 Student (se os dados tiverem distribuição Normal) ou U de


 Mann–Whitney (Estatística Robusta) se tivermos problemas


 de normalidade, heterocedasticidade ou presença de 


outliers (dados fora de contexto), o se simplesmente não


 quisermos ou podermos, testar todas essas pressuposições.


Esses testes nos fornecerão uma Margem de Erro (probabilidade) e uma Margem de Confiança, para tomarmos a decisão da melhor maneira possível, por exemplo em ciência (teses, papers, congressos. Etc.) não são aceitas as tomadas de decisão sem os endossos probabilísticos. Tambem é assim na área de gestão, desde a segunda gerra mundial (E. Deming), em EUA e Japão.


OK, vamos fazer a primeira analise desses dados no Excel, utilizando macros analíticas (programas dentro do programa Excel). Uma dessas macros é Teste T de Student para Duas Amostras Independente com Variâncias Desconhecidas.

O teste T é a ferramenta mais importante para a tomada de decisão em gestão, inteligência e certificação internacional da qualidade.
Na área de pesquisa a principal ferramenta de tomada de decisão é ANOVA. ANOVA é uma generalização do Teste T, quando existem mais do que dois níveis do fator tratamentos, o Teste T é somente para dois níveis.



Em primeira instancia devemos ativar as macros analíticas do Excel, normalmente compramos o Excel e utilizamos somente uma parte dele, o mais frequente é não estarem ativadas (como comprar um apartamento de 3 quartos e utilizar somente um ou dois), nos departamentos, laboratóriosempresas, etc.





·      Ho: Hipótese de Nulidade ou de Igualdade
o    DBO Reg. Urbana = DBO Reg. Semiurbana
o    DBO Reg. Urbana - DBO Reg. Semiurbana = 0
o     
·      H1:  Hipótese de Alternativa
o    H1a: Uni caudal: 
§  DBO Reg. Urbana > DBO Reg. Semiurbana
o    H1b: Bicaudal:
§  DBO Reg. Urbana    ≠ DBO Reg. Semiur.
·         H1a: Uni caudal - Demanda Informação Confiável Previa
·         H1b: Bicaudal - Sem Informação Previa

Teste-t: duas amostras presumindo variâncias diferentes
DBO - Urbana
DBO Semiurbana
Média
9,666667
7,166666667
Variância
2,333333
1,583333333
Observações
3
3
Hipótese da diferença de média
0
gl
4
Stat t
2,187975
P(T<=t) uni-caudal
0,046952
Margem de Erro
t crítico uni-caudal
2,131847
P(T<=t) bi-caudal
0,093904
Margem de Erro
t crítico bi-caudal
2,776445


Margem de Erro Uni caudal =4,7 %      
  • Demanda Informação Previa Confiável
    • Publicação (Academia)    
    •  Sumario Executivo (Empresa Privada)                                     

                                                                                                         
Margem de Erro Bi caudal = 9,4   %       

  • Não Demanda Informação Previa Confiável                

Resultados e Discussão (de um documento cientifico – Iniciação, TCC, Mestrado, Doutorado, Pós-doutorado, publicação):
Com Informação Previa Confiável:
A média aritmética para DBO dos ribeirões da região urbana (9,7 mg/l) foi maior significativamente ( p <  0,04695) do que media dos ribeirões da região semiurbana ( 7,2 mg/l).
Sem Informação Previa Confiável:
Não foram conseguidos argumentos suficientes para se rejeitar a hipótese de igualdade ( p < 0,093904151)

Sumario Executivo (Empresa):
Com Informação Previa Confiável:
O DBO da área urbana (9,7 ) é maior do que o DBO da área semiurbana (7,2) com 95,3% de confiança;

Sem Informação Previa Confiável:
Não existe evidencia significativa de diferença na quantidade de DBO nas duas situações analisadas (margem de confiança insuficiente 91%)

Segunda Aula 2021 - 31/3/2021

Link Permanente (Google Meet):  zwz-pbzr-qkx


Vídeo I

https://youtu.be/hUztW3rylXo

 

Vídeo II

https://youtu.be/RDBY9BYyKjA



Horários de Consulta:

    - Quintas das 20 às 22

    - Sábados: das 18 às 20



Pauta de Hoje:

- Conceito de Outlier

- Exemplo da detecção do Outlier e Problemas para Análises Estatísticas Tradicionais (resolveremos eliminado os outliers ou utilizando Estatística Robusta - IA e Sistema ISO)

- Os alunos mais adiantados podem ver as videoaulas e acompanhar de SAS e ML Supervisionado para Previsão



Machine Learning Supervisionado para Regressão - Previsão

 Machine Learning para Predisão - Regressão 



Videoaulas:

https://youtu.be/ezt10vjCWE8

https://youtu.be/6F8bK93AxyM

https://youtu.be/uYhF1yQLsJ8


Apostila em pdf:

http://walderson.com/site/wp-content/uploads/2017/02/WEKA.Pratica-1.pdf























Machine Learning Supervicionado para Regressão - Precificação - Weka - SAS - Excel


Dados da Apostila:

 

 

Tam. Casa

Tam. Lote

Quartos 

Granito 

Banh. Ref

Preço

3529

9191

6

0

0

205000

3247

10061

5

1

1

224900

4032

10150

5

0

1

197900

2397

14156

4

1

0

189900

2200

9600

4

0

1

195000

3536

19994

6

1

1

325000

2983

9365

5

0

1

230000

 


Programa SAS (Estatistica Tradicional e Moderna-Robusta)

data casa;

input Tam_Casa Tam_Lot Quartos Granito Banheiro Valor Valor_Aj;

cards;

3529 9191 6 0 0 205 205000

3247 10061 5 1 1 224.9 224900

4032 10150 5 0 1 197.9 197900

2397 14156 4 1 0 189.9 189900

2200 9600 4 0 1 195 195000

3536 19994 6 1 1 325 325000

2983 9365 5 0 1 230 230000

;

proc print;

run;

proc reg;

model Valor_Aj = Tam_Casa Tam_Lot Quartos Granito Banheiro;

run;

proc robustreg;

model Valor_Aj = Tam_Casa Tam_Lot Quartos Granito Banheiro;

run;




Saida do Excel para Regressão Multipla Tradicional






Programa do Weka


Arquivo Weka com Dados Simulados Computacionalmente - Aplificar Tamanaho da Amostra (Monte Carlo - Bootstraping - 

Jackknife etc.)


Para Weka não acusar Erro, por poucas linhas no arquivo de dados



@RELATION Precifica

@ATTRIBUTE Tam_Cas REAL

@ATTRIBUTE Tam_Terre REAL

@ATTRIBUTE Quartos REAL

@ATTRIBUTE Granito REAL

@ATTRIBUTE Banh_Refor REAL


@ATTRIBUTE Preco REAL

@DATA

3529,9191,6,0,0,205
3247,10061,5,1,1,224.9
4032,10150,5,0,1,197.9
2397,14156,4,1,0,189.9
2200,9600,4,0,1,195
3536,19994,6,1,1,325
2983,9365,5,0,1,230
3388,9626,6,0,0,214.95
3639.5,10105.5,5,1,1,211.4
3214.5,12153,5,0,1,193.9
2298.5,11878,4,1,0,192.45
2868,14797,4,0,1,260
3259.5,14679.5,6,1,1,277.5























Exemplo na área Económica para utilizar Machine Learning Supervisionado para Regressão - Previsão, rode o exemplo no Weka. Rode também o exemplo no SAS e Excel (Utilizando Macro de Regressão). Interprete os resultados.

Dead Line: 15/12/2020


Exemplo Criado en Sala de Aulas para o Exercicio 9:


@RELATION cat


@ATTRIBUTE receita REAL

@ATTRIBUTE custo REAL

@ATTRIBUTE nps REAL

@ATTRIBUTE inovacao REAL

@ATTRIBUTE reclam REAL

@ATTRIBUTE categ {B,R,MB}


@DATA  


5,2,4,5,3,B

3,4,5,4,5,B

4,3,4.5,4.5,4,B

2,2,1,3,1,R

3,2,2,2,5,R

2.5,2,1.5,2.5,3,R

5,4,5,5,5,MB

4,3,5,5,4,MB

4.5,3.5,5,5,4.5,MB

5,2,4,5,3,B

3,4,5,4,5,B

4,3,4.5,4.5,4,B

2,2,1,3,1,R

3,2,2,2,5,R

2.5,2,1.5,2.5,3,R

5,4,5,5,5,MB

4,3,5,5,4,MB

4.5,3.5,5,5,4.5,MB


Modificação do Exercício 9 para ser um exemplo do Exercício 10

 

@RELATION cat

 

@ATTRIBUTE receita REAL

@ATTRIBUTE custo REAL

@ATTRIBUTE nps REAL

@ATTRIBUTE inovacao REAL

@ATTRIBUTE reclam REAL

@ATTRIBUTE categ REAL

 

@DATA  

 

 

5,2,4,5,3,2

3,4,5,4,5,2

4,3,4.5,4.5,4,2

2,2,1,3,1,1

3,2,2,2,5,1

2.5,2,1.5,2.5,3,1

5,4,5,5,5,3

4,3,5,5,4,3

4.5,3.5,5,5,4.5,3

5,2,4,5,3,2

3,4,5,4,5,2

4,3,4.5,4.5,4,2

2,2,1,3,1,1

3,2,2,2,5,1

2.5,2,1.5,2.5,3,1

5,4,5,5,5,3

4,3,5,5,4,3

4.5,3.5,5,5,4.5,3

 

 


 Modelo Estimado (Inferencia Indutiva), ML Supervicionaldo para Regressão - Prev.



 categ =

 

      0.3097 * receita +

      0.3456 * custo +

      0.2356 * nps +

     -0.1363 * reclam è Trabalhando Mal +

     -0.4559