quarta-feira, 31 de março de 2021

Trabalhando com Outliers (dados fora de contexto) no Excel

 Primeiro Caso - Dados Sem Outliers


Box and wisker plot - Wikipedia



Dados Normais - Sem Outliers

 

 

 

Especie

Orelha

0

5

0

6

0

5,5

0

5,2

0

5

0

6

0

5,5

0

5,2

1

4,6

1

4,5

1

5

1

4,7

1

4,6

1

4,5

1

5

1

4,7



Box and Wisker Plots








Teste T por Macro em Excel

Teste-t: duas amostras presumindo variâncias diferentes

 

 

 

 

Não Transmite

Transmite

Média

5,425

4,7

Variância

0,162

0,04

Observações

8

8

Hipótese da diferença de média

0

 

gl

10

 

Stat t

4,561

 

P(T<=t) uni-caudal

5E-04

 < 0,05

t crítico uni-caudal

1,812

 

P(T<=t) bi-caudal

0,001

 <0,05

t crítico bi-caudal

2,228

 


Empresas – Sumario Executivo

Com 99,99% de confiança afirmamos que as medias aritméticas do cumprimento das orelhas das duas espécies de ratos são diferentes, assim essa variável preditora pode ser utilizada nos algoritmos de IA para identificar ratos a campo.

 

Universidade – Resultados e Discussão

As medias de cumprimento nas duas espécies são diferentes do ponto de vista estatístico ( p < 0,001)

 

Assim utilizaremos essa variável Preditora: Tamanho da Orelha para a Inteligência Artificial









Segundo Caso - Dados com 
Um Outlier

 Espécie 0 - Não Transmite - Sem Outlier


Espécie

Orelha

0

5

0

6

0

5,5

0

5,2

0

5

0

6

0

5,5

0

5,2


         
 

                              Espécie 1 - Transmite - Com Um Outlier

Transm.

Orelha

1

4,6

1

4,5

1

5

1

4,7

1

4,6

1

25,7

1

5

1

4,7



 

 

 

 

 

Probabilidade

 

 

 

 

 

0,02

0,01

0,0026

Transm.

Orelha

Padao-Z

Média

Md

2,32  ỡ

2,64  ỡ

3  ỡ

1

4,6

-0,37078

0

-0,3573

2,32

2,64

3

1

4,5

-0,38426

0

-0,3573

2,32

2,64

3

1

5

-0,31685

0

-0,3573

2,32

2,64

3

1

4,7

-0,3573

0

-0,3573

2,32

2,64

3

1

4,6

-0,37078

0

-0,3573

2,32

2,64

3

1

25,7

2,474121

0

-0,3573

2,32

2,64

3

1

5

-0,31685

0

-0,3573

2,32

2,64

3

1

4,7

-0,3573

0

-0,3573

2,32

2,64

3

Media=

7,35

-0,3573

 =Mediana

 

 

 

Desvio=

7,416776

0,0000

 = Média

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,474121

Único > 0

 

 

 

 

 

 

 

Média = 0

 

 

 

 




             Box and Wisker Plots







Gráfico de Controle de Shewhart para Outliers








Teste T incorreto pela presença do Outlier



Teste-t: duas amostras presumindo variâncias diferentes

 

 

 

 

Não Transmite

Transmite

Média

5,425

7,35

Variância

0,16214286

55,0085714

Observações

8

8

Hipótese da diferença de média

0

 

gl

7

 

Stat t

-0,73302945

 

P(T<=t) uni-caudal

0,24367816

 

t crítico uni-caudal

1,89457861

 

P(T<=t) bi-caudal

0,48735632

 

t crítico bi-caudal

2,36462425

 


Nenhum comentário:

Postar um comentário