Maravilhas da Estatística – I

Este post foi originalmente publicado em 10/03/2013

A Estatística permite tomar decisões e estimar dados em situações que parecem impossíveis de se conhecer algo sobre o problema.

Caso em questão? Considere um saco com bolas numeradas de 1 até N. Agora você retira K bolas do saco. Sabendo o número de cada bola será que temos condições de estimar o número total de bolas originamente no saco (N)?

Bem, parece impossível, não? Mas há algumas informações que já temos disponíveis. A primeira é que a densidade de probabilidade é uniforme, ou seja a probabilidade de tirar qualquer bola é 1/N.

O valor médio desta distribuição é:

E{x} = 1/N*(1+2+3+..N) = 1/N*(N*(N+1)/2) = (N+1)/2

 

Então, na realidade, o que queremos é estimar a média, pois:

N=2*E{x}-1

 

Então podemos utilizar um estimador simples de média:

M=1/K*(B1+B2+…+BK)

 

Portanto N=2*M-1

 

Vamos ao teste? Vou considerar um saco com 100 bolas (numeradas de 1 a 100) e extrair 10 bolas aleatoriamente (óbvio que usei o MATLAB). Os números extraídos são:

55 24 62 63 53 59 52 93 20 66

A média deles é: 54.7

Portanto a nossa estimativa de N é 108.4

E se fossem apenas 5 bolas? O valor estimado de N seria de 101.8

A estimativa pode ser melhorada se incluirmos o desvio padrão. Mas para os fins de cálculo simples, este valor está de bom tamanho.

Mas para que serve isso, o caro leitor pode se perguntar? Bom, este tipo de problema é conhecido como Problema do Tanque Alemão. E como o nome indica, a estatística foi utilizada para descobrir quantos tanques alemães estavam sendo fabricados.

A idéia pode ser aplicada para um número de casos (por exemplo: quantas torradeiras de determinada marca são fabricadas, ou quantos IPhones, ou afins).

Realmente extraordinário.

Deixe um comentário