Um mar morto de links ou um mar de links mortos

Depois de muito tempo, estou de volta.

Tanta coisa aconteceu, fica até difícil resumir tudo. 

Então vou fazer diferente, vou revisitar meus artigos antigos que considero mais interessantes e fazer atualizações deles. Aqui e na nova versão do blog.

O que descobri é que a internet não é um oceano de memórias, mas um mar de links mortos.  Olhando meus artigos postados desde o início do blog, o que vejo é que enorme maiorias dos links estão mortos.

Mortos no sentido de não estarem mais ligados a nada. A minha ilusão que a internet ia ser um repositório de ideias, que poderíamos acessar as partes relevantes simplesmente clicando em alguns links, foi tudo por água abaixo.

Em retrospecto, penso que eu deveria ter esperado isso: Servidores são desativados, programas são atualizados, o espaço de armazenamento é finito e assim vai. Então temos posts aqui cujas referências se desmancharam, cujos links com mais detalhes não existem mais, cujos vídeos foram retirados, cujas músicas sumiram, que os plug-ins não funcionam mais…

E nem vou entrar na questão dos links que sumiram por decisões judiciais (embora talvez devesse).

Em resumo, a internet não é aquilo que imaginei que seria: um repositório, uma fonte de conhecimento, um modo de guardarmos as memórias do que fizemos, tivemos ou vivemos.

Isso é um pouco triste, um pouco desalentador…

Quantas pessoas que você conhecem podem estar doentes?

Prezados, depois de um bom hiato, e de descobrir que meu antigo blog ainda pode ser utilizado para novas mensagens, eu estou de volta.

Nesses tempos de COVID-19 (COronaVIrus Disease 2019), há muitos conceitos de biologia, química, matemática, estatística e mesmo engenharia flutuando no ar. E um dos tópicos que desejo tratar aqui é sobre a questão de uma unidade relativa ao assunto: infectados por milhão de habitantes (NIpm).

Esse número é, na realidade, uma medida equivalente a probabilidade (população dividido por população). E pode estar relacionado a chance que você conheça alguém com a doença.

Como a probabilidade de alguém estar infectado pode ser descrita, de modo simplificado, como o número de infectados (NI) dividido pela população geral (NT), ou seja: p=NI/NT.

Já o número de infectados por milhão é igual a p*100000. Ou seja NIpm=p*1000000. Assim, p=NIpm/100000. Portanto, para obter a probabilidade de alguém estar infectado é simplesmente o número de infectados por milhão, dividido por 1 milhão .

Então como utilizar isso? Vamos dizer que haja aleatoriedade em que você conheça alguém que tem ou não a doença. O conjunto é (p+q)=1, aonde p é a probabilidade de ter a doença e q é 1-p. Portanto, ao encontrar aleatoriamente n pessoas, temos o binômio de Newton (p+q)^N. No caso de duas pessoas (N=2), podemos expandir com facilidade:

p^2+2*p*q+q^2

Já a chance que nenhuma dessas pessoas tenha a doença é q^2. Ou, seja a chance que uma ou mais delas tenha a doença é 1-q^2=1-(1-p)^2.

O mesmo raciocínio pode ser utilizado se temos N pessoas, neste caso a probabilidade é 1-(1-p)^N.

Para valores pequenos de p (ou seja, quando o número de infectados por milhão é pelo menos 100 vezes menor que 1 milhão), esta expressão pode ser aproximada por:

1-1+N*p=N*p

Lembrando que NIpm=p*1000000, portanto a chance pode ser aproximada por N*NIpm/1000000

Bom, aí quando é que esta chance é de 50%?  É quando N*NIpm/1000000=1/2. Rearranjando:

N=500000/NIpm

Colocando números, se NIpm=50, com 10000 amigos há uma chance de 50%. Com 500, o número de amigos passa a ser 1000. Ou seja, considerando um processo aleatório, se você tiver 1000 conhecidos se o número de infectados por milhão exceder 500, então há uma chance de 50% que algum dos seus conhecidos tenha a doença.

Bom e como estão os números hoje (28 de maio de 2020)? Existem cerca de 220 mil casos ativos. Se arredondarmos a população brasileira para 220 milhões isto significa 1 caso em mil. Ou, em termos de infectado por milhão, temos NIpm=1000.

Utilizando as equações temos: N*1000/1000000=1/2, ou N=500. Ou seja se você tem 500 amigos, há uma chance de 50% de pelo menos um deles estar infectado.

 

Mais em estatística

Um ponto interessante sobre a estatística é que a medida que vamos obtendo mais pontos, acabamos por saber mais sobre o que não se encaixa nos dados que estamos calculando.

Ficou confuso?

Vamos a um exemplo para clarificar.

Supondo que obtermos um conjunto de pontos aleatoriamente, como por exemplo: 10, 22, 12, 64, 33 16 e 41.

A estatística dá ferramentas para saber que o valor médio deste conjunto está entre o menor número (10) e o maior número (64), com um probabilidade de 1- (7+1)/(2)^(7-1) ou 0.875. Ou seja, há uma chance de cerca de 7/8 que a média esteja entre o maior número deste conjunto e o menor número deste conjunto.

E isto fica mais impressionante a medida que se aumentam os números. Por exemplo, no caso de 12 amostras aleatórias, a probabilidade é de mais de 99% que a média esteja entre o maior valor e o menor valor.

A chave para derivação deste probabilidade é aleatoriedade na escolha destes pontos. E nisto não há necessidade de levar em conta a distribuição de probabilidade, ou seja, isto vale independente da distribuição.

Maravilhas da Estatística – II

Este post foi originalmente publicado em 12/03/2013

Como o leitor viu no post anterior, a estatística permite inferir informações que poderíamos considerar inacessíveis.

Vamos ver outro exemplo de contagem que permite estimar quantas espécies existem em um determinado nicho ecológico. O processo é conhecido como marcar e recapturar.

Funciona assim: primeiro o pesquisador vai ao nicho ecológico, captura M espécimes e depois os solta na população geral. Em uma segunda visita, ele captura C espécimes e verifica quantos destes foram originalmente marcados. Digamos que este número seja K.

Como o percentual de animais marcados em comparação com a população N é M/N, e se a segunda captura for completamente aleatória então o percentual de animais marcados na amostra C deve permanecer mais ou menos o mesmo. Isto quer dizer que:

M/N deve ser aproximadamente igual a K/C. Assumindo a igualdade, temos M/N = K/C então N = M*C/K

Um exemplo numérico pode esclarecer muito: Vamos dizer que na primeira visita marcamos M=10 espécimes, na segunda visita capturamos C=100 espécimes, dos quais K=2 eram marcados. Isto quer dizer que a população deve ser aproximadamente:

N = 10*100/2 = 500

Podem testar no MATLAB que funciona bonitinho. Naturalmente isto é uma aproximação (afinal supõe que nenhum dos animais marcados morreu ou sumiu no período), mas pode ser usado para estimar populações dos mais diversos tipos (pessoas com doenças na população geral, estimar mercados, etc…). Caso se mantenha um histórico de marcar e recapturar é possível montar uma história com taxa de desaparecimento, taxa de natalidade, entre outras informações.

Maravilhas da Estatística – I

Este post foi originalmente publicado em 10/03/2013

A Estatística permite tomar decisões e estimar dados em situações que parecem impossíveis de se conhecer algo sobre o problema.

Caso em questão? Considere um saco com bolas numeradas de 1 até N. Agora você retira K bolas do saco. Sabendo o número de cada bola será que temos condições de estimar o número total de bolas originamente no saco (N)?

Bem, parece impossível, não? Mas há algumas informações que já temos disponíveis. A primeira é que a densidade de probabilidade é uniforme, ou seja a probabilidade de tirar qualquer bola é 1/N.

O valor médio desta distribuição é:

E{x} = 1/N*(1+2+3+..N) = 1/N*(N*(N+1)/2) = (N+1)/2

 

Então, na realidade, o que queremos é estimar a média, pois:

N=2*E{x}-1

 

Então podemos utilizar um estimador simples de média:

M=1/K*(B1+B2+…+BK)

 

Portanto N=2*M-1

 

Vamos ao teste? Vou considerar um saco com 100 bolas (numeradas de 1 a 100) e extrair 10 bolas aleatoriamente (óbvio que usei o MATLAB). Os números extraídos são:

55 24 62 63 53 59 52 93 20 66

A média deles é: 54.7

Portanto a nossa estimativa de N é 108.4

E se fossem apenas 5 bolas? O valor estimado de N seria de 101.8

A estimativa pode ser melhorada se incluirmos o desvio padrão. Mas para os fins de cálculo simples, este valor está de bom tamanho.

Mas para que serve isso, o caro leitor pode se perguntar? Bom, este tipo de problema é conhecido como Problema do Tanque Alemão. E como o nome indica, a estatística foi utilizada para descobrir quantos tanques alemães estavam sendo fabricados.

A idéia pode ser aplicada para um número de casos (por exemplo: quantas torradeiras de determinada marca são fabricadas, ou quantos IPhones, ou afins).

Realmente extraordinário.

Enigmas Matemático

Mais um dos antigos posts do blog

Faz tempo que estou querendo colocar este post aqui (com sua solução):

Três amigos foram jantar em um restaurante e pediram uma pizza de R$22,00 mais três refrigerantes de R$1,00 cada. Na hora de pagar, cada um entregou para o garçom 10 reais para pagar a conta de R$25,00. O garçom devolveu 5 reais de troco em notas de R$1,00. 

Ao pegar o troco do garçom, os amigos decidiram dar R$2,00 de gorjeta para a divisão entre eles ficar inteira de 1 real para cada. 

Se cada um deu R$10,00 (R$30,00 ao total), recebeu troco de R$1,00, significa que pagaram juntos R$27,00 mais os R$2,00 da gorjeta, resultando R$29,00. Onde está esse 1 real que falta?

O que está errado? Vamos a matemática:

  • X – o que cada um pagou
  • C – Conta
  • T – Troco total

Temos 3*X -C = T, ou 3*10- 25 = 5 – ou seja: Cada um pagou R$ 10,00 e com a conta de R$ 25,00 tivemos um troco total de R$ 5,00
Ok até agora, não?

Mas vamos complicando

  • GG – gorgeta do garçom
  • TI – Troco individual

GG+3*TI = T ou 2+3*1 = 5 – ou seja: dos R$ 5,00, o garçom pegou R$ 2,00 e devolveu R$ 3,00 (R$ 1,00 para cada um).

Juntando as duas expressões temos:

3*X-C = GG+3*TI

Reescrevendo: 3*(X-TI) = C+GG, ou 3*(10-1) = 25+ 2 – ou seja cada um pagou, efetivamente R$ 9,00, e dos R$ 27,00 totais, R$ 25,00 foi para o dono do bar e R$ 2,00 para o garçom.

  • Bar: C+GG  – Conta + Garçom = R$ 25,00 + R$ 2,00 = R$ 27,00
  • Clientes: 3*(X-TI) – o que cada um efetivamente pagou = R$ 9,00+ R$ 9,00 + R$ 9,00 = R$ 27,00

Percebeu aonde esta o erro do enunciado? “Se cada um deu R$10,00 (R$30,00 ao total), recebeu troco de R$1,00, significa que pagaram juntos R$27,00 mais os R$2,00 da gorjeta”

O erro é o seguinte: Os R$ 2,00 de gorjeta estão incluídos nos R$ 9,00 e não fora dele. Cada um pagou R$ 9,00, totalizando R$ 27,00. Destes R$ 27,00, R$ 25,00 foram para o dono do bar e R$ 2,00 foram para o garçom.

Em termos matemáticos a expressão:
Se cada um deu R$10,00 (R$30,00 ao total), recebeu troco de R$1,00, significa que pagaram juntos R$27,00 mais os R$2,00 da gorjeta quer dizer 3*(X-TI)+GG e não 3*(X-TI)-GG (que é a equação original e correta!).

O que isto quer dizer? Que somamos R$ 2,00 ao invés de subtrairmos R$ 2,00. Não tem absolutamente nada a ver com dízima periódica, descontinuidade da função e outras “explicações” que rolam por aí.

Enigmas Matemáticos 1

Mais um post do antigo blog!

OS TRINTA E CINCO CAMELOS – Malba Tahan
Poucas horas havia que viajávamos sem interrupção, quando nos ocorreu uma aventura digna de registro, na qual meu companheiro Beremiz, com grande talento, pôs em prática as suas habilidades de exímio algebrista.
Encontramos, perto de um antigo caravançará meio abandonado, três homens que discutiam acaloradamente ao pé de um lote de camelos. Por entre pragas e impropérios, gritavam possessos, furiosos:
— Não pode ser!
— Isto é um roubo!
— Não aceito!
O inteligente Beremiz procurou informar-se do que se tratava.
— Somos irmãos — esclareceu o mais velho — e recebemos como herança esses 35 camelos. Segundo a vontade expressa de meu pai, devo eu receber a metade, o meu irmão Hamed Namir uma terça parte, e ao Harim, o mais moço, deve tocar apenas a nona parte. Não sabemos, porém, como dividir dessa forma 35 camelos. A cada partilha proposta, segue-se a recusa dos outros dois, pois a metade de 35 é 17 e meio! Como fazer a partilha, se a terça parte e a nona parte de 35 também não são exatas?
— É muito simples — atalhou o “homem que calculava”. — Encarregar-me-ei de fazer com justiça essa divisão, se permitirem que eu junte aos 35 camelos da herança este belo animal, que em boa hora aqui nos trouxe.
Neste ponto, procurei intervir na questão:
— Não posso consentir em semelhante loucura! Como poderíamos concluir a viagem, se ficássemos sem o nosso camelo?
— Não te preocupes com o resultado, ó “bagdali”! — replicou-me, em voz baixa, Beremiz. — Sei muito bem o que estou fazendo. Cede-me o teu camelo e verás, no fim, a que conclusão quero chegar.
Tal foi o tom de segurança com que ele falou, que não tive dúvida em entregar-lhe o meu belo jamal, que imediatamente foi reunido aos 35 ali presentes, para serem repartidos pelos três herdeiros.
— Vou, meus amigos — disse ele, dirigindo-se aos três irmãos — fazer a divisão justa e exata dos camelos, que são agora, como vêem, em número de 36.
E voltando-se para o mais velho dos irmãos, assim falou:
— Deves receber, meu amigo, a metade de 35, isto é, 17 e meio. Receberás a metade de 36, ou seja, 18. Nada tens a reclamar, pois é claro que saíste lucrando com esta divisão.
Dirigindo-se ao segundo herdeiro, continuou:
— E tu, Hamed Namir, devias receber um terço de 35, isto é, 11 e pouco. Vais receber um terço de 36, isto é, 12. Não poderás protestar, pois tu também saíste com visível lucro na transação.
E disse, por fim, ao mais moço:
— E tu, jovem Harim Namir, segundo a vontade de teu pai, devias receber uma nona parte de 35, isto é, 3 e pouco. Vais receber um terço de 36, isto é, 4. O teu lucro foi igualmente notável. Só tens a agradecer-me pelo resultado.
Numa voz pausada e clara, concluiu:
— Pela vantajosa divisão feita entre os irmãos Namir — partilha em que todos os três saíram lucrando — couberam 18 camelos ao primeiro, 12 ao segundo e 4 ao terceiro, o que dá um total de 34 camelos. Dos 36 camelos sobraram, portanto, dois. Um pertence, como sabem, ao “bagdali” meu amigo e companheiro; outro, por direito, a mim, por ter resolvido a contento de todos o complicado problema da herança.
— Sois inteligente, ó estrangeiro! — confessou, com admiração e respeito, o mais velho dos três irmãos. — Aceitamos a vossa partilha, na certeza de que foi feita com justiça e eqüidade.
E o astucioso Beremiz — o “homem que calculava” — tomou logo posse de um dos mais belos camelos do grupo, e disse-me, entregando-me pela rédea o animal que me pertencia:
— Poderás agora, meu amigo, continuar a viagem no teu camelo manso e seguro. Tenho outro, especialmente para mim.
E continuamos a nossa jornada para Bagdá.

Muito bem, o que aconteceu aqui? Que mágica foi essa? Ah, não há mágica nenhuma: a partilha é que não “cobria” todos os animais.

Vamos dizer que tivéssemos X camelos. O irmão mais velho receberia X/2, o do meio X/3 e o mais novo X/9.

Para simplificar vamos dizer que X fosse igual a 18. Assim o irmão mais velho receberia 9, o do meio 6 e o mais novo 2. Note que 9+6+2 é 17 e não 18. Isto significa que sobraria um camelo de qualquer modo. Na verdade X/2+X/3+X/9 = 34/36 = 17*X/18.

Ora se ao invés de 18 camelos tivéssemos 36 camelos (X=36) então X/2+X/3+X/9 = 34. Ou seja sobrariam 2 camelos. E o irmão mais velho receberia 18, o do meio 12 e o mais novo 4. O que fazer com os dois camelos? Ora eles não fariam parte da partilha de qualquer modo…

Já se a partilha fosse X/2, X/3 e X/6, então o matemático ficaria sem seu camelo, pois neste caso o irmão mais velho receberia 18, o do meio 12 e o mais novo 6. E 18+12+6 é 36.

A Medida da Sombra

Um dos “insights” mais brilhantes que conheço na história é o da medida da circunferência da Terra por Eratóstenes. A ideia, que posso dizer ser brilhante, é que usando geometria e medidas locais de distância é possível estimar o raio da Terra.

O conceito é simples. A circunferência da terra é dada pela conhecida equação:

Onde r é o raio da terra.

Já a distância entre dois pontos em um círculo (ou esfera) é dada pelo produto do ângulo pelo raio da terra. Ou seja:

Note que fazendo a razão entre os dois temos:

Então para saber qual é o valor de L, basta arranjar os termos:

O leitor pode verificar que a dificuldade em encontrar o ângulo. E aí é que pode-se ver a genialidade de Eratóstenes, ao se valer de geometria para resolver a questão de quem é este ângulo. A solução estava na junção de geometria com geografia.

No caso, na cidade de Siena, o sol ficava a pino no dia do Solstício de Verão, o que implica em nenhuma sombra ao meio dia.

Já na cidade de Alexandria, no mesmo horário e praticamente na mesma longitude, havia sombras. Então por geometria básica, o ângulo desejado é o mesmo ângulo da sombra. Assim sabendo o ângulo da sombra (ou por aproximação pela razão entre a altura do objeto e sua sombra), ele calculou a circunferência da terra.

Naturalmente há diversas fontes de erro. A primeira delas é que as cidades têm de estar precisamente na mesma longitude. Há também a questão da medição de tempo: as sombras devem ser medidas no mesmo horário. E por fim existem os erros nas medições das dimensões e distâncias envolvidas.

A quantificação destes erros dá uma medida dos intervalos que o resultado da faixa da medida da terra em questão. A forma final é:

Esta equação é bem interessante pois permite ver como os erros de medição podem influir no erro da medida final. Por exemplo, se o erro de medição de distância for 1%, e o de ângulo for de 0,1% temos que o erro final é 0,9%.

No caso da medida de Eratóstenes, a distância medida foi de 5000 estádios, e o ângulo foi de 1/50 avos de um círculo (o que dá 7.2 graus ou 0.12566 radianos). O resultado é 5000/(1/50) o que dá 250000 estádios.

Há o problema de saber quanto era um estádio. Além disto, aqui temos que ser um pouco céticos com relação a estes números. Uma medida de distância de exatamente 5000 estádios é muito improvável de ser real (pode muito bem ser 4995 ou 5005 estádios em uma suposição muito razoável). Já o erro de ângulo pode ser muito bem entre 1/40 e 1/60 avos de um círculo ( o que dá entre 6 e 9 graus). Então temos um erro de 0.2% na distância e 20% no ângulo. Substituindo temos como resultado dá cerca de 17%

Então o leitor pode ver que a maior fonte de erro é exatamente o ângulo.

Com relação aos valores exatos que temos hoje, a distância entre Alexandria e Siena (atual Assuâ) é de 844 km em via aérea (ou 1071 km através das estradas). Pelas contas contas, 50 vezes isso seria a circunferência da terra portanto 42.200 km (ou 53.500 km através das estradas).

Se utilizamos os valores com os erros temos algo entre 33760 e 50640 (ou entre 42840 km e 64260 km).

Considerando o valor calculado por Eratóstenes de 42.200 km (ou 53.500 km) com valor atualmente utilizado (40.000 km), o erro parece muito grande…

Parece muito, mas o fato de isto ter sido medido com sombras é absolutamente extraordinário.

Considere uma Vaca Esférica no Vácuo

Bem, este é um tema que já mencionei antes na versão anterior do Blog. Vou colocar aqui o que eu escrevi:

“Este é o mote de uma piadinha de físico muito famosa:

“Um fazendeiro contratou um físico para modelar sua fazenda de forma a otimizar o seu espaço. O físico foi a fazenda, avaliou, fez diversas anotações, e foi embora, passando semanas sem dar notícias. Outro dia, então, aparece ele afirmando que havia encontrado a resposta; começou então a sua brilhante explanação:

– Considere que seu gado seja constituído por vacas esféricas se movendo no vácuo…”

diversas variações da mesma

“Considere o espaço de Hilbert das vacas esféricas no vácuo, com densidade constante, na ausência de gravidade, expelindo leite isotropicamente e com fluxo constante F para um dado referencial S. Dado o operador autoadjunto “gravidez da vaca” G, calcule a probabilidade de ela estar prenha.”

Todas tratam do mesmo tema: a simplificação exagerada de um modelo físico (conhecido popularmente no meio como Toy Model). A parte interessante disso é a precisão do modelo varia com a aplicação. Por incrível que pareça, o modelo “Animal Esférico” tem aplicações interessantes (aos que estão curiosos: o uso do modelo de animal esférico permite explicar a relação de necessidade de manutenção de energia em organismos vivos).

Mas, com uma frequência assustadora, esta tendência de simplificação exagerada de modelo costuma aparecer em diversos ramos das ciências. As consequências podem ir de relativamente simples (algumas interessantes são o problema da contratação da secretária, o das rainhas no tabuleiro e outros), até consequências bastante sérias.

Não, não irei atacar a questão do aquecimento global aqui (apesar de já estar gerando afirmações quase irresponsáveis). Vou tratar de um assunto mais abrangente: do que lhe é mostrado, consegue identificar o que resultado de um modelo simplificado do que é resultado de um modelo mais refinado?

Vamos a alguns casos:

  1. Os livros de história estão cheios de informações que os europeus mataram milhões de índios. Mas, como se sabe quantos índios haviam antes dos europeus chegarem?
  2. Um estudo publicado recentemente afirma que 75% dos brasileiros nunca pisaram em uma biblioteca. Como se chegou a este número?
  3. Os veículos de comunicação estão cheio de notícias ligadas a saúde afirmando que determinadas substâncias fazem bem ou fazem mal a você. Como pode uma substância fazer mal e depois fazer bem e vice versa?
  4. Como se pode afirmar que o planeta terra terá problemas com a água se 3/4 da sua superfície é água?
  5. Como é que alguém pode saber que a cada 15 segundos uma mulher é espancada no Brasil?

Se você não sabe a respostas a estas perguntas não se preocupe. A maioria das pessoas engole esta informação sem pestanejar. Ora bolas, mesmo especialistas vez por outra caem na armadilha de supor que o modelo é a realidade.

A verdade é que todas estas questões têm respostas perfeitamente lógicas e não contém nenhum paradoxo a partir do momento que se saí do Toy Model para um modelo mais refinado (não há contradições com a afirmação original, apenas imprecisões). O problema é que via de regra, para descobrirmos que estamos usando um modelo do tipo “Vaca Esférica”, alguma coisa tem que dar muito errado.

Como resolver este problema? Bem, temos que ter muito cuidado e atenção no uso dos nossos modelos e devemos sempre saber quais são as premissas envolvidas neste modelo.”