Fazendo um levantamento dos últimos 100 ganhadores (concursos 1530 a 1764), sem surpresas (ao menos do ponto de vista matemático, mas para os que defendem que apenas apostas feitas em cidades perdidas do interior do Brasil são premiadas - geralmente atreladas a suspeitas de fraudes - um resultado difícil de explicar), a cidade com mais bilhetes premiados é São Paulo, SP (com 15 bilhetes ganhadores), seguida de Rio de Janeiro, RJ (com 9 apostas vencedoras).
Se usarmos o tamanho populacional como proxy do número de apostadores por localidade, teremos o gráfico da Fig. 1.
Figura 1. Relação entre tamanho populacional e número de ganhadores. Cidades com mais habitantes têm um número maior de ganhadores na Mega Sena.
Uma simples correlação linear com coeficiente de determinação de 94,22% é obtida. Ou seja, o número de ganhadores por cidade parece seguir a proporcionalidade do número de habitantes - quanto maior a cidade, mais ganhadores - como esperado ao acaso, com a suposição de que a fração de apostadores seja mais ou menos constante entre as cidades.
Alguns fatores podem explicar a persistência do mito de que nunca - ou quase nunca - os prêmios saem para cidades maiores. De um lado, realmente os prêmios saem com mais frequência para cidades *menores* (ao menos menores do que as megacidades com mais de 1 milhão de habitantes). Como assim? Não acabamos de mostrar que quanto maior a cidade, maior o número de ganhadores? Sim, mas, em conjunto, há mais pessoas em cidades menores do que em cidades maiores no Brasil. Dos cerca de 205 milhões de brasileiros (cuidado! contém paywall poroso), 22% moram em uma das 17 cidades com mais de 1 milhão de habitantes. Muito, mas isso significa que 78% moram em um dos 5.553 municípios com menos de 1 milhão de almas. 29,9% dos brasileiros vivem em um dos 41 municípios com mais de 500 mil habitantes; 56% em uma das 304 cidades com mais de 100 mil habitantes.
[Na verdade, na nossa amostra, há uma tendência a haver um número *maior* de ganhadores nas cidades *maiores* do que o que seria o esperado apenas pelo tamanho da população se o número de apostadores fosse proporcional ao número de habitantes. 41 das apostas são de cidades com mais de 1 milhão de habitantes; 13 em cidades entre 500 mil e 1 milhão; 15 de cidades entre 100 mil e 500 mil e 44 de cidades com menos de 100 mil habitantes.
Aparentemente, não apenas a noção comum de que tendem a ganhar as apostas feitas em pequenas cidades não se verifica, como se verifica o *oposto*. (Claro que aqui não se está analisando diretamente se a probabilidade de uma aposta unitária varia de acordo com o tamanho da população, bom que se diga. Ou seja, não deve adiantar, então, apostar em lotéricas de cidades grandes esperando que, com isso, suas chances aumentem.) Considerando-se que isso seja generalizável, isso poderia se dar por diferentes motivos (não mutuamente excludentes): em grandes cidades, pode ser mais fácil o acesso a lotéricas (do que em cidades em que a maioria da população viva na zona rural, p.e.); pode haver mais dinheiro circulando de modo a que os atuais R$ 3,50 na aposta simples da Mega Sena não signifiquem uma sacrifício muito grande nas finanças pessoais; a cultura pode ser mais conservadora, condenando apostas, em cidades interioranas pequenas...]
Mas o grosso do efeito da persistência do mito pode ser pela seleção de indícios. Só nos lembramos das vezes em que os prêmios saem em cidades de que nunca ouvimos falar. E a cada vez que um prêmio sai de lá, consideramos isso um reforço à hipótese. Ignorando as vezes em que sai para grandes cidades - considerando os casos como exceção.
Uma parte secundária deve ser pelo reforço gerado pelas vezes em que o mito é repetido - criando uma sensação de que a concordância geral implica na veracidade da afirmação. Parte das pessoas também têm uma tendência a acreditarem em teorias da conspiração: para estas talvez tentativas como esta de análise objetiva não apenas sejam infrutíferas como sirvam como reforçadores de crença (podem considerar que esforços em refutar mitos sejam provas de que há uma conspiração em curso, havendo esforços para desacreditar quem denuncia a trama).
Upideite(29/nov/2015): Aqui o gráfico (Fig. 2) contando todos os 283 ganhadores a partir do concurso 1077 (na base de dados da Caixa, o local de venda do bilhete premiado é identificado apenas por estados).
Upideite(29/nov/2015): Gráfico similar (Fig. 3) é obtido quando plotamos a população das cidades contra o montante total de prêmios da sena.
Se consideramos a média dos valores da premiação, não notamos nenhuma tendência (Fig. 4).
Upideite(29/nov/2015): Aqui o gráfico (Fig. 2) contando todos os 283 ganhadores a partir do concurso 1077 (na base de dados da Caixa, o local de venda do bilhete premiado é identificado apenas por estados).
Figura 2. Relação entre tamanho populacional e número de ganhadores. Em azul claro, média dos tamanhos populacionais das cidades com o mesmo número de ganhadores; notar a escala logarítmica do eixo x - a curva descreve uma relação linear entre as variáveis.
Upideite(29/nov/2015): Gráfico similar (Fig. 3) é obtido quando plotamos a população das cidades contra o montante total de prêmios da sena.
Figura 3. Relação entre tamanho populacional e o montante de prêmios da sena. A relação é linear, maior a cidade, mais dinheiro recebe em prêmios - valores atualizados pelo IPCA (a escala x está em log).
Se consideramos a média dos valores da premiação, não notamos nenhuma tendência (Fig. 4).
Figura 4. Tamanho da população contra os valores médios da premiação. Escala dilog. Notar o baixo coeficiente de determinação, indicando a ausência de correlação.