Por Jairo Nicolau
Em todas as conversas sobre as eleições presidenciais desse ano, é inevitável ouvir a pergunta: Quais são as chances de Lula ganhar no primeiro turno?
A pergunta, em geral, é respondida de duas maneiras. A primeira baseia-se em cenários hipotéticos sobre o que deve acontecer nos próximos meses até o primeiro domingo de outubro. Os cenários servem ora para justificar a hipótese da vitória de Lula no primeiro turno (os eleitores de Ciro Gomes devem aderir ao voto útil; a piora do quadro econômico, com a alta da inflação, provavelmente beneficiará o candidato do PT), ora para justificar a realização do segundo turno (a campanha negativa deve tirar pontos de Lula; o uso da máquina federal provavelmente ajudará Bolsonaro a crescer).
A segunda maneira de estimar as chances de vitória de Lula no primeiro turno toma como referência os resultados das pesquisas de opinião. O raciocínio é direto: se uma pesquisa mostra que a intenção de voto de Lula supera a soma dos outros candidatos (ou está próximo desse patamar), então, a chance de ele vencer no primeiro turno é alta.1
O problema com a ligação direta entre o número revelado por uma pesquisa e a probabilidade de vitória no primeiro turno é que sabemos que existe um grau de incerteza inerente à toda pesquisa eleitoral. Parte dessa incerteza é revelada pela margem de erro: com base em simulações e no fundamento da pesquisa amostral, sabemos que se um instituto pudesse realizar dezenas de pesquisa simultaneamente os resultados variariam; Lula teria 46% em uma amostra, 45% em outra; 44.5% em outra; novamente 46% em uma seguinte.
O meu desafio era transformar o percentual que é divulgado numa pesquisa eleitoral em uma probabilidade mais precisa: Se um candidato tem X% das intenções de voto, qual a chance de ele vencer no primeiro turno? A ideia é apresentar uma estimativa melhor do que a escala qualitatival que domina as conversas (“a probabilidade de a eleição se decidir no primeiro turno é muito alta”, “As chances de Lula são mínimas”).
Afinal, muita gente já usa a linguagem probabilística observando a previsão do tempo, ou as chances de seu time ser campeão ou ser rebaixado. Torcedores do Fluminense, como eu, se lembram do Brasileirão de 2009, quando os matemáticos estimaram que o time teria 99% de cair para a segunda divisão. Uma sequência de 10 jogos sem perder, salvou o time e ajudou às pessoas a pensarem probabilisticamente.
O estatístico Nate Silver, coordenador do site Five Thirty Eight, se notabilizou por criar modelos que calculam a probabilidade dos candidatos nas eleições presidenciais dos Estados Unidos. Os modelos são baseados nas pesquisas de opinião de dezenas de institutos.
A minha estratégia é diferente, já que é baseada em uma única pesquisa, a Genial/Quaest publicado que foi a campo no começo do mês de junho. Utilizei uma técnica chamada bootstraping, que consiste em extrair muitas amostras dos dados observados. Na prática, os dados observados acabam servindo como a população da qual as amostras serão extraídas.
Como o interesse é estimar a probabilidade de vitória no primeiro turno precisamos excluir os eleitores que dizem que não irão comparecer e os que pretendem votar nulo ou em branco.2
A partir da pesquisa Genial/Quaest de junho de 2022 extrai 10.000 amostras, com 1.860 casos em cada uma. A proporção média obtida por Lula nessas 10 mil amostras é de 50.6%, com intervalo de confiança (a 95%) variando entre 48.3% e 53.8%.
O passo seguinte é calcular o percentual das 10.000 amostras que ultrapassam os 50%. Assim chegamos a um número que pode ser lido com a probabilidade de vitória de Lula no primeiro turno: 71 %. Ou seja, se pudéssemos reproduzir a pesquisa Genial/Quaest 10.000 vezes (com amostras de 1860 entrevistados em cada uma), em 71% delas Lula obteria mais de 50%.
O gráfico abaixo mostra a distribuição das amostras. Na base do gráfico, o ponto indica a média de todas as amostras, as linha à direita e à esquerda do ponto mostram a margem de erro. O lado azul mais escuro indica o conjunto de amostras em que Lula obteve mais de 50% (visualmente ela representa 71% do gráfico); consequentemente, a parte em azul claro representa 29%, que é o somatório das amostras que caíram abaixo de 50%.
O resultado é que as minhas impressões sobre a possibilidade de vitória de Lula agora estão quantificadas. Minha intenção é aperfeiçoar o modelo e atualizar a estimativa após a divulgação de cada nova rodada da pesquisa Quaest.
Na próxima festa de família, já tenho a resposta quando me perguntarem se Lula vai vencer no primeiro turno: se a eleição fosse hoje, a probabilidade de vitória já no primeiro turno é de 71%.