sexta-feira, junho 05, 2009

Europeias. Eurosondagem, 1-2 Junho, N= 2033, simulação em urna.

PS: 36,0%
PSD: 31,9%
BE: 10,1%
CDU: 9,0%
CDS-PP: 6,1%
OBN: 6,9%

A amostra é de 2033. Desses, 16,4% estavam indecisos, pelo que as percentagens acima são calculadas em relação a um total de, no máximo, 1700 inquiridos. Não se fala na notícia do Expresso em abstencionistas, pelo que teremos de os presumir ausentes da amostra.

quinta-feira, junho 04, 2009

Europeias. Aximage, 1-4 Junho, N=1274, Tel.

PS: 36,2%
PSD: 30,9%
BE: 10,2%
CDU: 10,1%
CDS-PP: 5,0%


Não sei se é resultado antes ou depois de redistribuição de indecisos. Sei apenas que a soma disto dá 92,4%. É provavelmente mais sensato esperar pelo Correio da Manhã de amanhã antes de tirar mais conclusões sobre esta sondagem.

Actualização (5 de Junho):
1. OBN é mesmo 7,6%. Estas percentagens já excluem indecisos e não respostas. Segundo o CM, a distribuição dos indecisos "foi realizada a partir de um modelo que combina perguntas sobre o tipo de indecisão (abstenção/voto em quem), voto anterior, dinâmica de vitória e simpatia pelos principais candidatos". Interessante.
2. A amostra é de 1274 inquiridos. 65,3% disseram que não iriam votar. Sobram 442. Alguns deles terão dito que estão indecisos, pelo que as percentagens acima terão como base um valor inferior a 442. Mas a julgar pelas anteriores sondagens da Aximage, esse valor não há de ser muito inferior. Vamos considerar 442.

Europeias. CESOP, 30 Maio-2 Junho, N=3375, simulação voto urna.

PS: 34%
PSD: 32%
CDU: 11%
BE: 9%
CDS-PP: 4%
MEP: 2%
PCTP-MRPP: 1%
Outros: 3%
Brancos e nulos: 4%

Esta estimativa tem como base as intenções de voto dos inquiridos que afirmaram "ter a certeza" que irão votar e que forneceram intenções de voto válidas, em branco ou nulo: foram 1584. Podem descarregar mais detalhes aqui.

O que aí vem.

Os quadros seguintes mostram o template que vou usar para analisar cada sondagem.

Um primeiro quadro dá alguma informação geral, mostra as estimativas de resultados eleitorais e o intervalo de confiança a 95% (aproximação à normal) associado a cada estimativa, na base da dimensão da sub-amostra de inquiridos que exprimiram uma intenção de voto, mesmo que seja em branco ou nulo. Um segundo quadro mostra diferenças entre partidos na sondagem, assim como a margem de erro da diferença. Quando a diferença na amostra é inferior à margem de erro, isso significa que essa diferença carece de significância estatística a 95%, e assinalo isso a vermelho. Quando a diferença na amostra é superior, isso significa que a diferença é estatisticamente significativa a 95%, e assinalo isso a verde. Respeitarei a opção de cada instituto de apresentar resultados com ou sem casas decimais. Tudo isto pressupõe, claro, amostragem probabilística, que sabemos ser uma pressuposição inválida. Mas enfim.

Comecemos então pela Marktest. Desde logo, a dimensão da sub-amostra de intenções válidas não se pode calcular na base das notícias saídas até ao momento. Por isso, para já, irei presumir que a percentagem de abstencionistas declarados, indecisos e não respostas é igual à do estudo anterior, o que resulta numa sub-amostra de 383.





O que nos dizem estes quadros:

1. Estritamente na base da sondagem Marktest, não é possível dizer, com um elevado grau de confiança, se a vantagem do PSD sobre o PS na amostra correspondia, à data da sondagem, a uma vantagem real na população.
2. A mesma afirmação serve para a relação entre o BE e a CDU.
3. O mesmo já não sucede com o CDS-PP: a vantagem encontrada da CDU e do BE sobre o CDS-PP é estatisticamente significativa.

Sondagens "sem validade"?

Neste blogue, acusa-se a recente sondagem da Marktest de "não ter validade", e afirma-se que "a amostragem não foi feita de forma rigorosa e profissional". São dois os argumentos apresentados:

1. "O primeiro erro, começa pela sondagem não ter em conta a Região Autónoma dos Açores e a Região Autónoma da Madeira";

2. O facto da distribuição espacial dos inquéritos por regiões "Norte", "Centro" e "Sul" não respeitar a distribuição espacial da população portuguesa.

Vejamos. Primeiro, a ficha técnica da sondagem explica claramente que o universo sobre o qual está a fazer inferências é o da população de Portugal Continental com 18 ou mais anos. O que o post poderia tentar argumentar é que a ausência dos Açores e da Madeira fazem com que não se possa fazer inferências dos resultados do Continente para os resultados totais. Mas nem a sondagem faz essa inferência nem o autor faz esse argumento. Remete para uma questão de "erro de amostragem". Mas isto não é erro nenhum: é uma opção. E ainda por cima, se o autor do blogue tivesse alguma vez olhado para resultados eleitorais, ficaria a saber que, tendencialmente, a inclusão dos Açores e da Madeira tenderia normalmente a aumentar a vantagem do PSD, não a diminuí-la.

A segunda crítica é ainda menos fundamentada:

1. O autor fala da distribuição da população, quando o que mais se aproxima do universo de interesse é a população com 18 ou mais anos.
2. Apresenta dados para Norte, Centro e Sul, divisão que não coincide com as unidades territoriais do INE;
3. Compara esses dados com a distribuição territorial do inquérito da Marktest, sem ter apurado se as categorias que usa coincidem com as da Marktest.

Deputados

Um calculador em Javascript muito jeitoso para os deputados pode ser encontrado aqui. Em vez de votos ponham percentagens. Se tiver casas decimais, multipliquem por 10.

Europeias. Marktest, 27-30 Maio, N=807, Tel.

PSD: 32,5%
PS: 29,4%
BE: 8,9%
CDU: 8,9%
CDS-PP: 3,3%

É o que sei para já, na base desta notícia. Excitante, não? Claro que voltamos ao "empate técnico", ideia que, volto a dizer, é preciso confirmar quando soubermos a dimensão real da sub-amostra na base da qual estas percentagens são estimadas (ainda não sei qual é, mas não é 807, certamente). Mas é a primeira sondagem que coloca o PSD à frente, e isso pode não ser irrelevante, porque pode sugerir uma tendência. Mas com mais dados poderemos olhar melhor para isso. Agora ainda é cedo.

Sei que sou fastidioso, mas recordo, a propósito de uma notícia no Público: se de facto o PSD subiu nos últimos dias, isto não "confirma uma tendência" prévia (indetectável na base dos dados anteriores). E a habitual frase "Se as eleições europeias fossem hoje o [partido x] venceria o escrutínio" está mesmo a pedir inclusão no capítulo no Livro de Estilo do Público intitulado "Frases que constituem justa causa para despedimento".

A soma dá 83%, pelo que presumo que haja 17% de votos noutros partidos, brancos e nulos. Mas rectificarei caso se verifique não ser assim. Obrigado ao leitor que me avisou em comentário no post abaixo.

quarta-feira, junho 03, 2009

Meios de campanha

E já agora, repost de outro tweet da manhã:

"Para mim, que estou muito longe destas realidades, esta peça do Público sobre os meios de campanha é impressionante: http://tcp3.com/j1kz"

Previsão modelo Hix/Marsh para Portugal

Passo para post uma informação que mandei num tweet hoje de manhã e que me reapareceu num comentário abaixo:

Previsões actualizadas modelo Hix/Marsh para Portugal:

PS: 35% (9);
PSD: 30% (7);
BE: 11% (2);
CDU: 10% (2);
CDS-PP: 8.5% (2)

segunda-feira, junho 01, 2009

Voto obrigatório

O facto de se erigir a liberdade individual como único e exclusivo princípio em torno do qual se deve organizar a delegação de poder dos cidadãos em representantes numa democracia (ignorando os restantes princípios básicos, a saber, igualdade política e capacidade de controlo dos representantes) e querer sempre terminar por aí qualquer discussão é bastante revelador da cultura política de um certo tipo de liberalismo.

P.S. - Caro João. Quem apanhe esta discussão a meio fica a pensar que eu defendi o voto obrigatório no artigo do Público. Não defendi, pelo contrário, como certamente reparou. Mas escrevi um parágrafo no texto sobre a discussão do tema num plano meramente normativo, simplesmente para dizer que a discussão é muito difícil de resolver nesse plano, e que de todo se pode resolver numa penada, como esta sua penada que critiquei neste post. Só para dar um exemplo, consentir que apenas algumas pessoas votem (e outras não) pode ser visto como algo que colide com a igualdade política, se acreditarmos que há obstáculos económicos e sociais ao voto que um regime democrático deve tomar em conta e resolver (ver aqui, aqui ou aqui). E note que eu nem sequer disse que concordo com esta segunda visão. O que procurei fazer foi dizer que, num plano meramente normativo, a questão é muito mais difícil do que é sugerido pelo seu post inicial, e que podemos tomar um atalho: questionar, do ponto de vista empírico, as pressuposições sobre os efeitos do voto obrigatório daqueles que o defendem no plano dos princípios.

domingo, maio 31, 2009

Tendências?

Políticos e comentadores têm falado de "tendências" nas sondagens para as europeias. Como procurá-las? Uma maneira possível é tirar partido do facto de quatro dos cinco institutos de sondagens já terem realizado mais do que uma sondagem em momentos diferentes no tempo. O quadro seguinte mostra a diferença, para cada partido e cada instituto, entre a sondagem mais recente e a sondagem anterior, na base do quadro mostrado no post anterior:



Nem me arrisco a fazer qualquer tipo de afirmação sobre isto, a não ser para vos dar um elemento adicional. Há um teste estatístico sobre a diferença de proporções entre duas amostras independentes (ver aqui, por exemplo). Se o fizermos, para as duas sondagens de cada instituto e para cada partido, e tomando em conta as dimensões das sub-amostras, só quatro dessas diferenças emergem como estatisticamente significativas a 95%:

- 3 na Intercampus: BE (-), CDS-PP (-) e OBN (+);
- 1 na Aximage: OBN (+).

Europeias, Ponto de Situação

Sondagens divulgadas até ao momento:



Média ponderada das sondagens realizadas até ao momento e teste de significância das diferenças entre partidos:

Taxas de resposta

Seguindo um link colocado num comentário a uma mensagem abaixo, cheguei a este interessante post. Uma das questões levantadas tem a ver com as taxas de resposta anormalmente altas que são reportadas nas fichas técnicas de algumas sondagens.

Note-se que a taxa de resposta em entrevistas telefónicas corresponde à proporção de entrevistas completas sobre a soma das seguintes parcelas:

1. Entrevistas completas
2. Entrevistas iniciadas mas não completadas;
3. Recusas;
4. Casos em que não se estabeleceu contacto com a pessoa que deveria responder;
5. Outros casos em que a pessoa que deveria ter sido inquirida não o pôde ser (falecido, incapaz de responder por razões físicas ou psíquicas, problemas linguísticos, etc.);
6. Casos em que não se conseguiu apurar se o nº de telefone seleccionado corresponde a um domicílio;
7. Casos em que o nº de telefone esteve ocupado nas várias tentativas.
8. Casos em que não se conseguiu determinar se no domicílio existe um membro do universo.

É evidente, para quem saiba um mínimo sobre como este tipo de sondagens correm realmente, que a divisão do valor 1 sobre a soma dos valores 1 a 8 nunca dá 0,85, ou seja, não há taxas de resposta de 85% em inquéritos deste género. Logo, uma das coisas com que a ERC se deveria preocupar, a meu ver, seria garantir que todos os institutos usam, nas suas fichas técnicas, a mesma definição do que é uma taxa de resposta, porque pelos vistos não o estão a fazer. Estarão, provavelmente, a relatar uma taxa de cooperação, que é simplesmente o rácio do valor em 1 sobre a soma dos valores 1 a 3 (na sua versão mais "benévola"). O que significa também que, enquanto não houver convergência de critérios, ninguém vai dar a taxa de resposta (ninguém está disposto a fornecer valores reais de 10-30% para que eles sejam - ilegitimamente - comparados com valores de 85%).

Isto é especialmente importante para as sondagens que usam amostragem aleatória porque, como se diz no post que mencionei inicialmente, é assim que se mostra em que medida a amostra obtida se desvia da presunção de que todos os seus elementos resultaram de uma selecção dos membros do universo com igual probabilidade.

sábado, maio 30, 2009

Coisas que me chegam pelo Google Alerts

"Foguete de sondagem faz voo-teste do Centro de Lançamento de Alcântara".

"
Não houve uma única eleição em que eu tivesse participado em que as sondagens não tivessem apresentado para o CDS piores resultados do que os votos em urna. O CDS vai ter um grande resultado."

"Manuela Moura Guedes criticou esta noite a «falta de ética» e o «comportamento jornalístico» do Diário de Notícias. Em causa, o facto de a edição electrónica do diário ter referido durante a tarde uma sondagem exclusiva da TVI."

E a grande vencedora de hoje:
"Ainda é muito cedo para vaticinar uma vitória do PS (...) são factores que vão determinar uma vitória do PS"

Europeias. Marktest, 20-22 Maio, N=804, Tel.

PS: 31,9%
PSD: 30,1%
BE: 7,1%
CDU: 7.1%
CDS-PP: 4,7%
OBN: 19.1%

Estas percentagens são em relação a um total de 382 inquiridos, já que, dos 804, 387 não responderam ou disseram não saber em quem votar ao passo que 35 declararam que não votariam.

Gostava de chamar a atenção para uma coisa. Aqui há uns tempos, a propósito do Barómetro da Marktest para as legislativas, lembrei que a Marktest faz ponderação pós-amostral usando a recordação de voto em 2005 como variável de ponderação. Mais recentemente, quando olhei para os resultados da sondagem anterior da Marktest sobre as europeias, desconfiei. Mas agora confirmei: a Marktest, no caso das europeias, não faz ponderação pós-amostral. E fica por isso com valores para os OBN semelhantes àqueles que tipicamente apresenta nas sondagens sobre as legislativas antes de ponderação. Na sondagem sobre as legislativas divulgada também hoje, por exemplo, os OBN antes de ponderação são 17,2%.

Por que faz a Marktest isto? Não sei. Eu imaginaria que um procedimento que tem como objectivo corrigir distorções da amostra serve tão bem (ou tão mal) para perguntas sobre uma eleição como para perguntas sobre outra (ou, de resto, para perguntas que nem sejam sobre eleições). Mas deve haver uma razão. Já os simpatizantes de um dos "Outros" partidos talvez não devam gastar os foguetes todos a propósito destes "19,1%" (se bem que, se eu fosse um político de um desses partidos, se calhar já tinha começado a explicar que a Marktest anuncia uma transformação radical do sistema partidário português...).

sexta-feira, maio 29, 2009

Europeias. Intercampus, 15-26 Maio, N=992, Presencial (voto simulado em urna)

PS: 37,1%
PSD: 32%
BE: 9,9%
CDU: 7,7%
CDS-PP: 3,5%
OBN: 9,8% (outros partidos representam 4,9%).

19,2% da amostra era composta por Não sabe/Não responde, pelo que as percentagens acima foram calculadas em relação a uma base de 802 inquiridos. Não detecto em sítio nenhum números sobre abstencionistas declarados, pelo que mais uma vez presumo que ou a amostra é composta por pessoas que afirmam tencionam votar ou os abstencionistas declarados estão entre os 19,2%.

Obrigado aos leitores que foram enviando esta informação.

Europeias, Ponto de Situação



Já agora, mesmo ciente das objecções possíveis, aqui vão os resultados caso estas sondagens fossem uma única (ou seja, uma média ponderada de todas as sondagens), com uma amostra de 5326 inquiridos com intenções de voto válidas, branco e nulo:



Reporto apenas intervalos de confiança com aproximação à normal, dado que, com uma amostra destas, os resultados são exactamente (à décima) iguais aos dos intervalos exactos. Notem como as diferenças entre PS e PSD, BE e CDU, e CDU e CDS estão todas acima da margem de erro (explicação aqui, com links para fontes).

Sobre intervalos de confiança para distribuições multinomiais, há uma discussão interessante entre o LA-C e um comentador aqui. Segundo percebo, o paper mais citado sobre o assunto é este. Mas o tema está muito para além das minhas capacidades.

Europeias. Eurosondagem, 25-27 Maio, N= 2525, Tel.

PS: 35,5%
PSD: 32,5%
CDU: 9,2%
BE: 8,8%
CDS-PP: 6,5%

A soma disto dá 92,5%, pelo que presumo que OBN:7,5%.

A notícia menciona igualmente que, entre os 2525, 19,2% (485) não sabe ou não responde. Pelo que a sub-amostra de eleitores com intenções de voto será de 2040 inquiridos. Não há menção de abstencionistas declarados nas várias notícias que consultei, pelo que presumo que, entre os 2525, todos afirmaram que iriam votar. Mas estou a presumir.

quinta-feira, maio 28, 2009

Intervalos de confiança exactos (e outros)

Para os cálculos que o LA-C fez aqui à unha (ou seja, com o Matlab), há um bom simulador online que calcula quatro tipos de intervalo de confiança. O intervalo habitualmente estimado (por aproximação normal à binomial, que usei aqui) é o Wald. O que o Luís calculou é o exacto. Quanto aos outros, a página explica, mas eu vou ter de ruminar mais um bocadinho sobre o assunto. Há também estimativas pontuais alternativas. Um maná.

E um mini-paper que desenvolve o que o Luís explicou.

Ainda o empate entre o PS e o PSD

Há quem não goste da estratégia de tratar de várias sondagens como se de uma só (grande) sondagem se tratasse. Os argumentos são legítimos: Não podemos saber se não terá havido uma pessoa a responder a mais do que uma sondagem, as metodologias das sondagens são diferentes, o tratamento dos indecisos é diferente, etc, etc. Todos estes argumentos são válidos apesar de, na minha opinião, serem pouco relevantes. De qualquer forma, podemos pegar no problema por outra perspectiva.

Vamos admitir que o PS e o PSD estão, de facto, empatados. Se esta hipótese estiver correcta, então a probabilidade de o PS aparecer à frente numa dada sondagem é de 0,5 (50%). A probabilidade de aparecer à frente em duas sondagens é de 0,5x0,5=0.25 (25%). A probabilidade de aparecer à frente nas seis sondagens já realizadas seria de 0,5^6=0,015625 (1,56%). Ou seja, se os partidos estivessem empatados, a probabilidade de nas 6 sondagens já feitas o PS aparecer sempre à frente seria de 1,56%. Podemos então pôr de parte essa hipótese de ambos estarem empatados com um grau de certeza de 98,4%. É impossívelque estejam empatados? Não, apenas altamente improvável. O mesmo raciocínio se aplica à disputa pelo terceiro lugar, entre o BE e o CDS, e à disputa para o 4º lugar no pódio, disputa entre o CDS-PP e a CDU.