sexta-feira, julho 10, 2009

Estes romanos são loucos

No dia 21 e 22 de Junho passados, os italianos votaram num referendo com três questões. Ei-las:

1ª questão: "Volete voi che sia abrogato il Decreto del Presidente della Repubblica 30 marzo 1957, n. 361, nel testo risultante per effetto di modificazioni ed integrazioni successive, titolato “Approvazione del testo unico delle leggi recanti norme per la elezione della Camera dei Deputati”, limitatamente alle seguenti parti:
art. 14-bis, comma 1: “I partiti o i gruppi politici organizzati possono effettuare il collegamento in una coalizione delle liste da essi rispettivamente presentate. Le dichiarazioni di collegamento debbono essere reciproche.”;
art. 14-bis, comma 2: “La dichiarazione di collegamento è effettuata contestualmente al deposito del contrassegno di cui all’articolo 14. Le dichiarazioni di collegamento hanno effetto per tutte le liste aventi lo stesso contrassegno.”;
art. 14-bis, comma 3, limitatamente alle parole: “I partiti o i gruppi politici organizzati tra loro collegati in coalizione che si candidano a governare depositano un unico programma elettorale nel quale dichiarano il nome e cognome della persona da loro indicata come unico capo della coalizione.”;
art. 14-bis, comma 4, limitatamente alle parole “1, 2 e”;
art. 14-bis, comma 5, limitatamente alle parole: “dei collegamenti ammessi”;
art. 18-bis, comma 2, limitatamente alle parole: “Nessuna sottoscrizione è altresì richiesta per i partiti o gruppi politici che abbiano effettuato le dichiarazioni di collegamento ai sensi dell’art. 14-bis, comma 1, con almeno due partiti o gruppi politici di cui al primo periodo e abbiano conseguito almeno un seggio in occasione delle ultime elezioni per il Parlamento europeo, con contrassegno identico a quello depositato ai sensi dell’art. 14.”;
art. 24, numero 2), limitatamente alle parole: “alle coalizioni e”;
art. 24, numero 2), limitatamente alle parole: “non collegate”;
art. 24, numero 2), limitatamente alle parole: “, nonché per ciascuna coalizione, l’ordine dei contrassegni delle liste della coalizione”;
art. 31, comma 2, limitatamente alle parole: “delle liste collegate appartenenti alla stessa coalizione”;
art. 31, comma 2, limitatamente alle parole: “di seguito, in linea orizzontale, uno accanto all’altro, su un’unica riga”;
art. 31, comma 2, limitatamente alle parole: “delle coalizioni e”;
art. 31, comma 2, limitatamente alle parole: “non collegate”;
art. 31, comma 2, limitatamente alle parole: “di ciascuna coalizione”;
art. 83, comma 1, numero 2): “2) determina poi la cifra elettorale nazionale di ciascuna coalizione di liste collegate, data dalla somma delle cifre elettorali nazionali di tutte le liste che compongono la coalizione stessa, nonché la cifra elettorale nazionale delle liste non collegate ed individua quindi la coalizione di liste o la lista non collegata che ha ottenuto il maggior numero di voti validi espressi;”;
art. 83, comma 1, numero 3), lettera a): “a) le coalizioni di liste che abbiano conseguito sul piano nazionale almeno il 10 per cento dei voti validi espressi e che contengano almeno una lista collegata che abbia conseguito sul piano nazionale almeno il 2 per cento dei voti validi espressi ovvero una lista collegata rappresentativa di minoranze linguistiche riconosciute, presentata esclusivamente in una delle circoscrizioni comprese in regioni il cui statuto speciale prevede una particolare tutela di tali minoranze linguistiche, che abbia conseguito almeno il 20 per cento dei voti validi espressi nella circoscrizione;”;
art. 83, comma 1, numero 3), lettera b), limitatamente alle parole, ovunque ricorrono: “non collegate”;
art. 83, comma 1, numero 3), lettera b), limitatamente alle parole: “, nonché le liste delle coalizioni che non hanno superato la percentuale di cui alla lettera a) ma che abbiano conseguito sul piano nazionale almeno il 4 per cento dei voti validi espressi ovvero che siano rappresentative di minoranze linguistiche riconosciute, presentate esclusivamente in una delle circoscrizioni comprese in regioni il cui statuto speciale prevede una particolare tutela di tali minoranze linguistiche, che abbiano conseguito almeno il 20 per cento dei voti validi espressi nella circoscrizione”;
art. 83, comma 1, numero 4), limitatamente alle parole: “le coalizioni di liste di cui al numero 3), lettera a), e”;
art. 83, comma 1, numero 4), limitatamente alle parole, ovunque ricorrono: “coalizione di liste o”;
art. 83, comma 1, numero 4), limitatamente alle parole: “coalizioni di liste o”;
art. 83, comma 1, numero 5), limitatamente alle parole: “la coalizione di liste o”;
art. 83, comma l, numero 6): “6) individua quindi, nell’àmbito di ciascuna coalizione di liste collegate di cui al numero 3), lettera a), le liste che abbiano conseguito sul piano nazionale almeno il 2 per cento dei voti validi espressi e le liste rappresentative di minoranze linguistiche riconosciute, presentate esclusivamente in una delle circoscrizioni comprese in regioni il cui statuto speciale prevede una particolare tutela di tali minoranze linguistiche, che abbiano conseguito almeno il 20 per cento dei voti validi espressi nella circoscrizione, nonché la lista che abbia ottenuto la maggiore cifra elettorale nazionale tra quelle che non hanno conseguito sul piano nazionale almeno il 2 per cento dei voti validi espressi;”;
art. 83, comma 1, numero 7): “7) qualora la verifica di cui al numero 5) abbia dato esito positivo, procede, per ciascuna coalizione di liste, al riparto dei seggi in base alla cifra elettorale nazionale di ciascuna lista di cui al numero 6). A tale fine, per ciascuna coalizione di liste, divide la somma delle cifre elettorali nazionali delle liste ammesse al riparto di cui al numero 6) per il numero di seggi già individuato ai sensi del numero 4). Nell’effettuare tale divisione non tiene conto dell’eventuale parte frazionaria del quoziente così ottenuto. Divide poi la cifra elettorale nazionale di ciascuna lista ammessa al riparto per tale quoziente. La parte intera del quoziente così ottenuta rappresenta il numero dei seggi da assegnare a ciascuna lista. I seggi che rimangono ancora da attribuire sono rispettivamente assegnati alle liste per le quali queste ultime divisioni hanno dato i maggiori resti e, in caso di parità di resti, alle liste che abbiano conseguito la maggiore cifra elettorale nazionale; a parità di quest’ultima si procede a sorteggio. A ciascuna lista di cui al numero 3), lettera b), sono attribuiti i seggi già determinati ai sensi del numero 4);”;
art. 83, comma 1, numero 8), limitatamente alle parole: “varie coalizioni di liste o”;
art. 83, comma 1, numero 8), limitatamente alle parole: “per ciascuna coalizione di liste, divide il totale delle cifre elettorali circoscrizionali di tutte le liste che la compongono per il quoziente elettorale nazionale di cui al numero 4), ottenendo così l’indice relativo ai seggi da attribuire nella circoscrizione alle liste della coalizione medesima. Analogamente,”;
art. 83, comma 1, numero 8), limitatamente alle parole, ovunque ricorrono: “coalizione di liste o”;
art. 83, comma 1, numero 8), limitatamente alle parole, ovunque ricorrono: “coalizioni di liste o”;
art. 83, comma 1, numero 8), limitatamente alle parole: “coalizioni o”;
art. 83, comma 1, numero 9): “9) salvo quanto disposto dal comma 2, l’Ufficio procede quindi all’attribuzione nelle singole circoscrizioni dei seggi spettanti alle liste di ciascuna coalizione. A tale fine, determina il quoziente circoscrizionale di ciascuna coalizione di liste dividendo il totale delle cifre elettorali circoscrizionali delle liste di cui al numero 6) per il numero di seggi assegnati alla coalizione nella circoscrizione ai sensi del numero 8). Nell’effettuare tale divisione non tiene conto dell’eventuale parte frazionaria del quoziente. Divide quindi la cifra elettorale circoscrizionale di ciascuna lista della coalizione per tale quoziente circoscrizionale. La parte intera del quoziente così ottenuta rappresenta il numero dei seggi da assegnare a ciascuna lista. I seggi che rimangono ancora da attribuire sono assegnati alle liste seguendo la graduatoria decrescente delle parti decimali dei quozienti così ottenuti; in caso di parità, sono attribuiti alle liste con la maggiore cifra elettorale circoscrizionale; a parità di quest’ultima, si procede a sorteggio. Successivamente l’Ufficio accerta se il numero dei seggi assegnati in tutte le circoscrizioni a ciascuna lista corrisponda al numero dei seggi ad essa attribuito ai sensi del numero 7). In caso negativo, procede alle seguenti operazioni, iniziando dalla lista che abbia il maggior numero di seggi eccedenti, e, in caso di parità di seggi eccedenti da parte di più liste, da quella che abbia ottenuto la maggiore cifra elettorale nazionale, proseguendo poi con le altre liste, in ordine decrescente di seggi eccedenti: sottrae i seggi eccedenti alla lista in quelle circoscrizioni nelle quali essa li ha ottenuti con le parti decimali dei quozienti, secondo il loro ordine crescente e nelle quali inoltre le liste, che non abbiano ottenuto il numero di seggi spettanti, abbiano parti decimali dei quozienti non utilizzate. Conseguentemente, assegna i seggi a tali liste. Qualora nella medesima circoscrizione due o più liste abbiano le parti decimali dei quozienti non utilizzate, il seggio è attribuito alla lista con la più alta parte decimale del quoziente non utilizzata. Nel caso in cui non sia possibile fare riferimento alla medesima circoscrizione ai fini del completamento delle operazioni precedenti, fino a concorrenza dei seggi ancora da cedere, alla lista eccedentaria vengono sottratti i seggi in quelle circoscrizioni nelle quali li ha ottenuti con le minori parti decimali del quoziente di attribuzione e alle liste deficitarie sono conseguentemente attribuiti seggi in quelle altre circoscrizioni nelle quali abbiano le maggiori parti decimali del quoziente di attribuzione non utilizzate.”;
art. 83, comma 2, limitatamente alle parole: “la coalizione di liste o”;
art. 83, comma 2, limitatamente alle parole: “coalizione di liste o”;
art. 83, comma 2, limitatamente alle parole: “di tutte le liste della coalizione o”;
art. 83, comma 3, limitatamente alle parole: “coalizioni di liste e”;
art. 83, comma 3, limitatamente alle parole, ovunque ricorrono: “coalizione di liste o”;
art. 83, comma 3, limitatamente alle parole: “coalizioni di liste o”;
art. 83, comma 4: “L’Ufficio procede poi, per ciascuna coalizione di liste, al riparto dei seggi ad essa spettanti tra le relative liste ammesse al riparto. A tale fine procede ai sensi del comma 1, numero 7), periodi secondo, terzo, quarto, quinto, sesto e settimo.”;
art. 83, comma 5, limitatamente alle parole: “numero 6),”;
art. 83, comma 5, limitatamente alle parole: “e 9)”;
art. 83, comma 5, limitatamente alle parole: “coalizione di liste o”;
art. 83, comma 5, limitatamente alle parole: “coalizioni di liste o”;
art. 84, comma 3: “Qualora al termine delle operazioni di cui al comma 2, residuino ancora seggi da assegnare alla lista in una circoscrizione, questi sono attribuiti, nell’àmbito della circoscrizione originaria, alla lista facente parte della medesima coalizione della lista deficitaria che abbia la maggiore parte decimale del quoziente non utilizzata, procedendo secondo un ordine decrescente. Qualora al termine di detta operazione residuino ancora seggi da assegnare alla lista, questi sono attribuiti, nelle altre circoscrizioni, alla lista facente parte della medesima coalizione della lista deficitaria che abbia la maggiore parte decimale del quoziente già utilizzata, procedendo secondo un ordine decrescente.”;
art. 84, comma 4, limitatamente alle parole: “e 3”;
art. 86, comma 2, limitatamente alle parole: “, 3”?».

2ª questão: "Volete voi che sia abrogato il Decreto legislativo 20 dicembre 1993, n. 533, nel testo risultante per effetto di modificazioni ed integrazioni successive, titolato “Testo unico delle leggi recanti norme per l’elezione del Senato della Repubblica”, limitatamente alle seguenti parti:

art. 1, comma 2, limitatamente alle parole: "di coalizione";
art. 9, comma 3, limitatamente alle parole: "Nessuna sottoscrizione è altresì richiesta per i partiti o gruppi politici che abbiano effettuato le dichiarazioni di collegamento ai sensi dell'art. 14-bis, comma 1, del testo unico delle leggi recanti norme per la elezione della Camera dei deputati, di cui al decreto del Presidente della Repubblica 30 marzo 1957, n. 361, con almeno due partiti o gruppi politici di cui al primo periodo del presente comma e abbiano conseguito almeno un seggio in occasione delle ultime elezioni per il Parlamento europeo, con contrassegno identico a quello depositato ai sensi dell'art. 14 del citato testo unico di cui al decreto del Presidente della Repubblica n. 361 del 1957.";
art. 11, comma 1, lettera a), limitatamente alle parole: "alle coalizioni e";
art. 11, comma 1, lettera a), limitatamente alle parole: "non collegate";
art. 11, comma 1, lettera a), limitatamente alle parole: ", nonché, per ciascuna coalizione, l'ordine dei contrassegni delle liste della coalizione";
art. 11, comma 3, limitatamente alle parole: "delle liste collegate appartenenti alla stessa coalizione";
art. 11, comma 3, limitatamente alle parole: "di seguito, in linea orizzontale, uno accanto all'altro, su un'unica riga";
art. 11, comma 3, limitatamente alle parole: "delle coalizioni e";
art. 11, comma 3, limitatamente alle parole: "non collegate";
art. 11, comma 3, limitatamente alle parole: "di ciascuna coalizione";
art. 16, comma 1, lettera a), limitatamente alle parole: ". Determina inoltre la cifra elettorale circoscrizionale di ciascuna coalizione di liste, data dalla somma delle cifre elettorali circoscrizionali di tutte le liste che la compongono";
art. 16, comma 1, lettera b), numero 1): “1) le coalizioni di liste che abbiano conseguito sul piano regionale almeno il 20 per cento dei voti validi espressi e che contengano almeno una lista collegata che abbia conseguito sul piano regionale almeno il 3 per cento dei voti validi espressi;”;
art. 16, comma 1, lettera b), numero 2), limitatamente alle parole: "non collegate";
art. 16, comma 1, lettera b), numero 2), limitatamente alle parole: "nonché le liste che, pur appartenendo a coalizioni che non hanno superato la percentuale di cui al numero 1), abbiano conseguito sul piano regionale almeno l'8 per cento dei voti validi espressi";
art. 17, comma 1, limitatamente alle parole: "le coalizioni di liste e";
art. 17, comma 1, limitatamente alle parole: "coalizioni di liste o";
art. 17, comma 1, limitatamente alle parole, ovunque ricorrono: "coalizione di liste o";
art. 17, comma 2, limitatamente alle parole: "la coalizione di liste o";
art. 17, comma 3: “Nel caso in cui la verifica di cui al comma 2 abbia dato esito positivo, l'ufficio elettorale regionale individua, nell'àmbito di ciascuna coalizione di liste collegate di cui all'articolo 16, comma 1, lettera b), numero 1), le liste che abbiano conseguito sul piano circoscrizionale almeno il 3 per cento dei voti validi espressi. Procede quindi, per ciascuna coalizione di liste, al riparto, tra le liste ammesse, dei seggi determinati ai sensi del comma 1. A tale fine, per ciascuna coalizione di liste, divide la somma delle cifre elettorali circoscrizionali delle liste ammesse al riparto per il numero di seggi già individuato ai sensi del comma 1, ottenendo così il relativo quoziente elettorale di coalizione. Nell'effettuare tale divisione non tiene conto dell'eventuale parte frazionaria del quoziente. Divide poi la cifra elettorale circoscrizionale di ciascuna lista ammessa al riparto per il quoziente elettorale di coalizione. La parte intera del quoziente così ottenuta rappresenta il numero dei seggi da assegnare a ciascuna lista. I seggi che rimangono ancora da attribuire sono rispettivamente assegnati alle liste per le quali queste ultime divisioni hanno dato i maggiori resti e, in caso di parità di resti, alle liste che abbiano conseguito la maggiore cifra elettorale circoscrizionale; a parità di quest'ultima si procede a sorteggio. A ciascuna lista di cui all'articolo 16, comma 1, lettera b), numero 2), sono attribuiti i seggi già determinati ai sensi del comma 1.”;
art. 17, comma 4, limitatamente alle parole: "alla coalizione di liste o";
art. 17, comma 5, limitatamente alle parole, ovunque ricorrono: "coalizioni di liste o";
art. 17, comma 5, limitatamente alle parole, ovunque ricorrono: "coalizione di liste o";
art. 17, comma 5, limitatamente alle parole: "alle coalizioni di liste e";
art. 17, comma 6: “Per ciascuna coalizione l'ufficio procede al riparto dei seggi ad essa spettanti ai sensi dei commi 4 e 5. A tale fine, per ciascuna coalizione di liste, divide il totale delle cifre elettorali circoscrizionali delle liste ammesse al riparto ai sensi dell'articolo 16, comma 1, lettera b), numero 1), per il numero dei seggi ad essa spettanti. Nell'effettuare tale divisione non tiene conto dell'eventuale parte frazionaria del quoziente così ottenuto. Divide poi la cifra elettorale circoscrizionale di ciascuna lista per quest'ultimo quoziente. La parte intera del risultato così ottenuto rappresenta il numero dei seggi da attribuire a ciascuna lista. I seggi che rimangono ancora da attribuire sono rispettivamente assegnati alla lista per la quale queste ultime divisioni abbiano dato i maggiori resti e, in caso di parità di resti, a quelle che abbiano conseguito la maggiore cifra elettorale circoscrizionale.”;
art. 17, comma 8: “Qualora una lista abbia esaurito il numero dei candidati presentati nella circoscrizione regionale e non sia quindi possibile attribuire tutti i seggi ad essa spettanti, l'ufficio elettorale regionale assegna i seggi alla lista facente parte della medesima coalizione della lista deficitaria che abbia la maggiore parte decimale del quoziente non utilizzata, procedendo secondo un ordine decrescente. Qualora due o più liste abbiano una uguale parte decimale del quoziente, si procede mediante sorteggio.”;
art. 17-bis, limitatamente alle parole: “e 6”;
art. 19, comma 2: “Qualora la lista abbia esaurito il numero dei candidati presentati in una circoscrizione e non sia quindi possibile attribuirle il seggio rimasto vacante, questo è attribuito, nell'àmbito della stessa circoscrizione, ai sensi dell'articolo 17, comma 8."»

3ª questão: " Volete voi che sia abrogato il Decreto del Presidente della Repubblica 30 marzo 1957, n. 361, nel testo risultante per effetto di modificazioni ed integrazioni successive, titolato “Approvazione del testo unico delle leggi recanti norme per la elezione della Camera dei Deputati”, limitatamente alle seguenti parti: art. 19, limitatamente alle parole: “nella stessa”; art. 85."


O sim ganhou nas três questões. Mas a abstenção foi 77%. Por não ter atingido o quórum de 50%, os resultados são inválidos.

Conclusões:

1. Há sistemas políticos ainda piores que o nosso.
2. 23% da população italiana com 18 ou mais anos é composta por juristas.

(Obrigado ao Andrés pela experiência inolvidável de olhar para um boletim de voto destes).

Porto. IPOM, 16-19 Junho, N=797, Tel.

PSD/CDS-PP: 55,2%
PS: 23,5%
CDU: 9,2%
BE: 8,1%
OBN: 4,1%

Esta é a terceira sondagem publicada sobre as autárquicas do Porto, que eu conheça. Nas três, a diferença entre Rio e Elisa é sempre ampla e significativa. Mas nas duas pós-Europeias a diferença é muito maior.

Obrigado ao Gabriel e ao João.

Grande Porto

Desculpem a ignorância, mas o Grande Porto tem site? Já publicou duas sondagens, mas não consigo saber os pormenores (amostra, instituto, etc.). Alguém ajuda?

Legislativas. Aximage, 1-3 e 6 de Julho, N=749, Tel.

PS: 30,5%
PSD: 30,3%
BE: 13,3%
CDU: 9,5%
CDS-PP: 6,1%

O total é 89,7%. A notícia na net não distingue os restantes 10,3% em indecisos e OBN, mas é possível que a notícia em papel o faça.

quarta-feira, julho 08, 2009

Contribuições para o debate sobre o sistema eleitoral português

Na Indonésia, o Presidente Susilo Bambang Yudhoyono parece ter sido reeleito. Numa das notícias, explica-se que, segundo a lei eleitoral indonésia, os candidatos, depois de registarem as suas candidaturas junto da Comissão Nacional de Eleições, são sujeitos a uma bateria de exames físicos e psicológicos no hospital do Exército, incluindo a aplicação do Minnesota Multiphasix Personality Inventory, um teste destinado a detectar sintomas de hipocondria, depressão, histeria, paranóia e esquizofrenia.

Atalhos informacionais

Pegando nos dados dos inquérito sobre Lisboa feito pelo CESOP, é possível testar os efeitos de alguns atributos dos eleitores nas suas actuais intenções de voto. Foi o que fiz, numa análise muito rough and ready (faltam variáveis de controlo potencialmente importantes, tais como ideologia, id. partidária, etc.). A pergunta é: que aspectos ajudam mais a distinguir aqueles que tencionam votar Santana Lopes dos que tencionam votar António Costa? Usei uma regressão logística, com voto em Costa codificado como 0 e PSL como 1.

Instrução, sexo e idade são irrelevantes. Curioso, mas não surpreende quando a escolha é apenas entre PS e a direita. O coeficiente associado à instrução é positivo (mais instrução, maior propensão para votar PSL em vez de Costa na amostra) mas não é significativo com p<0,05. Obviamente, a avaliação da actuação de António Costa é o factor determinante, mas é um indicador, em si mesmo, demasiado "próximo" do voto, sendo provavelmente mais instrutivo retirar a variável do modelo. E o mais interessante é que, quando o fazemos, verificamos de que forma a percepção dos problemas da cidade afectam a opção Costa vs. PSL. E são duas, e só duas, as percepções relevantes para distiguir estes dois grupos de eleitores: criminalidade e sujidade das ruas e dos espaços verdes. Quanto maior a gravidade apercebida destes problemas, maior a propensão para votar PSL em vez de Costa.

Quando os grupos comparados são aqueles que tencionam votar em Costa (0) vs. os que tencionam votar num qualquer outro partido (1), a questão da criminalidade deixa de ser significativa. É, portanto, um factor que joga mais na escolha entre Costa e a coligação de direita do que na opção genérica "incumbent" vs. oposição. Mas a questão da sujidade das ruas e espaços verdes permanece (e o coeficiente até cresce em dimensão e significância estatística): é esta percepção, positiva para alguns (29% dos votantes prováveis) mas negativa para a maioria (71% dos votantes prováveis), o aspecto que mais ajuda a diferenciar os que tencionam votar em Costa dos que tencionam votar noutra lista e candidato qualquer.

Banal? Talvez. Mas quando olho para a lista dos outros problemas sobre quais pedimos opiniões aos eleitores, julgo compreender. Trânsito, transportes, habitação, degradação de edifícios são problemas "macro", que envolvem factores fora do controlo da CML (o que não quer dizer que a CML faça tudo aquilo que está ao seu alcance nestes domínios). Criminalidade é, em grande medida, um problema de percepção. Na falta de dados que permitam relacionar as pessoas com contextos concretos de insegurança, o que sobra são percepções fundadas em predisposições ideológicas, e por isso se entende que conte apenas numa escolha Costa/PSL, ou seja, esquerda/direita. E a cultura, digamos, não é problema sério para muita gente.

Resta a "sujidade". Uma espécie de "atalho informacional": se uma câmara é vista como conseguindo manter uma cidade limpa e arranjada, também não há-de ser má em tudo o resto. Mas se é vista como não conseguindo cumprir os "serviços mínimos", isso é mau sinal para tudo o resto. Os eleitores até podem ter pouca informação, mas não são parvos a usarem a que têm.

sexta-feira, julho 03, 2009

Outro planeta

Passei esta semana em Braga, na Universidade do Minho, num Curso de Verão organizado pelo Núcleo de Investigação em Politicas Económicas, onde trabalha o meu amigo LA-C. O curso foi leccionado por Joshua Angrist, do MIT, um economista americano muito conhecido que falou sobre um conjunto de técnicas econométricas destinadas a estimar rigorosamente efeitos causais recorrendo a dados observacionais ou a corrigir problemas ocorridos em estudos experimentais onde, apesar da aleatorização dos sujeitos, não se consegue evitar que os grupos de controlo e de tratamento se seleccionem, em parte, a si próprios. Parte significativa da matemática utilizada para provar teoremas, confesso, passou-me por cima. Mas as técnicas e a sua aplicação não são especialmente complicadas e a coisa toda foi muito bem feita, bem organizada e muito estimulante.

Se falo nisto é apenas para assinalar que muitos dos trabalhos de Angrist têm como objectivo estimar as consequências de variações institucionais e de intervenções concretas nas politicas públicas. Que tipos de escolas produzem melhores resultados nos exames dos alunos? Qual o efeito da dimensão das turmas? Vale a pena avaliar os professores, e como? Que impacto têm as políticas laborais activas? Quais os efeitos do serviço militar obrigatório nos rendimentos futuros dos recrutados? E do prolongamento da escolaridade obrigatória? Etc, etc, etc. Aquilo que mais me impressionou no contacto com esta bibliografia é a compreensão da distância abissal entre a natureza do debate sobre as politicas públicas em Portugal e nos Estados Unidos. Nos EUA, a preocupação com medir os efeitos das politicas vai ao ponto de os organismos públicos organizarem frequentemente experiências. Um dos exemplos dados por Angrist foi uma experiência em Minneapolis, onde, para os casos de violência doméstica, os polícias tinham instruções para lidar com eles de formas diferentes mas aleatorizadas, de forma a que a comparação entre os efeitos das diferentes abordagens (medidos como a necessidade de regressar à mesma casa nos 6 meses seguintes) pudesse ser feita sem necessidade de excessiva preocupação com todos os outros factores que podem afectar esses efeitos. E como estas experiências há centenas.

E Portugal? Posso estar enganado. E se me dessem exemplos de uma (1) medida legislativa que tivesse sido precedida por estudos deste género eu ficava contente por me ter enganado. Mas estamos, creio, noutro planeta.

Legislativas. Eurosondagem, 25-30 Junho, N=1024, Tel.

PS: 35,1%
PSD: 33,0%
CDU: 9,7%
BE: 9,6%
CDS-PP: 7,4%
OBN: 5,2%

Aqui. Uma frase intrigante na notícia: "Registe-se ainda que neste barómetro os indecisos situam-se nos 19,5% e a taxa dos que não sabem e não respondem atinge os 16,7%."

quarta-feira, julho 01, 2009

Porto. CESOP, 22-28 Junho, N=684, Tel.

Podem descarregar aqui uma síntese dos resultados. É um bocadinho mais pesado que o costume porque tem gráficos.

sexta-feira, junho 26, 2009

Legislativas. Marktest, 16-20 Junho, N=800, Tel.

PSD: 35,8%
PS: 34,5%
BE: 13,1%
CDU: 7,7%
CDS: 4,4%
OBN: 4,5%


Aqui.

Actualização: agora que os resultados estão no site da Marktest, é possível corrigir a própria notícia da TSF linkada acima, que atribui 9,4% à CDU. Na verdade, são 7,7%. Mas ao contrário do que é sugerido num comentário muito infeliz a este post, o CDS-PP tem mesmo 4,4%. Já tinha na notícia da TSF, e continua a ter na ficha técnica da sondagem da Marktest.

sábado, junho 20, 2009

Consensos e outros não tanto

"Estudos sobre o sector", mais "difusão de informação", publicação no site da ERC das fichas técnicas e iniciativa da ERC em reunir as empresas são coisas boas e foram consensuais. Mas a minha posição (e creio não estar sozinho) continua a mesma: há hipóteses em cima da mesa para explicar o que se passou; a abstenção não é a única das possíveis explicações; sem estudos, essas hipóteses nunca passarão disso mesmo.

sexta-feira, junho 19, 2009

"Freguesias-tipo"?

O único conhecimento que tenho deste assunto é pela notícia de jornal. Mas a confirmar-se a argumentação, a única coisa que posso fazer é sugerir a leitura do seguinte excerto:

"Because it is so important that the sample for an opinion poll is a true reflection of the country as a whole, the sample of constituencies for an opinion poll is checked for political balance. This is done in much the same way, by calculating the share of the votes at the last general election just in those constituencies sampled, and comparing it with the national result."

in Nick Moon. 1999. Opinion polls: history, theory and practice. Manchester: Manchester University Press, pp. 51-52 (itálicos meus, a ver se se percebe a utilização do plural).

terça-feira, junho 16, 2009

Auditar ou proibir?

Por estar ligado à temática deste blogue, reproduzo também aqui o artigo de ontem no Público:

Em 1992, as últimas sondagens realizadas no Reino Unido apontavam para uma eleição renhida, mas com uma curta vantagem dos Trabalhistas. Contados os votos, os Conservadores tinham ganho a eleição com 7,6 pontos de vantagem, subestimada pelas sondagens em cerca de 9 pontos percentuais. Seguiu-se uma controvérsia sobre a fiabilidade das sondagens e a Market Research Society reuniu um painel de peritos para investigar o assunto. O relatório final listava as possíveis causas para o fracasso das sondagens: a inadequação das variáveis utilizadas para definir quotas ou para ponderar os resultados de amostras aleatórias, levando a uma sub-representação de eleitores Conservadores; a desactualização dos dados das estatísticas nacionais utilizados; taxas de recusa diferenciais entre eleitores Trabalhistas e Conservadores (os “shy Tories”), levando a que os segundos estivessem ainda mais sub-representados nas amostras; e opções inadequadas quer para a redistribuição de indecisos quer para tratamento de “abstencionistas declarados”. Este relatório* teve consequências importantes na forma como se passaram a fazer sondagens no Reino Unido, seja na amostragem seja na forma como se passou a lidar com os eleitores que se afirmam “indecisos” ou “abstencionistas” nas sondagens.

À luz do recente fracasso das sondagens para as eleições europeias, por que não promover uma “auditoria” semelhante em Portugal após esta e futuras eleições? As fichas técnicas divulgadas na imprensa, ou mesmo as depositadas na Entidade Reguladora para a Comunicação Social (ERC), estão longe de fornecerem toda a informação necessária para apreciar a enorme quantidade de opções técnicas e práticas adoptadas pelos diferentes institutos. Uma investigação por um painel de peritos independentes poderia abordar em detalhe, por exemplo, as opções de amostragem, a construção dos questionários, a formação dos inquiridores ou o trabalho de campo. Com os dados brutos em seu poder, esse painel poderia apreciar as consequências de opções alternativas no tratamento dos dados, nomeadamente das “não respostas” e dos “indecisos”, assim como os desvios das amostras em relação a características conhecidas da população e as maneiras de os corrigir. Não faltariam pessoas capazes de fazer este tipo de auditoria. Se porventura se considerar que a ERC não é a entidade apropriada para a promover, ou que a APODEMO (a associação representativa das empresas do sector) está demasiado próxima dos interesses das empresas, certamente que na Associação Portuguesa de Sociologia, na Associação Portuguesa de Ciência Política ou na Sociedade Portuguesa de Matemática se encontrarão especialistas para formar semelhante painel. E é sempre possível convocar peritos estrangeiros, sem qualquer ligação aos interesses corporativos, económicos ou políticos em jogo.

Creio que quase todos teriam a ganhar com isto. Para o grande público, a noção de que o trabalho das empresas seria pública e regularmente escrutinado constituiria uma garantia adicional de que as empresas teriam ainda mais incentivos do que têm hoje para fazerem o melhor que está ao seu alcance dentro dos constrangimentos existentes. E haveria também benefícios para as próprias empresas. A realização destes estudos após cada eleição poderia contribuir para levar o batalhão de comentadores que, usando regular e sistematicamente as sondagens para fazer valer os seus argumentos e preferências políticas entre eleições, se mostram logo dispostos após as eleições a declarar a “incompetência” (após os fracassos) ou a “competência” (após os sucessos) das empresas de sondagens, a proferirem as suas sentenças com um pouco mais de informação. Para quem trabalha no ramo, isto seria também uma ocasião para aprender, repensar opções metodológicas e melhorar a qualidade do trabalho. “Segredos”? Há limites para o tipo de “segredos” que pode haver numa actividade com esta importância e potencial (apesar de raramente demonstrado) impacto político. É verdade que isto não garante que as coisas iriam sempre correr bem. Em várias eleições britânicas desde 1992, os desvios das sondagens foram ainda consideráveis. Em França, depois da catástrofe de 1997, onde as sondagens foram incapazes de antecipar a derrota da direita, os vários estudos realizados não impediram um segundo fracasso em 2002, com a subestimação da votação em Le Pen. Outros exemplos destas persistentes dificuldades poderiam ser avançados. Mas até a forma como esse fracassos são lidos e interpretados poderia ser um pouco mais tranquila e racional se fossem sempre seguidos de uma abordagem transparente do que se terá passado.

A alternativa que tem sido avançada a tudo isto é a de proibir a realização e divulgação de sondagens durante a campanha. Não seríamos caso único. Mas podemos, por isso mesmo, apreciar melhor as consequências de semelhante proibição. Na verdade, seria uma medida com a qual quer os partidos quer algumas empresas do sector poderiam concordar facilmente. Muitas continuariam a poder conduzir a maior parte do trabalho que já fazem hoje nestas áreas, ou seja – especialmente em véspera de autárquicas – trabalhos para os partidos políticos. E não seria a proibição da divulgação de sondagens nas últimas duas, três ou quatro semanas antes de uma eleição que impediria alguns partidos de fazerem aquilo que já fazem hoje. Por exemplo, comparar sondagens realizadas a um mês ou mais das eleições com os resultados finais, em eleições actuais ou passadas, sempre que isso lhes for útil para a sua argumentação política. Nem os impediria de anunciar, durante a campanha, a existência de “sondagens” realizadas por si ou para si próprios, cujos resultados e métodos permaneceriam completamente opacos e inverificáveis para os eleitores.

Nunca estive seguro de que as sondagens de intenções de voto divulgadas ao longo da campanha dessem uma grande contribuição para a nossa democracia. Elas alimentam a ilusão de que os resultados podem ser sempre infalivelmente previstos e ocupam porventura excessivo espaço na cobertura das eleições, transformando-as numa “corrida de cavalos” que talvez nos afaste do essencial que deveria ser discutido numa campanha. E já perdi as derradeiras ilusões sobre a capacidade do que escrevi acima para persuadir aqueles que preferem sempre ver nas sondagens um esforço deliberado para manipular a opinião pública. No que proponho, esses verão provavelmente um esforço adicional de manipulação, disfarçando sob uma discussão técnica aquilo que julgam ser um ânimo político das sondagens contra estes ou aqueles partidos. Seja. Não se pode discutir racionalmente com quem tem interesse em, precisamente, afastar a racionalidade da discussão. Contudo, aos restantes, mesmo que sejam uma minoria, sugiro que ponderem as consequências da proibição: mais desinformação, mais opacidade e mais (em vez de menos) manipulação política da opinião pública.

*Resumido aqui, e um estudo adicional aqui.

segunda-feira, junho 08, 2009

Deputados

(Graças a comentários de leitores, rectificado. Obrigado. ):

Num comentário abaixo, sugere-se que seria interessante ver qual seria a distribuição de deputados numas legislativas se os resultados por distrito fossem exactamente iguais aos de ontem. Recorrendo ao site da RTP - que ao Ministério da Justiça, por alguma razão, não consigo aceder - é possível obter os dados por distrito. Não os tenho em base de dados, pelo que os valores foram introduzidos à mão, podendo - espero que não - haver erro de digitação. Mas com estas salvaguardas, os resultados (com a nova distribuição de deputados que está em vigor para as eleições de Setembro/Outubro) seriam os seguintes:

PSD: 96 deputados
PS: 73 deputados
CDU: 23 deputados
BE: 21 deputados
CDS: 16 deputados
MEP: 1 deputado

Estou aqui a presumir que os resultados nos círculos Europa e Fora da Europa seriam iguais aos de 2002. Em suma, neste exercício, PSD+CDS têm 112 deputados. PS+CDU+BE têm 117.

Uma das rectificações que menciono na abertura teve a ver com o MEP. De facto, com 46 deputados a serem eleitos em Lisboa, os 2,32% do MEP seriam suficientes para 1 deputado.

A outra tem a ver com os dados a que acedi de manhã no site da RTP, que estavam incorrectos. Um parágrafo que estava aqui anteriormente sobre me ter chamado a atenção o facto do BE ter ultrapassado os 10% em vários distritos a Norte do Tejo deixou de fazer sentido assim que pude ver os dados no site do MJ.

Safa. Vou mudar o nome deste blogue para A Lei de Murphy. Bem, nem isso consigo: já há.

domingo, junho 07, 2009

Rescaldo

Os resultados ainda são provisórios, mas é muito improvável que qualquer mudança tenha qualquer espécie de importância deste ponto de vista. Avancemos, então, para o rescaldo das sondagens nestas eleições:

1. Serviram as sondagens como um bom elemento de previsão para os resultados? Bem, é evidente que não, mas vejamos a coisa em mais detalhe. O que sempre se faz aqui neste blogue é calcular o chamado "erro 3 de Mosteller", ou seja, simplesmente a média dos desvios absolutos entre os resultados eleitorais e das últimas sondagens para os principais partidos:



Em média, as sondagens diferenciaram-se dos resultados eleitorais de cada um dos cinco maiores partidos em 2,5 pontos no caso da Marktest, 2,8 nos casos do CESOP e da Eurosondagem e 3 pontos no caso da Aximage. A "média das médias" é 2,8 pontos. As diferenças entre o desempenho das diferentes sondagens não é muito relevante: são uniformemente distantes dos resultados finais, em especial em comparação com o desempenho geralmente muito superior nas eleições nacionais imediatamente anteriores, como as Presidenciais ou as Legislativas. Mas a Marktest, para além de ter o menor erro médio, tem uma clara vantagem em relação às outras num aspecto crucial: foi a única a, correctamente, colocar o PSD à frente do PS. Parabéns à Marktest.

2. Nas sondagens à boca das urnas - que medem comportamentos em vez de intenções - o desempenho, claro, foi superior, quando comparamos os resultados com os pontos centrais dos intervalos fornecidos:



O erro médio da Intercampus foi 0,5, do CESOP 0,9, e da Eurosondagem 1,1 pontos. A Intercampus foi quem esteve globalmente mais perto.

3. Vai correr alguma tinta sobre a falta de "credibilidade" das sondagens pré-eleitorais, e é inteiramente justo que se aborde a coisa assim à luz destes resultados. Mas note-se que isto não é novidade em relação às Europeias. Em 2004, "a média dos erros absolutos médios" cometidos pelas quatro últimas sondagens pré-eleitorais foi de 2,5 pontos, pouco menor que em 2009. E em geral, como tinha recordado aqui no dia 5, este é o padrão geral na comparação entre as sondagens feitas para as Europeias com o que se passa nas Legislativas desde 1991. Grande candidato para explicar o problema? A abstenção, evidentemente. Mas isto não isenta quem faz sondagens de responsabilidades: infelizmente, há uma frase de um artigo que escrevi em 2005 que continua a ser verdade:

"However, large errors remain the norm in polls pertaining to European Parliament elections, suggesting a shared inability of Portuguese polling organizations in dealing appropriately with the problems caused by low turnout."

Fica-me a fraca consolação de não ter de lhe mudar uma vírgula.

4. E tendo em conta tudo o que se passou na campanha no que respeita a sondagens, especialmente, desta vez, em relação ao CDS-PP e (não só, mas especialmente) ao CESOP, já sei o que me espera nos próximos dias. "Eu bem te disse" será o mínimo dos mínimos. Pois. Mas notem:

- continua a ser verdade que o CDS-PP não é invariavelmente subestimado, nas sondagens pré-eleitorais, em todo o tipo de eleições e, nalguns casos, essa subestimação (ou sobrestimação) é estatisticamente irrelevante.
- a hipótese de que o eleitor do CDS-PP é mais atreito a ocultar o seu sentido de voto, várias vezes aventada para explicar os casos em que as sondagens pré-eleitorais têm resultados inferiores aos das eleições, colide com a capacidade das sondagens à boca das urnas para captarem o voto no CDS-PP, como se pode ver acima. Se ocultaram numa, porque não ocultaram nas outras?

Dito isto, obviamente, o que se passou desta vez tem peso, e não só por ser mais notório à luz da controvérsia ocorrida: é que a subestimação do CDS-PP, desta vez, foi muito maior do que tinha ocorrido antes quando o CDS-PP foi subestimado no passado (mais do que nas legislativas de 2002, certamente, e até mais do que nas Europeias de 1999, se a memória não me falha aqui). As sondagens pré-eleitorais subestimaram o CDS-PP entre 5,1 (Marktest) e 2,3 (Eurosondagem) pontos. Basta ver a olho para perceber que é muito ponto para um partido com menos de 10% dos votos. Por mero acaso é que isto não aconteceu. Mas porquê? Dificuldade em captar a tendência (ascendente) do CDS-PP em campanha? A tal "ocultação" (mas como compaginá-la com os resultados da boca das urnas)? Problemas de amostragem (mas como é que sondagens telefónicas, presenciais, aleatórias e por quotas partilham o mesmo problema)? Mais hipóteses (não conspirativas)? Se as têm, seria interessante discuti-las.

Obrigado pela atenção, e até breve.

sexta-feira, junho 05, 2009

Últimas palavras

Assim de repente, ocorrem-me três maneiras de falar destas sondagens e da sua relação com as eleições de Domingo:

1. A primeira é a que se tem seguido até ao momento: pôr os números a falar o mais possível. Haveria eventualmente mais coisas que se poderia fazer, mas a verdade é que com quatro sondagens, ou mesmo com as 13 ao longo de toda a campanha e pré-campanha, há limites para o que se pode fazer. As ideias gerais não vou repetir: estão aqui, aqui, aqui e aqui. Já agora, algumas das coisas que fizemos decorreram directa ou indirectamente de comentários aqui no blogue. Só por isso, já valeu a pena abrir a caixa. Obrigado a todos.

2. Tudo o que diz respeito ao ponto anterior partiu sempre da pressuposição que a única fonte de erro na capacidade das sondagens medirem as intenções de voto no momento em que foram feitas era o erro aleatório associado à selecção de uma amostra que dava a mesma probabilidade a cada membro do universo de ser seleccionado. Sabemos que as coisas não se passam assim. Nenhuma amostra é verdadeiramente aleatória, mesmo que se tente (as pessoas não são bolas nas esfera do Euromilhões, e recusam-se a ser "medidas" ou não estão "lá" para ser medidas quando "deviam" estar). Algumas sondagens até são por quotas. E há uma miríade de potenciais problemas de medição daquilo que se quer medir. Já discuti isto neste blogue muitas vezes, mas no confronto entre as eleições e as sondagens, quase todas as eleições mostram que há um partido ou mais partidos que são sobrestimados pelas sondagens e outros que são subestimados. Claro que isso se pode dever a algo que ocorra entre o trabalho de campo e a eleição. E claro que, ao contrário do que defendem algumas pessoas particularmente imunes ao confronto com os factos, nem sempre são os mesmos partidos que são sobrestimados ou subestimados. Mas isto sugere também a possibilidade de que haja enviesamentos sistemáticos comuns a todas as sondagens num dado contexto eleitoral. Logo, tudo o que resulta das análises descritas no ponto 1 tem de ser visto também deste ângulo mais céptico.

3. Finalmente, a eleição do dia 7 está no futuro, enquanto as sondagens estão no passado. Entre o passado e futuro nem sempre ocorrem coisas que provoquem mudanças nas intenções dos eleitores ou, pelo menos, se ocorrem, dão às vezes ar de se cancelarem umas às outras. Mas há sinais de que, noutros casos, ocorrem. A abstenção é talvez o problema fundamental. Por um lado, está ligado ao ponto anterior (de medição): como apurar se, num determinado momento, alguém tenciona realmente abster-se ou não? As pessoas resistem - porventura cada vez menos - a admitir isso e, logo, dão intenções de voto que não se realizam. Se essas forem sistematicamente diferentes das do que realmente votam, temos o caldo entornado. Mas é também um problema de diferença entre intenções presentes e comportamentos futuros: eu posso achar hoje que vou votar e, no Domingo, arranjar algo melhor para fazer. Se quem chega a esta conclusão for sistematicamente diferente daqueles que não chegam, o caldo entorna-se ainda mais. Em geral, todos os estudos mostram, inclusivamente em Portugal (shameless plug), que eleições de alta abstenção tendem a exibir maiores diferenças entre as sondagens e os resultados. E esta do dia 7 é, claro, desse terrível género.

Tudo isto para dizer aquilo que estas sondagens dizem sobre o que ocorrerá no Domingo tem limites, uns estimáveis (ponto 1), outros infelizmente não (pontos 2 e 3). Logo, se se importam com os resultados, o melhor que têm a fazer é ir votar. E é com esta nota profundamente cívica - abstendo-me de estimar a probabilidade de um voto individual ser decisivo para não desmoralizar ninguém - que me despeço até 2ª feira.

Previsível empate técnico

Não consigo imaginar o que quererá o Público dizer quando diz que um dos resultados mais previsíveis na noite eleitoral será um empate técnico. Penso que quer Vital quer Rangel disseram que a vitória era ter mais um voto do que o oponente. Pelo que, provavelmente, o Público quererá mesmo dizer que os dois terminarão com o mesmo número de votos. Nem sei bem como calcular a probabilidade de que ambos acabem com o mesmo número de votos, mas vou fazer um esforço por quantificar tais quantidades.

Para começar, Portugal tem cerca de 8 milhões de eleitores. Destes, cerca de 65% não votarão, pelo ficamos com 2 milhões e 800 mil votantes. Como apenas queremos analisar a possibilidade de empate entre o PS e o PSD, retiremos os restantes eleitores. Admitamos, para simplificar que o PS e o PSD terão cerca de 2 milhões de votos ao todo. Para haver empate é necessário que vote um número par de pessoas (se o número for ímpar o empate é impossível). Simplifiquemos ao máximo e admitamos que votam exactamente 2 milhões de pessoas (um número par, portanto).

Lamento, mas ainda não chega. Temos de simplificar um pouco mais. Admitamos que a nossa percepção é de uma divisão completa. Ou seja, quando olhamos para um tipo pela rua, atribuímos-lhe a probabilidade de 50% de votar no PS e de 50% de votar no PSD. Com todas estas simplificações, a probabilidade de um empate é 0,00056. Um cenário probabilíssimo, como se vê. Mas, admitamos uma hipótese um pouco mais realista. Dado que o mesmo Público nos diz que o PS aparece à frente em quase todas as sondagens, é razoável admitir que um tipo que encontremos na esquina da rua vá votar PS com uma probabilidade de, digamos, 50,5%. Votará no Paulo Rangel com probabilidade de 49,5%. Com estes novos números, qual seria então a probabilidade de cada um ter um milhão de votos? A resposta a esta pergunta é de 0,000000000000000000000000000000000000000000000021 (salvo qualquer erro a digitar os quarenta e seis zeros). É este cenário que o Público, o melhor jornal Português, considera como um dos mais previsíveis.

A "previsão" do LA-C

Nesta "previsão" do LA-C no post abaixo, tal como explicado ainda mais abaixo, lida-se com a grande variabilidade dos OBN's tomando com base apenas a votação nos 5 maiores partidos. Mas da maneira que isto está em termos de comentário a estes assuntos (ver aqui ou aqui), o Luís ainda se arrisca a que venham dizer que, afinal, "o partido x teve y nas eleições quando a previsão dava y + z".

Logo, apesar do verdadeiro confronto desta previsão com os resultados poder vir a ser feita logo após as eleições (tomando como base, obviamente, o resultados dos cinco maiores), fica aqui a "tradução" da previsão do LA-C em resultados eleitorais "convencionais", presumindo que os OBN serão 9,2%, ou seja, a média ponderada para as 4 sondagens. O que diz a Bola de Cristal do Qui-Quadrado?

PS: 34,5%
PSD: 31,8%
CDU: 9,9%
BE: 9,5%
CDS: 5%
OBN (presumido): 9,2%

Confirmas, Luís? Os intervalos encolherão um pouco, claro. E esta minha operação, evidentemente, "força" a semelhança com a média ponderada. Mas era só para ter a certeza que a coisa era devidamente compreendida.

As minhas “previsões” para a noite eleitoral (2)

E, seguindo a metodologia explicada no post anterior, aqui ficam as minhas previsões:


Quando o Público fizer 30 anos e uma nova antologia dos disparates, este terá lugar de destaque.

"O PS lidera todas as sondagens desde que se iniciou a campanha eleitoral. As vantagens obtidas em relação ao PSD não são, no entanto, significativas e, tendo em conta as margens de erro, o empate técnico é um dos resultados mais previsíveis."

Via Léxico Familiar.

As minhas “previsões” para a noite eleitoral (1)

Os representantes dos pequenos partidos que me desculpem, mas, dado que nenhuma sondagem lhes dá uma votação suficientemente relevante para elegerem um deputado que seja, neste post vou esquecê-los.

Juntando a informação sobre as últimas sondagens realizadas  que o Pedro Magalhães recolheu (com a incerteza sobre alguma destas informações que o Pedro também detalhou). Ficamos com o seguinte quadro:



Os totais não dão 100% precisamente por causa das pessoas que declaram ir votar em Outros/Brancos/Nulos. Se nos centrarmos apenas nas votações dos 5 grandes partidos, ficamos com a seguinte repartição:



Olhando para a ordenação dos partidos a sondagens parecem razoavelmente consensuais. Apenas 2 elementos de discórdia: de acordo com a Marktest é o PSD que lidera a corrida e a CESOP põe a CDU à frente do BE.

Olhando para este quadro não se vê nenhuma sondagem se seja brutalmente diferente das outras. Se tivermos em consideração intervalos de confiança de 95%, é fácil de ver que há resultados finais que são compatíveis com todas as sondagens.

Mas em que sentido é que eu digo que os resultados são compatíveis com as sondagens? Haveria algumas formas de responder a esta pergunta. Por exemplo, o Pedro Magalhães já calculou as médias ponderadas, o que é uma boa forma de lidar com a questão, dado que estas médias correspondem ao estimador de máxima verosimilhança (admitindo distribuições multinomiais como base e mais alguns pressupostos)

Eu vou recorrer a um teste muito simples, que é dado nos cursos de Introdução à Estatística que é o teste do Qui quadrado. Basicamente, Suponhamos que queremos testar a hipótese de que o PS  tem 25% dos votos, o CDS 15% e todos os outros 20%. E, para tal, usamos a sondagem da CESOP. De acordo com a nossa hipótese, em 1426 entrevistados, 357 devia ter declarado votar no PS, 285 no PSD, na CDU e no BE e, finalmente, 214 no CDS. Mas, de acordo com o quadro acima, houve 539 que declararam votar no PS, 507 no PSD, 143 no BE, 174 na CDU e 63 no CDS. Para ver se estas diferenças são estatisticamente relevantes, calcula-se:




Quanto mais próximos esta conta for de zero, mais razoável é a nossa hipótese de partida. Para ver testar se este valor é suficientemente próximo de zero usa-se a distribuição do Qui-quadrado.  Neste caso, rejeitava-se a hipótese de a nossa hipótese ser correcta com uma certeza de 99,99999%.

O exercício que vou fazer no meu próximo post é simples. Usando este teste do Qui-quadrado, perguntar qual seria a votação para cada partido que é mais compatível com as últimas sondagens feitas. Para tal calculo o Qui-quadrado associado a cada uma das sondagens e minimizo a sua soma.

Não entrei aqui em grandes detalhes estatísticos, mas em bom rigor, tal procedimento apenas seria válido se as amostras fossem aleatórias (o que não é o caso), se as sondagens fossem independentes (o que não é garantido), etc, etc. Vejam isto como eu vejo: um mero exercício que apenas seria absolutamente correcto sob condições óptimas.

Como?

Europeias. PS à frente em todas as sondagens, no Portugal Diário.

O PS lidera todas as sondagens desde que se iniciou a campanha eleitoral
, no Público.

O conjunto das sondagens (2)

Mas não temos de ficar por aqui. Uma abordagem possível consiste em tratar as quatro sondagens como uma única. Há, claro, muitas objecções a isto. Mas há uma que, pelo menos, é grandemente afastada: o facto das sondagens terem sido conduzidas em momentos diferentes. Isso ainda sucede, claro, mas a aproximação temporal é muito maior do que sucedia quanto aplicávamos a mesma ideia ao conjunto de todas as sondagens conduzidas até ao momento. Vamos lá, então:





A amostra agora é de 4109 inquiridos. Sobre o CDS-PP ser o quinto partido não há novidades, claro. Mas agora a vantagem do PS sobre o PSD torna-se significativa. Claro que esta abordagem tem vantagens e desvantagens. Estamos a valorizar mais as sondagens com amostras maiores, como deve ser. Mas estamos a desvalorizar sondagens que podem ter eventualmente, apesar de uma amostra menor, uma qualquer outra característica que lhe tenha permitido contornar melhor todas as outras restantes fontes de erro. Estou a pensar na Marktest, claro. Mas entre uma quase certeza (maior amostra, maior precisão) e uma incerteza, creio que ficamos a saber mais quando olhamos para os dados assim.

O conjunto das sondagens (1)

Tenho apenas conhecimento de quatro últimas sondagens. Vamos olhar para elas:



Duas telefónicas, duas presenciais com simulação de voto em urna. Uma com amostragem por quotas (Marktest), três com amostragem estratificada aleatória, sendo que duas delas (CESOP e Marktest) fazem ponderação pós-amostral com base em dados das estatísticas nacionais. Três tratam indecisos como abstencionistas, outra usa um modelo próprio (Aximage). Apesar de tudo, uma razoável diversidade de abordagens.

Questões concretas:
1. Quem estava à frente no momento em que foi feito o trabalho de campo? A única sondagem que "diz" saber a resposta a essa pergunta com elevado grau de confiança é a Eurosondagem. A sua resposta é "o PS". Como vemos no quadro abaixo, tendo em conta a dimensão da amostra, a diferença de 4,1 pontos nessa sondagem é estatísticamente significativa. As restantes três sondagens não sabem a resposta a essa pergunta. Nem mesmo a Aximage, apesar de dar 5,3 pontos de vantagem ao PS. É o preço a pagar por uma amostra reduzida (mas pode ser um preço compensador se isso resultar de uma boa exclusão de não-votantes; com mais de 60% de não-votantes na Aximage, isso pode ser o caso).



2. Quem estava à frente no momento em que foi feito o trabalho de campo: BE ou CDU? A única sondagem que "diz" saber a resposta a essa pergunta é a do CESOP. "CDU", é a resposta. Para todas as outras, as diferenças num sentido ou noutro não têm significância estatística.

3. Qual era o quinto partido no momento em que foi feito o trabalho de campo? Pelo menos, aqui há consenso: o CDS-PP.

Tudo o que está acima presume que as amostras são genuinamente probabilisticas e que não há fontes de erro para além do erro amostral. Não é verdade. Mas é o que temos.

Europeias. Eurosondagem, 1-2 Junho, N= 2033, simulação em urna.

PS: 36,0%
PSD: 31,9%
BE: 10,1%
CDU: 9,0%
CDS-PP: 6,1%
OBN: 6,9%

A amostra é de 2033. Desses, 16,4% estavam indecisos, pelo que as percentagens acima são calculadas em relação a um total de, no máximo, 1700 inquiridos. Não se fala na notícia do Expresso em abstencionistas, pelo que teremos de os presumir ausentes da amostra.

quinta-feira, junho 04, 2009

Europeias. Aximage, 1-4 Junho, N=1274, Tel.

PS: 36,2%
PSD: 30,9%
BE: 10,2%
CDU: 10,1%
CDS-PP: 5,0%


Não sei se é resultado antes ou depois de redistribuição de indecisos. Sei apenas que a soma disto dá 92,4%. É provavelmente mais sensato esperar pelo Correio da Manhã de amanhã antes de tirar mais conclusões sobre esta sondagem.

Actualização (5 de Junho):
1. OBN é mesmo 7,6%. Estas percentagens já excluem indecisos e não respostas. Segundo o CM, a distribuição dos indecisos "foi realizada a partir de um modelo que combina perguntas sobre o tipo de indecisão (abstenção/voto em quem), voto anterior, dinâmica de vitória e simpatia pelos principais candidatos". Interessante.
2. A amostra é de 1274 inquiridos. 65,3% disseram que não iriam votar. Sobram 442. Alguns deles terão dito que estão indecisos, pelo que as percentagens acima terão como base um valor inferior a 442. Mas a julgar pelas anteriores sondagens da Aximage, esse valor não há de ser muito inferior. Vamos considerar 442.

Europeias. CESOP, 30 Maio-2 Junho, N=3375, simulação voto urna.

PS: 34%
PSD: 32%
CDU: 11%
BE: 9%
CDS-PP: 4%
MEP: 2%
PCTP-MRPP: 1%
Outros: 3%
Brancos e nulos: 4%

Esta estimativa tem como base as intenções de voto dos inquiridos que afirmaram "ter a certeza" que irão votar e que forneceram intenções de voto válidas, em branco ou nulo: foram 1584. Podem descarregar mais detalhes aqui.

O que aí vem.

Os quadros seguintes mostram o template que vou usar para analisar cada sondagem.

Um primeiro quadro dá alguma informação geral, mostra as estimativas de resultados eleitorais e o intervalo de confiança a 95% (aproximação à normal) associado a cada estimativa, na base da dimensão da sub-amostra de inquiridos que exprimiram uma intenção de voto, mesmo que seja em branco ou nulo. Um segundo quadro mostra diferenças entre partidos na sondagem, assim como a margem de erro da diferença. Quando a diferença na amostra é inferior à margem de erro, isso significa que essa diferença carece de significância estatística a 95%, e assinalo isso a vermelho. Quando a diferença na amostra é superior, isso significa que a diferença é estatisticamente significativa a 95%, e assinalo isso a verde. Respeitarei a opção de cada instituto de apresentar resultados com ou sem casas decimais. Tudo isto pressupõe, claro, amostragem probabilística, que sabemos ser uma pressuposição inválida. Mas enfim.

Comecemos então pela Marktest. Desde logo, a dimensão da sub-amostra de intenções válidas não se pode calcular na base das notícias saídas até ao momento. Por isso, para já, irei presumir que a percentagem de abstencionistas declarados, indecisos e não respostas é igual à do estudo anterior, o que resulta numa sub-amostra de 383.





O que nos dizem estes quadros:

1. Estritamente na base da sondagem Marktest, não é possível dizer, com um elevado grau de confiança, se a vantagem do PSD sobre o PS na amostra correspondia, à data da sondagem, a uma vantagem real na população.
2. A mesma afirmação serve para a relação entre o BE e a CDU.
3. O mesmo já não sucede com o CDS-PP: a vantagem encontrada da CDU e do BE sobre o CDS-PP é estatisticamente significativa.

Sondagens "sem validade"?

Neste blogue, acusa-se a recente sondagem da Marktest de "não ter validade", e afirma-se que "a amostragem não foi feita de forma rigorosa e profissional". São dois os argumentos apresentados:

1. "O primeiro erro, começa pela sondagem não ter em conta a Região Autónoma dos Açores e a Região Autónoma da Madeira";

2. O facto da distribuição espacial dos inquéritos por regiões "Norte", "Centro" e "Sul" não respeitar a distribuição espacial da população portuguesa.

Vejamos. Primeiro, a ficha técnica da sondagem explica claramente que o universo sobre o qual está a fazer inferências é o da população de Portugal Continental com 18 ou mais anos. O que o post poderia tentar argumentar é que a ausência dos Açores e da Madeira fazem com que não se possa fazer inferências dos resultados do Continente para os resultados totais. Mas nem a sondagem faz essa inferência nem o autor faz esse argumento. Remete para uma questão de "erro de amostragem". Mas isto não é erro nenhum: é uma opção. E ainda por cima, se o autor do blogue tivesse alguma vez olhado para resultados eleitorais, ficaria a saber que, tendencialmente, a inclusão dos Açores e da Madeira tenderia normalmente a aumentar a vantagem do PSD, não a diminuí-la.

A segunda crítica é ainda menos fundamentada:

1. O autor fala da distribuição da população, quando o que mais se aproxima do universo de interesse é a população com 18 ou mais anos.
2. Apresenta dados para Norte, Centro e Sul, divisão que não coincide com as unidades territoriais do INE;
3. Compara esses dados com a distribuição territorial do inquérito da Marktest, sem ter apurado se as categorias que usa coincidem com as da Marktest.

Deputados

Um calculador em Javascript muito jeitoso para os deputados pode ser encontrado aqui. Em vez de votos ponham percentagens. Se tiver casas decimais, multipliquem por 10.

Europeias. Marktest, 27-30 Maio, N=807, Tel.

PSD: 32,5%
PS: 29,4%
BE: 8,9%
CDU: 8,9%
CDS-PP: 3,3%

É o que sei para já, na base desta notícia. Excitante, não? Claro que voltamos ao "empate técnico", ideia que, volto a dizer, é preciso confirmar quando soubermos a dimensão real da sub-amostra na base da qual estas percentagens são estimadas (ainda não sei qual é, mas não é 807, certamente). Mas é a primeira sondagem que coloca o PSD à frente, e isso pode não ser irrelevante, porque pode sugerir uma tendência. Mas com mais dados poderemos olhar melhor para isso. Agora ainda é cedo.

Sei que sou fastidioso, mas recordo, a propósito de uma notícia no Público: se de facto o PSD subiu nos últimos dias, isto não "confirma uma tendência" prévia (indetectável na base dos dados anteriores). E a habitual frase "Se as eleições europeias fossem hoje o [partido x] venceria o escrutínio" está mesmo a pedir inclusão no capítulo no Livro de Estilo do Público intitulado "Frases que constituem justa causa para despedimento".

A soma dá 83%, pelo que presumo que haja 17% de votos noutros partidos, brancos e nulos. Mas rectificarei caso se verifique não ser assim. Obrigado ao leitor que me avisou em comentário no post abaixo.

quarta-feira, junho 03, 2009

Meios de campanha

E já agora, repost de outro tweet da manhã:

"Para mim, que estou muito longe destas realidades, esta peça do Público sobre os meios de campanha é impressionante: http://tcp3.com/j1kz"

Previsão modelo Hix/Marsh para Portugal

Passo para post uma informação que mandei num tweet hoje de manhã e que me reapareceu num comentário abaixo:

Previsões actualizadas modelo Hix/Marsh para Portugal:

PS: 35% (9);
PSD: 30% (7);
BE: 11% (2);
CDU: 10% (2);
CDS-PP: 8.5% (2)

segunda-feira, junho 01, 2009

Voto obrigatório

O facto de se erigir a liberdade individual como único e exclusivo princípio em torno do qual se deve organizar a delegação de poder dos cidadãos em representantes numa democracia (ignorando os restantes princípios básicos, a saber, igualdade política e capacidade de controlo dos representantes) e querer sempre terminar por aí qualquer discussão é bastante revelador da cultura política de um certo tipo de liberalismo.

P.S. - Caro João. Quem apanhe esta discussão a meio fica a pensar que eu defendi o voto obrigatório no artigo do Público. Não defendi, pelo contrário, como certamente reparou. Mas escrevi um parágrafo no texto sobre a discussão do tema num plano meramente normativo, simplesmente para dizer que a discussão é muito difícil de resolver nesse plano, e que de todo se pode resolver numa penada, como esta sua penada que critiquei neste post. Só para dar um exemplo, consentir que apenas algumas pessoas votem (e outras não) pode ser visto como algo que colide com a igualdade política, se acreditarmos que há obstáculos económicos e sociais ao voto que um regime democrático deve tomar em conta e resolver (ver aqui, aqui ou aqui). E note que eu nem sequer disse que concordo com esta segunda visão. O que procurei fazer foi dizer que, num plano meramente normativo, a questão é muito mais difícil do que é sugerido pelo seu post inicial, e que podemos tomar um atalho: questionar, do ponto de vista empírico, as pressuposições sobre os efeitos do voto obrigatório daqueles que o defendem no plano dos princípios.

domingo, maio 31, 2009

Tendências?

Políticos e comentadores têm falado de "tendências" nas sondagens para as europeias. Como procurá-las? Uma maneira possível é tirar partido do facto de quatro dos cinco institutos de sondagens já terem realizado mais do que uma sondagem em momentos diferentes no tempo. O quadro seguinte mostra a diferença, para cada partido e cada instituto, entre a sondagem mais recente e a sondagem anterior, na base do quadro mostrado no post anterior:



Nem me arrisco a fazer qualquer tipo de afirmação sobre isto, a não ser para vos dar um elemento adicional. Há um teste estatístico sobre a diferença de proporções entre duas amostras independentes (ver aqui, por exemplo). Se o fizermos, para as duas sondagens de cada instituto e para cada partido, e tomando em conta as dimensões das sub-amostras, só quatro dessas diferenças emergem como estatisticamente significativas a 95%:

- 3 na Intercampus: BE (-), CDS-PP (-) e OBN (+);
- 1 na Aximage: OBN (+).

Europeias, Ponto de Situação

Sondagens divulgadas até ao momento:



Média ponderada das sondagens realizadas até ao momento e teste de significância das diferenças entre partidos:

Taxas de resposta

Seguindo um link colocado num comentário a uma mensagem abaixo, cheguei a este interessante post. Uma das questões levantadas tem a ver com as taxas de resposta anormalmente altas que são reportadas nas fichas técnicas de algumas sondagens.

Note-se que a taxa de resposta em entrevistas telefónicas corresponde à proporção de entrevistas completas sobre a soma das seguintes parcelas:

1. Entrevistas completas
2. Entrevistas iniciadas mas não completadas;
3. Recusas;
4. Casos em que não se estabeleceu contacto com a pessoa que deveria responder;
5. Outros casos em que a pessoa que deveria ter sido inquirida não o pôde ser (falecido, incapaz de responder por razões físicas ou psíquicas, problemas linguísticos, etc.);
6. Casos em que não se conseguiu apurar se o nº de telefone seleccionado corresponde a um domicílio;
7. Casos em que o nº de telefone esteve ocupado nas várias tentativas.
8. Casos em que não se conseguiu determinar se no domicílio existe um membro do universo.

É evidente, para quem saiba um mínimo sobre como este tipo de sondagens correm realmente, que a divisão do valor 1 sobre a soma dos valores 1 a 8 nunca dá 0,85, ou seja, não há taxas de resposta de 85% em inquéritos deste género. Logo, uma das coisas com que a ERC se deveria preocupar, a meu ver, seria garantir que todos os institutos usam, nas suas fichas técnicas, a mesma definição do que é uma taxa de resposta, porque pelos vistos não o estão a fazer. Estarão, provavelmente, a relatar uma taxa de cooperação, que é simplesmente o rácio do valor em 1 sobre a soma dos valores 1 a 3 (na sua versão mais "benévola"). O que significa também que, enquanto não houver convergência de critérios, ninguém vai dar a taxa de resposta (ninguém está disposto a fornecer valores reais de 10-30% para que eles sejam - ilegitimamente - comparados com valores de 85%).

Isto é especialmente importante para as sondagens que usam amostragem aleatória porque, como se diz no post que mencionei inicialmente, é assim que se mostra em que medida a amostra obtida se desvia da presunção de que todos os seus elementos resultaram de uma selecção dos membros do universo com igual probabilidade.

sábado, maio 30, 2009

Coisas que me chegam pelo Google Alerts

"Foguete de sondagem faz voo-teste do Centro de Lançamento de Alcântara".

"
Não houve uma única eleição em que eu tivesse participado em que as sondagens não tivessem apresentado para o CDS piores resultados do que os votos em urna. O CDS vai ter um grande resultado."

"Manuela Moura Guedes criticou esta noite a «falta de ética» e o «comportamento jornalístico» do Diário de Notícias. Em causa, o facto de a edição electrónica do diário ter referido durante a tarde uma sondagem exclusiva da TVI."

E a grande vencedora de hoje:
"Ainda é muito cedo para vaticinar uma vitória do PS (...) são factores que vão determinar uma vitória do PS"

Europeias. Marktest, 20-22 Maio, N=804, Tel.

PS: 31,9%
PSD: 30,1%
BE: 7,1%
CDU: 7.1%
CDS-PP: 4,7%
OBN: 19.1%

Estas percentagens são em relação a um total de 382 inquiridos, já que, dos 804, 387 não responderam ou disseram não saber em quem votar ao passo que 35 declararam que não votariam.

Gostava de chamar a atenção para uma coisa. Aqui há uns tempos, a propósito do Barómetro da Marktest para as legislativas, lembrei que a Marktest faz ponderação pós-amostral usando a recordação de voto em 2005 como variável de ponderação. Mais recentemente, quando olhei para os resultados da sondagem anterior da Marktest sobre as europeias, desconfiei. Mas agora confirmei: a Marktest, no caso das europeias, não faz ponderação pós-amostral. E fica por isso com valores para os OBN semelhantes àqueles que tipicamente apresenta nas sondagens sobre as legislativas antes de ponderação. Na sondagem sobre as legislativas divulgada também hoje, por exemplo, os OBN antes de ponderação são 17,2%.

Por que faz a Marktest isto? Não sei. Eu imaginaria que um procedimento que tem como objectivo corrigir distorções da amostra serve tão bem (ou tão mal) para perguntas sobre uma eleição como para perguntas sobre outra (ou, de resto, para perguntas que nem sejam sobre eleições). Mas deve haver uma razão. Já os simpatizantes de um dos "Outros" partidos talvez não devam gastar os foguetes todos a propósito destes "19,1%" (se bem que, se eu fosse um político de um desses partidos, se calhar já tinha começado a explicar que a Marktest anuncia uma transformação radical do sistema partidário português...).

sexta-feira, maio 29, 2009

Europeias. Intercampus, 15-26 Maio, N=992, Presencial (voto simulado em urna)

PS: 37,1%
PSD: 32%
BE: 9,9%
CDU: 7,7%
CDS-PP: 3,5%
OBN: 9,8% (outros partidos representam 4,9%).

19,2% da amostra era composta por Não sabe/Não responde, pelo que as percentagens acima foram calculadas em relação a uma base de 802 inquiridos. Não detecto em sítio nenhum números sobre abstencionistas declarados, pelo que mais uma vez presumo que ou a amostra é composta por pessoas que afirmam tencionam votar ou os abstencionistas declarados estão entre os 19,2%.

Obrigado aos leitores que foram enviando esta informação.

Europeias, Ponto de Situação



Já agora, mesmo ciente das objecções possíveis, aqui vão os resultados caso estas sondagens fossem uma única (ou seja, uma média ponderada de todas as sondagens), com uma amostra de 5326 inquiridos com intenções de voto válidas, branco e nulo:



Reporto apenas intervalos de confiança com aproximação à normal, dado que, com uma amostra destas, os resultados são exactamente (à décima) iguais aos dos intervalos exactos. Notem como as diferenças entre PS e PSD, BE e CDU, e CDU e CDS estão todas acima da margem de erro (explicação aqui, com links para fontes).

Sobre intervalos de confiança para distribuições multinomiais, há uma discussão interessante entre o LA-C e um comentador aqui. Segundo percebo, o paper mais citado sobre o assunto é este. Mas o tema está muito para além das minhas capacidades.

Europeias. Eurosondagem, 25-27 Maio, N= 2525, Tel.

PS: 35,5%
PSD: 32,5%
CDU: 9,2%
BE: 8,8%
CDS-PP: 6,5%

A soma disto dá 92,5%, pelo que presumo que OBN:7,5%.

A notícia menciona igualmente que, entre os 2525, 19,2% (485) não sabe ou não responde. Pelo que a sub-amostra de eleitores com intenções de voto será de 2040 inquiridos. Não há menção de abstencionistas declarados nas várias notícias que consultei, pelo que presumo que, entre os 2525, todos afirmaram que iriam votar. Mas estou a presumir.

quinta-feira, maio 28, 2009

Intervalos de confiança exactos (e outros)

Para os cálculos que o LA-C fez aqui à unha (ou seja, com o Matlab), há um bom simulador online que calcula quatro tipos de intervalo de confiança. O intervalo habitualmente estimado (por aproximação normal à binomial, que usei aqui) é o Wald. O que o Luís calculou é o exacto. Quanto aos outros, a página explica, mas eu vou ter de ruminar mais um bocadinho sobre o assunto. Há também estimativas pontuais alternativas. Um maná.

E um mini-paper que desenvolve o que o Luís explicou.

Ainda o empate entre o PS e o PSD

Há quem não goste da estratégia de tratar de várias sondagens como se de uma só (grande) sondagem se tratasse. Os argumentos são legítimos: Não podemos saber se não terá havido uma pessoa a responder a mais do que uma sondagem, as metodologias das sondagens são diferentes, o tratamento dos indecisos é diferente, etc, etc. Todos estes argumentos são válidos apesar de, na minha opinião, serem pouco relevantes. De qualquer forma, podemos pegar no problema por outra perspectiva.

Vamos admitir que o PS e o PSD estão, de facto, empatados. Se esta hipótese estiver correcta, então a probabilidade de o PS aparecer à frente numa dada sondagem é de 0,5 (50%). A probabilidade de aparecer à frente em duas sondagens é de 0,5x0,5=0.25 (25%). A probabilidade de aparecer à frente nas seis sondagens já realizadas seria de 0,5^6=0,015625 (1,56%). Ou seja, se os partidos estivessem empatados, a probabilidade de nas 6 sondagens já feitas o PS aparecer sempre à frente seria de 1,56%. Podemos então pôr de parte essa hipótese de ambos estarem empatados com um grau de certeza de 98,4%. É impossívelque estejam empatados? Não, apenas altamente improvável. O mesmo raciocínio se aplica à disputa pelo terceiro lugar, entre o BE e o CDS, e à disputa para o 4º lugar no pódio, disputa entre o CDS-PP e a CDU.

quarta-feira, maio 27, 2009

Intervalos de confiança (só para nerds)

Num dos seus últimos posts, o Pedro explicou com algum detalhe como se calculam intervalos de confiança a partir das sondagens. Penso que explicou muito bem, mas houve algo que não explicitou.

A ideia de um intervalo de confiança é tentar perceber que votações num dado partido são compatíveis com uma dada sondagem. Por exemplo. Suponhamos que uma sondagem dá 40% ao PS. É apenas uma sondagem, não podemos ter a certeza de que a percentagem de votantes no PS seja, de facto, 40%. Pergunta-se então que valores que são compatíveis com os 40% da sondagem? Se a sondagem aponta para 40%, então não é razoável acreditar que o verdadeiro valor das intenções de voto seja 80%, por exemplo. Já 38 ou 42% parecem valores razoáveis. E 48%?, é razoável? É na definição dos extremos que entram os intervalos de confiança.

Por qualquer motivo, que desconheço, convencionou-se que um bom intervalo de confiança era o de 95%. A ideia é subtil. Escolhe-se um intervalo de tal forma que se se fizessem muitas sondagens, 95% delas incluiriam o verdadeiro valor da votação do PS nos seus intervalos de confiança. Isso quer dizer que se, se fizer muitas sondagens, uma em cada 20 errará por muito.

Como calcular esse intervalo de confiança? Quem sabe uns rudimentos de estatística, sabe que a distribuição dos votos segue uma lei de probabilidade binomial. Mas esta é daquelas distribuições que é chatinha de usar, pelo que a maioria das pessoas usa a lei normal, que é muito simples de usar e é uma aproximação bastante razoável na maioria dos casos.

Infelizmente, quando se fala de partidos com pequenas votações a aproximação deteriora-se bastante, podendo até levar a situações de puro nonsense. Imagine o leitor que numa amostra de 400 pessoas, 0,7% declararam votar no POUS. Um intervalo de confiança de 95% incluiria todos os valores desde o 0,1% negativos até ao 1,5% positivo. Ou seja, estar-se-ia a considerar como hipótese razoável que o POUS tivesse um número negativo de votos. Já se se usasse a lei binomial concluir-se-ia, correctamente, que o intervalo de confiança ia de 0,15% até 1,79%. Refaço o quadro que o Pedro fez com os intervalos de confiança para a última sondagem da Aximage, com percentagens calculadas para um universo de 401 pessoas):



Veja-se que a aproximação que o Pedro fez é quase perfeita para o PS e PSD, subestima um pouco a votação dos pequenos partidos (BE, PCP e CDS) e prejudica bastante os micro partidos (o meu intervalo inferior é 30% mais elevado que o do Pedro). Repare-se que este fenómeno pode ajudar a explicar a sensação que muitas vezes se tem de que as votações dos pequenos partidos, sistematicamente, se situam na parte superior do intervalo de confiança. Muitas vezes ouvi dirigentes do PCP e do CDS a queixarem-se disto mesmo.

Olhando para os intervalos de confiança estimados a partir desta sondagem, não se poria de parte a hipótese de o PSD ser o mais votado, nem de o CDS-PP ser a terceira força. Infelizmente para uns, e felizmente para outros, o facto de haver várias sondagens permite reduzir os intervalos de confiança. Como mero exemplo académico, imagine o leitor que em vez de uma sondagem da Aximage, havia 4 sondagens diferentes, feitas seguindo a mesma metodologia e que em média, os resultados são iguais ao quadro de cima. Excluindo a hipótese de haver alguém que tenha respondido a mais do que uma sondagem, temos o equivalente a uma grande sondagem feita com base em 1604 pessoas:



Os intervalos de confiança ficam bem estreitos. Dado que já várias sondagens foram feitas e que todas apontam para uma vitória do PS é difícil de aceitar a hipótese de o PSD e o PS estarem empatados. Para já, o PS leva vantagem.

Europeias: ponto de situação

Desopilar

"Por outro lado, enquanto líder do PSD-M, [Alberto João Jardim], questionado sobre a sondagem que aponta para um empate técnico entre PSD e PS para as eleições europeias, começou por dizer que nao comenta sondagens e que «de empates estou eu farto no Marítimo".

A última sondagem da Aximage, reloaded

Ora bem: tudo esclarecido na versão em papel do Correio da Manhã (parabéns ao CM, já agora):

Abstenção: 64,7% (776 dos 1200 inquiridos, na base do gráfico apresentado)

Intenções de voto antes de redistribuição de indecisos:
PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU (PCP): 7,9%
CDS-PP: 6,3%
OBN: 2,8%
Indecisos: 5,4%

Intenções de voto após redistribuição de indecisos (tratados como abstencionistas; meu cálculo):
PS: 40,2%
PSD: 32,9%
BE: 9,0%
CDU (PCP): 8,4%
CDS-PP: 6,7%
OBN: 3,0%
(Soma dá 100,2% devido a arredondamentos)

Agora notem uma coisa interessante. Se na amostra há 776 declarados abstencionistas, e se nos 424 que indicaram que iriam votar há 5,4% de indecisos (23 pessoas), então a sub-amostra na base da qual os últimos resultados são calculados é composta por 401 observações. E se é assim:


Então esta sondagem dá (espero não ter errado nenhuma fórmula)... outro empate técnico entre o PS e o PSD, seja do ponto de vista mais vulgar da "sobreposição de intervalos" seja do ponto de vista mais correcto da significância estatística da diferença entre as duas proporções. Não parecia, pois não? Isto, claro, na presunção de que os 64,7% de abstencionistas correspondam a 64,7% da amostra. Mas no CM em papel não ficam dúvidas disso.

Por outro lado, como expliquei aqui no outro dia, não é de todo indiferente que esta seja a sexta de seis sondagens onde, havendo "empates técnicos", há sempre mais intenções de voto no PS que no PSD...

terça-feira, maio 26, 2009

Europeias. Aximage, 18-22 Maio, N=1200, Tel.

PS: 38,0%
PSD: 31,1%
BE: 8,5%
CDU: 7,9%
CDS-PP: 6,3%

Aqui e aqui. As notícias são omissas sobre indecisos, pelo que talvez possamos presumir que o que falta aqui para 100% (8,2%) serão votos para outros partidos, brancos e nulos.

Mais sobre "empates técnicos" (só para nerds)

Um comentário de um leitor chamou-me imediatamente a atenção para que posso ter estado a induzir leitores em erro sobre a questão de quando é que a diferença entre dois partidos se pode dizer ser "estatisticamente significativa" numa sondagem. O que fiz aqui num post anterior foi usar a definição comum de "empate técnico" (sobreposição de intervalos ditados por margens de erro associadas a duas estimativas diferentes) e, aproveitando para ilustrar algumas aplicações erróneas do conceito de margem de erro (que ignoram a ideia de "margem de erro máxima" ou não tomam em conta a dimensão das sub-amostras de eleitores com reais intenções de voto), mostrar que, na base dessa definição, todas as sondagens para as europeias foram "empates técnicos" entre o PS e o PSD.

Mas importa notar que, se quisermos mesmo saber se as diferenças entre dois partidos numa sondagem são estatisticamente significativas com um determinado nível de confiança, a abordagem, sempre que haja mais do que duas opções de resposta, tem realmente de ser diferente (a abordagem que vou adoptar aqui não é a mesma, julgo, daquela que usou o comentador, mas a mensagem genérica é a mesma).

A margem de erro associada às diferenças entre as proporções dos partidos não é a mesma coisa que a margem de erro associada a cada proporção. Para isso, temos de calcular - desculpem o jargão - a variância da diferença entre duas proporções multinomiais. Eis a fórmula:


O caso concreto que dei foi o de converter as cinco sondagens numa única, em que 2477 respondentes teriam dado as suas intenções de voto numa única pergunta. Nesse caso, o PS teria 35,5% dessas intenções, e o PSD 33,3%. A margem de erro (com 95% de confiança) para a diferença entre o PS e o PSD equivale a:



Esse valor, com estes resultados e com um N de 2477, é de 3,27%. Por outras palavras: a diferença obtida na sondagem (2,2 pontos percentuais) é inferior à margem de erro para a diferença entre as estimativas (3,27). A diferença não está fora da margem de erro. Logo, aqui sim, "empate técnico" propriamente dito.

Já agora: se a dimensão da amostra, em vez de 2477, fosse de 5500 inquiridos, a margem de erro das diferenças seria 2,19%. Por outras palavras, a mesma diferença entre o PS e o PSD (2,2 pontos) já seria estatisticamente significativa.

Tudo isto está superiormente (como sempre) explicado aqui, que por sua vez o tirou do "clássico dos clássicos".

Uma impressão de campanha

Escreve aqui alguém que, ao contrário do que alguns possam imaginar, não percebe rigorosamente nada de campanhas políticas. Mas queria notar apenas, de forma meramente intuitiva, o contraste enorme entre a campanha do PS para estas europeias e a dos restantes partidos. Há na campanha do PS uma quase total "despersonalização". Os cartazes mostram figurantes contratados, falam de eventos históricos e só ao longe, estabatidas, estão as personalidades políticas, algumas delas sem relevância directa para os dias de hoje. Vital Moreira está ausente dos cartazes e parece, nas suas aparições públicas, uma pessoa algo diferente daquela que se conhecia de outras aparições noutros contextos. A ideia de meter Ana Gomes e Elisa Ferreira nas listas, se era para lhes dar visibilidade acrescida para as suas campanhas posteriores, não está a funcionar muito bem. Pelo contrário, BE, CDS-PP, PSD e até a CDU apresentam os seus candidatos, mesmo que alguns sejam completos desconhecidos. E nota-se um esforço do PS em remeter o seu discurso para questões "europeias", ao passo que os restantes partidos não passam sem uma ligação da Europa aos problemas nacionais, ou seja, àqueles que interessam aos eleitores.

Imagino que isto seja deliberado, pensado, eventualmente até testado com focus groups e sondagens. E daí talvez não. Talvez esta campanha do PS esteja a ser conduzida e organizada por pessoas sem competência para a função. Já sucedeu no passado com vários partidos, em várias eleições. E costuma ser um indicador interessante sobre a "saúde" de um partido, a sua coesão e motivação e o grau de isolamento da sua liderança. Dentro de poucas semanas, saberemos melhor.

segunda-feira, maio 25, 2009

Em 2004, foi assim

Um fenómeno muito conhecido e quase sempre repetido é que, à medida que nos vamos aproximando da data das eleições, os resultados das sondagens começam a convergir. Seja porque só no final as intenções dos eleitores começam a "cristalizar" seja porque as sondagens look over their shoulders, é isso que quase sempre sucede. Veremos o que sucederá na próxima semana. Mas em 2004, foi isso mesmo que sucedeu. O quadro mostra os resultados das sondagens divulgadas na última semana. Onde foram apresentados resultados com indecisos, tratei-os como abstencionistas, para tornar os resultados comparáveis entre si e com resultados de eleições. Como vemos, por essa altura, todas indicavam mais intenções de voto para o PS do que para a coligação PSD/CDS-PP, como veio a suceder. E as diferenças entre as sondagens são bem menores que aqueles que verificamos hoje nas sondagens realizadas até agora para as europeias de 2009.





Contudo, ao contrário do que veio a suceder um ano depois nas legislativas, permaneceram grandes variações quer na estimação das intenções de voto na coligação quer na votação da CDU. E todos indicaram mais intenções de voto no BE do que aquele que veio a ser o seu resultado (mesmo que as diferenças sejam insignificantes em dois casos). Por outras palavras, repetindo um padrão já conhecido, eleições com muito elevada abstenção tendem a produzir maiores discrepâncias entre as sondagens e os resultados eleitorais, assim como maiores discrepâncias das sondagens entre si. Intenções de voto recolhidas acabam por não se converter em comportamentos, e diferentes pressuposições sobre como tratar o fenómeno da abstenção e estimar o que poderá ser o "votante provável" acabam por fazer sentir os seus efeitos neste confronto entre sondagens realizadas a uma semana das eleições e os resultados. Logo, eu seria céptico sobre a possibilidade das próximas sondagens "resolverem" todas as dúvidas sobre o que poderá suceder dia 7, especialmente porque, desta vez, tudo o que vimos até ao momento sugere que a margem de vitória de seja quem for o vencedor será certamente menor.

"Empate técnico"

Noto alguma agitação na blogosfera (e não só) devido ao "empate técnico" entre o PS e o PSD declarado pelo Expresso a propósito da última sondagem da Eurosondagem sobre as europeias. Se bem entendo, o "empate" é declarado porque a diferença entre o PS e o PSD (2,2%) é igual à margem de erro declarada na ficha técnica (2,2%). "Vantagem do PS é de apenas 2,2%, o que equivale praticamente à margem de erro deste estudo de opinião", escreve-se no Expresso.

Minha nossa. Ora vamos lá outra vez:

1. A margem de erro anunciada na ficha técnica não é a margem de erro associada às estimativas para o PS ou para o PSD. Por duas razões. Primeiro, a dimensão da amostra na base da qual essas margens de erro têm de ser estimadas é inferior à dimensão da amostra geral na base da qual se apresenta calcula a margem de erro anunciada na ficha técnica. É inferior porque as percentagens são calculadas em relação a uma base que exclui indecisos e abstencionistas. Segundo, a margem de erro apresentada na ficha técnica é uma margem de erro máxima, presumindo amostragem aleatória e com uma confiança de 95%. Essa margem de erro máxima é a associada a uma estimativa de 50%. Quando as estimativas são superiores ou inferiores a 50%, a margem de erro é diferente (inferior).

2. Logo, se quisermos saber qual é o intervalo que cada sondagem está a estimar para cada estimativa - mais uma vez, presumindo amostragem aleatória e com 95% de confiança - não se trata de somar e subtrair 2,2% (ou seja lá o que a ficha técnica identifique como margem de erro máxima) a cada resultado, como muita gente costuma fazer. A margem de erro tem de ser calculada para cada caso, tendo em conta a sub-amostra em relação à qual as percentagens são calculadas e o valor concreto que está a ser estimado.

3. As notícias na imprensa nem sempre são claras quanto à dimensão dessa dita sub-amostra. Só lá se pode chegar por inferência, usando a informação sobre a dimensão da amostra geral, a percentagem daqueles que dizem que não votariam e a percentagem dos indecisos (normalmente tratados como abstencionistas quando se trata de redistribuir).

4. Se o fizermos, chegamos rapidamente à conclusão que todas as sondagens divulgadas até agora sobre as Europeias configuram um empate técnico entre o PS e o PSD, se por "empate técnico" entendermos intervalos que se sobrepõem para as estimativas dos dois partidos (presumindo amostragem aleatória e com 95% de confiança). A saber:

Marktest:
PS: 27,3-38,9
PSD: 27,1-38,7

Intercampus:
PS: 29,3-38,7
PSD: 28,8-38,2

CESOP:
PS: 34,5-43,5
PSD: 31,6-40,4

Aximage:
PS: 33,5-47,5
PSD: 27,3-40,7

Eurosondagem:
PS: 31,6-37,0
PSD: 29,4-34,8

Os intervalos são enormes? São: porque são tantos os que se declaram abstencionistas ou indecisos que a sub-amostra que sobra para estimar resultados é diminuta. E é assim que as coisas são, não há volta a dar-lhe. Só no planeta em que vive o deputado Marco António é que as "boas" sondagens têm toda a gente a dizer que vai votar e a saber perfeitamente em quem.

5. Se a isto somarmos que:
- as sondagens foram conduzidas em momentos diferentes;
- usam metodologias completamente diferentes e há muitas fontes de erro para além do erro aleatório amostral;
- estimam intenções de voto num momento, e não comportamentos no futuro;
- nenhuma amostra é verdadeiramente aleatória (tendo em conta recusas e impossibilidade de encontrar o inquirido que devia responder) e algumas não são aleatórias de todo (usando quotas);
- as margens de erro são estimadas com 95% de confiança (1 em cada 20 inquéritos vai produzir resultados fora da margem);
- as discrepâncias enormes entre os resultados das cinco sondagens...

ficamos com uma boa ideia da incerteza associada aos resultados do próximo dia 7.

6. Dito isto, atenção. Apesar de termos cinco "empates técnicos", as sondagens têm uma coisa em comum. O PS está à frente em todas. Podem estar todas erradas, claro. Mas que o PS tenha estado sempre à frente não é indiferente. Imaginem que, em vez de as tratamos com cinco sondagens diferentes, as tratamos com uma única sondagem, em que a sub-amostra dessa "super-sondagem" é a soma das sub-amostras das restantes (2477 inquiridos). Se o fizermos, o PS aparece com 35,5% e o PSD com 33,3%. Mas a margem de erro associada a ambos os casos é substancialmente menor, 1,88% para o PS e 1,86% para o PSD. Continua a ser "empate técnico", mas note-se, por exemplo, como o resultado máximo do PSD (35,1%) é inferior à estimativa pontual para o PS (35,5%). Mas as sondagens foram conduzidas em momentos diferentes, usam metodologias diferentes, etc, etc, etc. "Incerteza", sim, parece-me bem, para já.