segunda-feira, janeiro 10, 2011

Presidenciais



















Acrescentei os resultados das últimas sondagens Intercampus e Marktest. Corrigi os resultados das anteriores sondagens Intercampus, porque não me tinha dado conta de que, anteriormente, tinham apresentado projecções incluindo brancos e nulos no total. E acrescentei uma sondagem da Aximage de Junho passado.

sábado, janeiro 08, 2011

Aximage, 3-6 Jan., N=600, Tel.

Cavaco Silva: 57,1%
Manuel Alegre: 20,8%
Fernando Nobre: 8,7%
Francisco Lopes: ?
Defensor de Moura: 3,1%
José Manuel Coelho: ?

Aqui.

sexta-feira, janeiro 07, 2011

Intercampus, 3-6 Janeiro, N=1002, Presencial

Cavaco Silva: 60,1%
Manuel Alegre: 25,3%
Francisco Lopes: 6,3%
Fernando Nobre: 4,2%
Defensor de Moura: 2,5%
José Manuel Coelho: 1,6%

Aqui. O total é 98,4%. Suponho que o resto são votos em branco, que não são contabilizados para apuramento final. A notícia fala de uma queda de 6,9 pontos para Cavaco. Notem que a anterior sondagem da Intercampus era, ao contrário desta, telefónica. É só uma sondagem. Há erro amostral. Etc. Mas não tenho ilusões nenhumas: toda a gente vai dizer que isto é um efeito do BPN.

P.S.- Se olharem para a sondagem anterior, vão ver Cavaco com 64,3 e talvez pareça estranho que se fale numa queda de 6,9. Mas os resultados da sondagem anterior foram apresentados com percentagens calculadas em relação ao total de votos válidos + em branco. Redistribuídos, Cavaco ficava com 67, e daí a queda de 6,9 para a sondagem de hoje.

terça-feira, janeiro 04, 2011

Inquérito ao Emprego passa a ser telefónico

Acho a notícia de hoje sobre a mudança do modo de aplicação do Inquérito ao Emprego muito interessante, pelo menos de dois pontos de vista. O primeiro é que nos ajuda a perceber que, manifestamente, muitas pessoas não perdem tempo a pensar de onde vem a esmagadora maioria da informação das estatísticas nacionais. Por exemplo, hoje, a TSF anunciava que o BE iria pedir esclarecimentos sobre a mudança, anunciando que "as estatísticas nacionais não podem ser sondagens". Não podem? Mas é precisamente isso que são. Com excepção da informação que resulta dos recenseamentos da população, a maior parte das estatísticas nacionais, em qualquer país do mundo, resultam, precisamente, de inquéritos amostrais, ou seja, de sondagens (ver aqui a forma como o Inquérito ao Emprego vinha sendo conduzido até agora). Se devem ser presenciais, telefónicas ou online é algo que se pode discutir longamente,  e é óbvio que são feitas com recursos e tempo muitíssimo maiores que qualquer sondagem para a comunicação social. Mas são, no fundamental, sondagens, quer lhes queiramos chamar isso ou outra coisa qualquer.

O segundo ponto interessante é que, por isso mesmo, o INE talvez devesse ter sido capaz de prever que a súbita "recordação" desse simples facto poderia ser acompanhada de suspeitas e acusações várias, mesmo que completamente descabeladas. Uma das coisas que se diz na nota informativa do INE (descarregar aqui) é que a decisão de passagem para inquérito telefónico foi tomada em 2008 e que os trabalhos para a execução do “Projecto para o planeamento, concepção, preparação e implementação da entrevista telefónica no Inquérito ao Emprego (...) "decorreram desde então com grande intensidade". Houve um "trabalho rigoroso e intenso de planeamento, investigação, concepção e preparação" e foi realizado um "um conjunto vasto de testes estatísticos para medir o impacto das alterações a introduzir". Óptimo. Mas se é assim, por que razão "a descrição detalhada do processo de transição para o modo de recolha telefónico, bem como dos impactos nas estimativas a publicar no 1º trimestre de 2011 e nos conteúdos informacionais objecto de difusão, constarão de documento metodológico a disponibilizar oportunamente"' Haverá momento mais oportuno do que este? Se houve tanta preparação e investigação, não teria sido melhor divulgar os seus resultados agora? Acompanhar este anúncio com documentação metodológica detalhada seria a melhor maneira de fazer que esta mudança no modo de aplicação do inquérito fosse melhor compreendida. Assim, temos confusão desnecessária. Estou a ver mal?

quinta-feira, dezembro 23, 2010

Eurosondagem, 15-20 Dez, N=2052, Presencial

Cavaco Silva: 60%
Manuel Alegre: 30%
Fernando Nobre: 4,8%
Francisco Lopes: 4,5%
Defensor de Moura: 0,7%

Aqui, ou talvez aqui.

segunda-feira, dezembro 20, 2010

Intercampus, 10-15 Dez., N=607, Tel.

Cavaco Silva: 64,3%
Manuel Alegre: 20,7%
Fernando Nobre: 5,5%
Francisco Lopes: 4,5%
Defensor de Moura: 1%

Aqui.

E obrigado aos comentadores que me ajudaram a corrigir um Francisco trocado por um Fernando. Peço desculpa.

sexta-feira, dezembro 17, 2010

Natal é quando a Gulbenkian quiser

A Gulbenkian, ao abrigo de um programa de internacionalização das ciências sociais, concede todos os anos distinções para os dois melhores artigos de ciências sociais publicados ou aceites para publicação em revistas internacionais de referência escritos por jovens investigadores (idade inferior a 40 anos) que trabalhem em instituições portuguesas. Foi anunciado hoje que, este ano, um dos prémios foi para Nina Wiesehomeier, minha colega no ICS, pelo artigo "Presidents, Parties and Policy Competition", em co-autoria com Kenneth Benoit. E o outro, bem, o outro foi para o meu amigo LA-C, por este artigo. Este ano já não preciso de escrever carta ao Pai Natal.

P.S.- Obrigado ao Pedro, ao Miguel e ao Carlos.
P.P.S.- Acabo de descobrir que, em 2009, os prémios foram também ambos para a Ciência Política: para o Tiago Fernandes e para a Catherine Moury.

sábado, dezembro 11, 2010

As virgens e as domesticadas

Luis Queirós, fundador da Marktest, lança-me aqui um amistoso repto. Mas eu gostaria de comentar não tanto o repto mas sim - igualmente com amizade mas também com a seriedade que a coisa merece - o que é escrito no post. E infelizmente, acho que o post confunde muito mais do que clarifica.

Luis Queirós explica os já famosos 78,3% de intenções de voto para Cavaco Silva captados na última sondagem da Marktest ("possivelmente bem acima do que serão resultados nas eleições de Janeiro próximo", diz) com um fundamento, digamos, metodológico:

"Deixem-me explicar: nós trabalhamos com amostras virgens, sem vícios nem preparação prévia, e por isso captamos as mudanças como ninguém o consegue fazer. Isso tem um custo, pois onde nós temos 80% de recusas, outros apresentam 80% de respostas. Mas captamos a essência da “emoção” eleitoral, uma espécie de “flor do sal” da opinião pública. E, não raramente, elas funcionam como uma espécie de candeia que vai à frente, e que os outros acabam por seguir."

Eu acho que sei do que fala Luis Queirós. Mas a maioria das pessoas não saberá, pelo que este comentário só ajuda a lançar confusão. E ainda por cima, acho que LQ não demonstra nada daquilo que afirma. Vejamos, então:

1. Suponho que aquilo de que Luis Queirós (LQ) deverá estar a falar é de sondagens com taxas de resposta muito elevadas, que só podem ser obtidas - em estudos deste género - se as entrevistas forem tentadas não junto da população em geral mas sim de uma espécie de painel permanente, de maiores ou menores dimensões, de onde se seleccionam inquiridos de cada vez que se faz uma sondagem. Ou muito me engano - ele poderá corrigir-me - ou está a falar da Aximage. Vejam aqui: "A Aximage possui um sub-universo de cerca de trinta mil nomes com selecção aleatória estratificada assente em matrizes que cruzam região x habitat; sexo x idade x escolaridade x actividade; região x voto. A amostra desta sondagem obedeceu a técnica equivalente mas assente no sub- universo." E de facto, como seria de prever, a Aximage tem taxas de resposta muito altas junto deste "sub-universo" de indivíduos pre-seleccionados. 72%, no caso desta sondagem.

2. Se for disto que LQ está a falar, deveria então, creio, ter explicado melhor por que razão isto é uma amostra "com vícios". Claro que a aceitação por parte dos respondentes em fazer parte destes paineis pode significar que deixam de ser representativos da população. E claro que há "efeitos de painel", em que a reinquirição ou a mera pertença a esse painel pode reforçar a sua não representatividade. Mas há também vantagens neste procedimento, incluindo a possibilidade de contactar a amostra através de telemóvel e de garantir altas taxas de resposta. Muito depende, de resto, da forma como o painel terá sido escolhido. O da Aximage é, de resto, muito grande, limitando os riscos da reeinquirição sistemática. E achará LQ que as 807 entrevistas que a Marktest conseguiu fazer depois de ter tentado estabelecer 30750 contactos (não me canso de saudar a Marktest por esta transparência) conduziu a uma amostra "sem vícios"? Há aqui uma contraposição entre uma forma alegadamente "melhor" e uma forma alegadamente "pior" de fazer as coisas que me parece muito pouco fundamentada. Se fosse necessariamente como LQ diz, a YouGov estava bem arranjada.

3. Há, de resto, algo que LQ não menciona e que, à luz da sua explicação, permanece um enigma. Que eu saiba, as amostras seleccionadas pela Eurosondagem, pela Católica, ou pela Intercampus são, para usar a linguagem de LQ, tão "virgens" como as da Marktest. Ou seja, para cada estudo, é seleccionada uma amostra nova de entre números de telefone nacionais ou domicílios por caminho aleatório. E por que razão a Marktest terá apresentado um resultado de 78% para Cavaco Silva quando outras sondagens, em momentos próximos e com amostras igualmente "virgens", lhe dão intenções de voto entre os 57 e os 63%? A explicação improvisada por LQ para explicar os resultados da Marktest não colhe.

4. Mas LQ sugere também um carácter algo "especial" das sondagens da Marktest: "elas funcionam como uma espécie de candeia que vai à frente, e que os outros acabam por seguir." Será? Não foi assim em 2005. Nem me parece que tenha sido em 2006. Nem no referendo sobre a despenalização do aborto em 2007. Nem nas legislativas de 2009. Eu julgo, sem saber de ciência certa, que LQ se refere ao facto de, antes das Europeias de 2009, a Marktest ter sido a única empresa que colocou o PSD à frente nas intenções de voto. Mas se é isto, parece-me base muito limitada para sugerir que a Markest antecipa quaisquer tendências. De resto, como se vê por este quadro, mesmo no caso das Europeias de 2009, a alegada capacidade de "antecipar tendências" nuns casos coexiste com a incapacidade de as detectar noutros. Em suma, gostava que me mostrassem onde está a tal "candeia" a funcionar. Não a vejo. Vocês vêem? Ajudem-me a encontrar a luz.

É normal que, nos meses antes das eleições, haja uma dispersão considerável nos resultados das sondagens, que tenderá a diminuir com o tempo. Pode também suceder que, por razões metodológicas e sem qualquer intencionalidade política, os estudos de uma determinada empresa tendam a subestimar os resultados deste ou daquele partido enquanto que os de outra os sobrestimam. Em Portugal, esta demonstração está por fazer, apesar de muita conversa barata. Mas claro que pode suceder que esta ou aquela opção tenda a levar à subrepresentação ou sobrerepresentação de determinados grupos populacionais que, se tiverem comportamentos eleitorais diferentes dos outros, irão levar a que os resultados variem de empresa para empresa de forma sistemática. "House effects": isto está mais que estudado até à exaustão noutros países. E há, finalmente, erro aleatório. Mas LQ não fala de nada disto. Palpita-me que ele acha que Cavaco Silva terá um resultado acima dos tais 55 a 63% que as sondagens a que chama "domesticadas" - esta linguagem choca-me um pouco - lhe dão neste momento. Logo, 78%, "resultados disruptivos" e tal, são uma coisa bestial. Lamento, mas isto merecia outro cuidado.

Aximage, 5-7 Dezembro, N=600, Tel.

Com indecisos:
PSD: 39,8%
PS: 27,2%
CDS: 8,8%
CDU: 8,4%
BE: 7,4%
OBN: 5,4%
Indecisos: 3,0%

Com indecisos redistribuidos:
PSD: 41,0%
PS: 28,0%
CDS: 9,1%
CDU: 8,7%
BE: 7,6%
OBN: 5,6%

Aqui.

sábado, novembro 27, 2010

Eurosondagem, 18-23 Nov, N=2069, Presencial

Cavaco Silva: 57,0%
Manuel Alegre: 32,0%
Fernando Nobre: 5,2%
Francisco Lopes: 4,8%
Defensor de Moura: 1,0%

Aqui. Entre o resultado desta sondagem e a da Marktest divulgada hoje há só 21 pontos de diferença nas intenções de voto em Cavaco Silva, enfim, coisa pouca.

sexta-feira, novembro 26, 2010

Presidenciais

Marktest, 16-19 Nov., N=804, Tel.

Intenções de voto presidenciais:
Cavaco Silva: 78,3%
Manuel Alegre: 15%
Fernando Nobre: 4%
Francisco Lopes: 0,7%

Aqui. Soma das percentagens anteriores: 98%. Caso Cavaco Silva tivesse uma percentagem de votos desta ordem, ultrapassaria claramente o resultado de Mário Soares em 1991.

quinta-feira, novembro 25, 2010

Marktest, 16-19 Nov., N=804, Tel.

Após redistribuição de indecisos e diminuição de OBN de 14,3% para 6,5%:
PSD: 44,3%
PS: 26,9%
BE: 8,7%
CDS-PP: 6,9%
CDU: 6,7%

Ficha técnica aqui.

segunda-feira, novembro 22, 2010

Intercampus, 12-17 Nov., N=609, Tel.

Legislativas, após redistribuição:
PSD: 39,2%
PS: 30,5%
BE: 11%
PCP: 9.7%
CDS-PP: 8,5%

Presidenciais, após redistribuição:
Cavaco Silva: 61,5%
Manuel Alegre: 26,1%
Fernando Nobre: 4,5%
Francisco Lopes: 3,7%
Defensor de Moura: 0,5%

A soma disto, nas presidenciais, dá 96,3%, se não estou em erro. Não sei o que representam os restantes 2,7%, tendo em conta que os resultados oficiais das presidenciais não contam com brancos e nulos. Talvez outros candidatos. As notícias estão aqui e aqui. A segunda explica-nos, por exemplo, que "Francisco Lopes (...) desceu 33,9% desde Outubro" e que " maior queda foi a de Defensor Moura, em 58,3%". Atenção que não se está, naturalmente, a falar de subidas ou descidas em pontos percentuais.

quinta-feira, novembro 18, 2010

Sabe o que vai acontecer no dia 23 de Janeiro? Nós sim (III)

Com todas as contingências explicadas nos dois posts anteriores e ainda as que explicaremos de seguida, é um exercício heróico este de prever a votação de Cavaco Silva. Mas como resistir? Não é possível resistir. Estimámos o modelo. O que encontrámos? O fundamental resume-se na sequinte equação:

Y=18,579 + 0,578*X1 + 12,317*X2

Em que X1 representa a votação dos partidos do "bloco incumbente" na eleição anterior e X2 é uma variável "muda" (com valor 1 ou 0) capturando o facto de o presidente em exercício, respectivamente, ser ou não o candidato do bloco incumbente. Se substituirmos os valores de X1 e X2 pelos valores para a próxima eleição, X1 será 42,4 (a percentagem de votos válidos dos partidos de direita nas últimas legislativas) e X2 será, obviamente, 1. Resultado:

Cavaco Silva terá uma votação de 55,393% na 1ª volta das eleições presidenciais.

Quão razoável é esta previsão? Há indicadores de sinais contrários:

* Positivos:
1. Mesmo com apenas seis observações e três graus de liberdade, as variáveis que pensámos poder influenciar a votação do bloco incumbente são estatisticamente significativas com p<0,05 e na direcção prevista.

2. O coeficiente de determinação do modelo é de 95%. Ou seja, o modelo é fantástico! Ups, talvez não, dado que, com tão poucas observações, este valor, mesmo que elevado, tem pouco significado.

3. Para analisar a robustez dos nossos resultados a uma amostra tão pequena, fizemos pequenas manipulações da amostra e vimos quão sensível os nossos resultados eram a essas manipulações. A manipulação é simples: para cada uma das 6 observações de que dispomos, retiramo-la da amostra e reestimamos o modelo. Assim, podemos testar se os resultados que obtemos são altamente influenciados por alguma eleição particularmente excêntrica. Os resultados não foram maus.

*Negativos:
1. O nosso erro padrão (já tendo em conta a incerteza dos coeficientes estimados) é de quase 5%. Ou seja, o intervalo de confiança de 95% para a estimativa pontual da previsão é tão largo que quase não tem significado. Por outras palavras, se construíssemos um intervalo de confiança em torno da nossa previsão, diríamos que a votação de Cavaco seria, com 95% de confiança, algures entre 45 e 65%.

2. O modelo falhou miseravelmente num teste mais formal, que já tínhamos usado a pretexto da nossa previsão para as legislativas. Esse teste é chamado condition index test. De acordo com a literatura valores desse teste superiores a 15 são problemáticos. Superiores a 30 são a garantia de problemas. No nosso caso o valor foi superior a 60. Um valor tão alto indica problemas de multicolinearidade, algo que só pode ser resolvido com uma amostra maior.

Em suma, como ficamos? Há sinais encorajadores, particularmente a direcção e significância das variáveis independentes. Mas a incerteza é muito grande. O baixo número de observações - seis - faz com que esta previsão pouco mais rigor possa ter do que uma mera regra de três simples. Ele gera também valores de coeficientes de determinação enganadoramente altos e cria uma incerteza muito grande em torno da previsão estimada, que só tenderá a diminuir à medida que possamos basear esta inferência num número maior de observações. Esperamos, por isso, que apreciem devidamente a ironia de apresentarmos o resultado da previsão às milésimas e, de resto, a ironia do próprio título destas entradas.

Pedro Magalhães e Luís Aguiar-Conraria