quarta-feira, janeiro 11, 2006

Interlúdio 2

Bragança, 10 Jan (Lusa) - A mulher do candidato presidencial Mário Soares, Maria Barroso, divulgou hoje em Bragança um caso que considerou "revelador da forma ínvia e desonesta como são feitas algumas sondagens". Maria Barroso falava para apoiantes na sede de candidatura de Mário Soares, admitindo que "alguns estão desanimados porque as sondagens são feitas para desanimar as pessoas".

A mulher do candidato decidiu partilhar com a plateia um caso que disse ter ocorrido há três dias quando uma amiga, professora de Filosofia em Coimbra, lhe telefonou a contar uma "história que parece anedota, mas que é verdadeira". Segundo Maria Barroso, "telefonaram para casa dela a perguntar se havia alguém na faixa etária entre os 30 e os 45 anos". "Ela mandou a funcionária ao telefone e perguntaram-lhe assim: então em quem é que vai votar? Eu vou votar no dr. Mário Soares, que é em quem eu votei sempre. E eles disseram de lá: desculpe, foi engano", contou.

"Isto não se faz, isto é uma desonestidade, é uma forma ínvia de fazer as sondagens. Se dizem que é a favor de um determinado candidato que não é o que eles querem, então dizem que já não tem efeito e que não lhes interessa", acrescentou.

Cada um tira as conclusões que quiser. Mas a mim interessa-me por outras razões: repararam como, inicialmente, o(a) inquiridor(a) aceitou a entrada na amostra de uma "funcionária" que "havia lá", sem indagar se era residente, só pelo facto de preencher a quota? É para verem o que acontece com as quotas...

Interlúdio

Kadima aguenta após AVC de Sharon. Partido "personalista", "carismático", inteiramente dependente da personalidade de Sharon, queda inevitável? Ah, como Israel é complicado...

terça-feira, janeiro 10, 2006

It ain't necessarily so...(1)

Este post, em duas partes, pode ter duas leituras políticas, que julgo poder antecipar. Haverá quem ache que estou ainda a tentar manter aberta a esperança de uma segunda volta. E haverá quem ache que estou a tentar evitar a desmobilização do eleitorado de Cavaco Silva em face do que pode parecer uma vitória certa. A intenção não é uma nem outra, mas façam como entenderem. A intenção, de facto, é chamar a atenção para os limites das sondagens que conhecemos até agora, quer como instrumentos de descrição do que vem sucedendo ao longo dos últimos meses (neste post) quer como instrumentos de previsão do que vai suceder dia 22 (no post seguinte).

Como instrumentos de descrição, as sondagens que conhecemos têm um problema fundamental: não são suficientemente variadas do ponto de vista técnico e metodológico para nos garantirem que as medições que têm estado a obter são independentes dessas opções técnicas e metodológicas. Note-se, por exemplo, que todas as sondagens usaram inquirição telefónica, com uma única excepção que, mesmo assim, não é para mim inteiramente clara (na ficha técnica da sondagem Intercampus de 22 de Dezembro fala-se em "entrevista pessoal", o que eu interpreto como sendo uma sondagem "face-a-face", mas não estou seguro).

Não quero com isto dizer que haja um problema genérico em fazer sondagens telefónicas (já perorei muitas vezes sobre o assunto aqui, defendendo que, até agora, e ceteris paribus, não é isso que parece fazer a diferença) ou que elas tenham tido até agora um enviesamento intrínseco numa direcção ou noutra. Quero apenas dizer que cada eleição é uma eleição, nunca sabemos se tem características podem fazer com que uma dada opção produza enviesamento, e que ficava muito mais descansado com estes resultados se visse maior variedade de técnicas de inquirição.

Acresce a isto que, quando essas variações metodológicas existem no nosso conjunto de sondagens, o seu impacto parece ser grande. Falo, por exemplo, do contraste entre sondagens que usam informação socio-demográfica para a construção da amostra (quotas) ou ponderação dos resultados (ponderadores) e aquelas que se limitam a confiar na aleatoriedade pura. Nas primeiras, que são a maioria, a média das estimativas para Cavaco, Alegre e Soares é, respectivamente, 59%, 16% e 14%. Nas segundas, é de 53%, 14% e 20%. E se excluirmos as sondagens da Católica - de classificação mais ambígua deste ponto de vista (porque seleccionam inquiridos aleatoriamente mas ponderam os resultados com dados do Censos) - do primeiro grupo, a média fica, respectivamente, 60%, 15% e 14%. São diferenças muito importantes.

É certo que parte destas discrepâncias se poderão atribuir ao facto de as diferentes sondagens serem feitas em momentos diferentes, sendo por isso afectadas pela passagem do tempo. Foi essa a perspectiva que, por exemplo, adoptei aqui, aqui e aqui. E é também verdade que tenho convicções próprias acerca de que sondagens e de que métodos obtêm medições mais fiáveis.

Mas a perspectiva do céptico, que foi a que adoptei aqui, limita-se a constatar diferenças e a interpretá-las como sintomas de incerteza. Neste momento, a amplitude dos resultados de Soares desde finais de Outubro (a diferença entre a estimativa mais baixa e a mais alta) é de 10,7 pontos percentuais, mais de duas vezes superior àquilo que seria de esperar exclusivamente apenas na base do erro amostral. A amplitude dos resultados de Cavaco é de 10,9 pontos percentuais, 1,7 vezes acima do que se poderia esperar na base do erro amostral. É bastante. O céptico só pode sentir-se algo incerto.

Actualização, 10 de Janeiro

Com a sondagem Marktest de ontem o quadro completo fica assim:



Não vou introduzir os resultados das sondagens diárias da Marktest/DN/TSF. É uma tracking poll, o que significa que foge à lógica das anteriores: dia a dia, a base amostral é apenas parcialmente renovada. Vou introduzir sim esses resultados assim que a base amostral tiver sido completamente renovada, ou seja, pelas minhas contas, na sondagem a divulgar esta 6ª feira. Entretanto, os resultados da tracking poll podem ser consultados aqui.

Mais questões

De um e-mail (que me chamou a atenção para o lapso que cometi no post anterior):

Apenas um reparo aos últimos posts, espero que não pareça um preciosismo.Quando se fala da retirada dos indecisos tratando-os como abstencionistas isso na prática é o mesmo que fazer uma distribuição proporcional e não equitativa. Ou seja quando se trata os indecisos como abstencionistas é o mesmo (matematicamente) que dizer que 60% deles votam Cavaco, 16 Alegre, 13 Soares, etc, etc....E por isso mesmo penso que seria pertinente que o Pedro Magalhães se pronunciasse sobre esta distribuição proporcional de indecisos num cenário de candidato consensual (e estabilizado - há cerca de um ano ou mais) à direita em contraponto a uma esquerda espartilhada. Pode ou não este método de estimativa introduzir um erro sistemático? Porque não fazer como a Intercampus, que noticia sempre primeiro os resultados brutos e só depois a estimativa, menorizando assim a estimativa em detrimento dos resultados brutos?

Certíssimo. Enganei-me no post anterior: quando se "eliminam" indecisos, tratando-os como abstencionistas, está-se a redistribuí-los proporcionalmente pelas opções "válidas". Já tinha explicado isto em muitos posts anteriores, mas ontem enganei-me.

Quanto à questão substantiva, diria o seguinte:

Como já disse aqui e aqui, "parece-me plausível a ideia de que a indecisão é maior entre o eleitorado potencial dos candidatos de esquerda, especialmente o eleitorado do PS". A sondagem de Novembro da Católica não confirmava essa ideia, mas a mais recente confirma-a, como sabemos. Como proceder na posse desta informação? Uma hipótese, comum em vários institutos de sondagens noutros países e em eleições legislativas, é usar a simpatia partidária como elemento informativo para a redistribuição. Por exemplo: se eu souber que, em geral, os simpatizantes do PS tendem a votar mais em Alegre e Soares, uso esta informação para redistribuir os simpatizantes do PS que não me dizem em que candidato irão votar, presumindo que se irão redistribuir da mesma forma que aqueles que partilham a mesma identificação psicológica com um partido. Isto, contudo, levanta dois problemas. Por um lado, presume-se assim que a "simpatia partidária" é, em Portugal, um fenómeno fortemente estruturante das atitudes e comportamentos políticos. Por outro lado, presume-se assim que a simpatia partidária é um fenómeno fortemente estruturante do comportamento eleitoral em eleições presidenciais. Tenho, por razões demasiado longas para explicar aqui, fortes dúvidas sobre a validade de cada uma dessas pressuposições.

Logo, a alternativa que achámos - sugerida por um dos colaboradores do CESOP - foi, como expliquei no post anterior, usar uma questão sobre "em que candidato(s) nunca votaria" para não redistribuir votos de indecisos por candidatos em que nos dizem que "nunca votariam". Contudo, como também já expliquei, o resultado dessa operação foi que encontrámos resultados em tudo semelhantes aos anteriores.

Isto não impede que eu ache que esta indecisão actual, fortemente concentrada nos simpatizantes do PS, acabe por se resolver parcialmente, mais tarde ou mais cedo, num voto por um dos candidatos próximos da área socialista. Mas em que números? Com que intensidade? Por qual candidato? Quando estas questões se multiplicam e quando a sua resolução implica aplicarmos pressuposições sobre o comportamento dos eleitores de cuja validade não estamos minimamente certos, devemos recordar-nos do fundamental: a sondagem dá um retrato do momento, e a estimativa deve ter, como função básica, a de mostrar esse retrato de forma que seja comparável a um resultado eleitoral, e não de forma a que procure tudo prever acerca de qual virá a ser esse resultado eleitoral duas semanas depois. É a minha opinião.

E no que respeita à comparação com a Intercampus, penso que há um lapso do leitor: a Intercampus e a Católica fornecem aos seus clientes os resultados brutos e as estimativas. Os clientes divulgam os resultados como entendem, desde que cumpram a lei (ou seja, divulgando ambos), que é, creio, o que fazem, com diferentes destaques. E quanto a dar mais valor aos "resultados brutos", já falei dos problemas que isso levanta muitas vezes neste blogue. Por exemplo, aqui, há cerca de um ano.

segunda-feira, janeiro 09, 2006

Dúvidas (com correcção a um anterior lapso meu, a vermelho)

Recebidas por e-mail ou colocadas noutros blogues:

1. O nível de confiança é, por norma, complementar da margem de erro; isto é, para o clássico nível de confiança de 95% existe uma margem de erro de 5% e, portanto, uma flutuabilidade dos dados apresentados; a sondagem apresenta para um nível de confiança uma margem de erro de 3,4%.

Importa não confundir o erro amostral com o nível de confiança na base do qual se pode dizer que o erro amostral é x ou y.
"Using a sample of 1000 as an example, the statement could read: the chances are 95% of coming within +/- 3% of a hypothetical survey conducted among all members of the population. This means that 95% of all samples which could possibly be drawn will yield an outcome within 3% of the true percentage among the population."


2. Os inquéritos optam, por norma, por um universo [suponho que aqui se queria dizer "amostra"]de cerca de 1.000 entrevistas validadas para a representação do eleitorado nacional; esta sondagem tem 815 inquéritos válidos.

Desconheço a existência desta "norma". Dependendo dos objectivos- o que se quer medir e a margem de erro amostral que se está disposto a tolerar - uma amostra pode ser muito mais pequena ou muito maior que 1000. Explicação muito técnica aqui, explicações mais simples e com exemplos aqui (powerpoint). A money quote: "for very large populations, 500-700 is usually adequate".


3. Há uma distribuição de indecisos de modo equitativo pelas seis candidaturas e, portanto, beneficia-se artificialmente Cavaco ao dar-lhe, por exemplo, mais indecisos dos que possui e ao minorizar a percentagem de indecisos na área socialista (isto é, Alegre e Soares poderão conseguir muitos mais votos que os assinalados).

Lamento, mas não houve, na sondagem da Católica, uma distribuição de indecisos de modo equitativo. Os indecisos foram colocados perante uma segunda pergunta, onde se lhes pedia que indicassem uma "inclinação de voto" por um dos candidatos. E essas inclinações, se dadas por inquiridos que disseram "ter a certeza" que vão votar, foram contadas como votos efectivos. Os restantes foram distribuídos de modo proporcional (ou seja, tratados como abstencionistas). Tudo isto está, desta vez, bem explicado na notícia do Público, mais do que uma vez. Para além disso, ensaiámos no inquérito uma experiência: perguntar aos indecisos que se recusaram a indicar inclinações "em que candidatos nunca votariam", e usar essa informação para não redistribuir os seus votos por candidatos assim indicados. Os resultados obtidos foram iguais aos anteriores, pelo que se optou por não usar essa informação (para não complicar a apresentação nem mudar de metodologia a meio caminho). Isso não nos impediu de assinalar o facto de haver um número desproporcional de simpatizantes do PS entre os indecisos. Cada um usa essa informação como entender, mas não me peçam para pressupor que todos os indecisos do PS vão votar Soares, Alegre ou de outra maneira qualquer...


4. A distribuição aleatória foi afectada pela significativa taxa de recusas (a edição de hoje já não as trazia) o que introduzir mortalidade na amostra, ou seja, uma nova distribuição não aleatória que afecta a chamada validade interna (e, portanto, inferencial) do estudo (veja-se que os resultados se reportam aos que respondem, não aos que votam ou aos que foram inquiridos), porém, este é um critério recorrente em todas as sondagens.

A obtenção de uma amostra genuinamente aleatória é obviamente afectada pelo facto de inquiridos seleccionados aleatoriamente se recusarem a fazer parte da amostra, assim como pelo facto de não se conseguir inquirir (por ausência) inquiridos seleccionados aleatoriamente. Logo, a amostra não é verdadeiramente aleatória. Isto gera problemas para a qualidade dos dados? Há alternativas? O que se pode fazer? Recomendo a leitura disto (.pdf) e disto (.pdf). As respostas são menos óbvias do que parecem à primeira vista...

5. Numa sondagem em que se proceda à ponderação dos resultados [seja de acordo com a distribuição da população em relação a variáveis sócio-demográficas como idade, sexo, habilitação, etc., ou de acordo com o sentido de voto nas ultimas eleições] será legítimo continuar a pressupor que a margem de erro é a mesma caso essa ponderação não tivesse sido feita?

Não. Os valores de erro amostral pressupõem uma amostra puramente aleatória. Pelas razões explanadas no ponto 4., nenhuma sondagem é verdadeiramente aleatória, mesmo que o tente. Logo, nesses casos, a margem de erro amostral é um mero valor de referência, baseado na dimensão da amostra. Por maioria de razão, nas alternativas - utilização de quotas ou ponderação pós-amostral - aplica-se o mesmo princípio: a margem de erro é apenas um valor de referência, baseado na dimensão da amostra, e não algo que possa ser interpretado como transmitindo a real probabilidade de que os resultados se situem dentro de um dado intervalo. É por isso mesmo que a ficha técnica da Católica não diz que a margem de erro é desta amostra, e sim de uma amostra aleatória.

Assim sendo, porque se usa?

- Porque a lei obriga;

- Porque é uma maneira fácil de transmitir ao leitor as possíveis consequências de diferentes dimensões da amostra;

- Porque a pesquisa mostra que as amostragens por quota tendem a errar na estimação de valores reais dentro das mesmas margens que amostras aleatórias;

- Porque a pesquisa mostra que, quanto maior uma amostra, menor o erro na estimação de valores reais, pelo que o conceito de margem de erro, se bem que possa não ter rigor em termos absolutos, deverá tê-lo em termos relativos (ceteris paribus, quanto maiores as amostras, maior a precisão).

5. Nesta sondagem afirma-se que 52% dos inquiridos eram do sexo feminino. Depois, diz-se que os resultados foram ponderados tendo em conta, entre outras variáveis, o sexo. Ora sendo a percentagem da população do sexo feminino de aproximadamente 52%, não percebo o sentido dessa eventual ponderação.

O facto de, numa amostra, haver tantas mulheres como no universo não significa que elas estejam distribuídas por idades e graus de instrução da mesma forma como no universo. Daí a necessidade de ponderação.

Mandem sempre.

Marktest

As fichas técnicas das sondagens da Marktest já eram as mais completas de todas as publicadas na comunicação social. Agora temos direito a isto (.pdf). Um estímulo para os outros (nós) darmos ao público o mesmo nível de informação. Por enquanto, eles vão à frente.

Um aspecto importante da sondagem divulgada hoje no DN: é uma "tracking poll". Ou seja: combina os resultados de vários dias consecutivos - digamos, três - e depois, ao juntar os resultados do quatro dia, deita fora os resultados do primeiro.

Para além da leitura atenta da documentação da Marktest, vale a pena ver este site CNN/Gallup onde explicam o que fazem e como se devem ler os resultados.

Marktest, Presidenciais, 8 de Janeiro

O quadro completo dos resultados terá de ficar para amanhã. Para já, temos:

Marktest, 4-7 Janeiro, Telefónica

Votos válidos:
Cavaco Silva:61%
Mário Soares:14,3%
Manuel Alegre:11,5%
Jerónimo de Sousa:6,9%
Francisco Louçã:6,1%

Em relação às duas sondagens anteriores, tinha assinalado algumas aparentes tendências que careceriam de confirmação. Pois ela aqui está:

- subida de Cavaco Silva de 2005 para início de 2006: intenções válidas de voto subiram em relação a anteriores sondagens da Católica (finais de Novembro) e da Marktest (meados de Dezembro), mantendo-se estáveis em relação a última sondagem Aximage (antes do Natal). Se nas próximas sondagens Eurosondagem e Intercampus Cavaco tiver qualquer coisa acima dos 53%, então a tendência de subida vê-se confirmada para além de qualquer dúvida razoável.





















-descida ou, no máximo, estabilização de Mário Soares: intenções válidas de voto em Soares desceram em relação a anteriores sondagens da Católica e da Aximage, para além de ligeira descida em relação a Marktest . Se não desce, pelo menos, parou de subir. Se nas próximas sondagens Eurosondagem ou Intercampus Soares não passar, respectivamente, dos 20% ou dos 18%, a tendência de estabilização (ou descida) confirma-se para além de qualquer dúvida razoável.

sábado, janeiro 07, 2006

Divulgações antecipadas

Não deve ser fácil para as redacções dos órgãos de comunicação manterem, sequer por poucas horas, confidencialidade sobre dados de sondagens que encomendaram. Um telefonema daqui e dali, a passagem de resultados antecipadamente a candidatos para "obter reacções", e a coisa está feita: dois minutos depois, metade do país já sabe. Poder-se-ia mesmo defender que, nalguns casos, a transmissão dessa informação aos candidatos é uma obrigação legal, se bem que nada seja dito sobre "comunicação prévia":

Lei 10/2000, Art. 12.º Comunicação da sondagem aos interessados. Sempre que a sondagem de opinião seja realizada para pessoas colectivas públicas ou sociedades de capitais exclusiva ou maioritariamente públicos, as informações constantes da ficha técnica prevista no artigo 6.º devem ser comunicadas aos órgãos, entidades ou candidaturas directamente envolvidos nos resultados apresentados.

Um pouco mais estranho é que, dois minutos depois da Antena 1 ter anunciado os resultados, o Diário Digital já tivesse alinhado uma notícia completa sobre o tema, com dados não ainda mencionados pela Antena 1, e cujo texto reproduz em vários pontos, ipsis verbis, o relatório de análise dos dados enviado pela Católica à RDP, RTP e Público. Isto significa que alguém do Diário Digital teve acesso a esse relatório. Como? Não faço ideia. Mas nada disto tem grande importância. Se os órgãos de comunicação que encomendam sondagens não conseguem mantê-las sob embargo, o problema é deles e nosso para resolver.

O problema é outro. Quem nos garante que os dados divulgados antecipadamente por outros órgãos de comunicação ou por blogues são os correctos? Quem nos garante que não são postos a circular dados falsos, como meros fins de desinformação? A mim, por exemplo, meia-hora antes do fecho das urnas nas autárquicas, juraram-me a pés juntos que a Eurosondagem ia dar o Carrilho à frente do Carmona na sondagem à boca das urnas da SIC. A coisa cheirava a esturro à distância, mas pode haver casos menos claros. Nos Estados Unidos, por exemplo, vários blogues colocaram durante a tarde do dia das eleições resultados brutos parciais das sondagens à boca das urnas que davam a vitória a Kerry, mesmo antes das necessárias análises e ponderações finais que sempre se têm de fazer. Estão a imaginar o que sucederia, no próximo dia 22, se blogues como o Mau Tempo no Canil começassem a dar resultados parciais de sondagens à boca das urnas porque alguém lhos transmitiu ao telefone, e blogues como o Acidental começassem a amplificar essa notícias porque "a informação já circulava" ou porque "não é só o Jorge Coelho que tem direito" ? Não me parece grande ideia.

Mas o Francisco Trigo de Abreu está mais do que perdoado. Primeiro, porque a quem ele tem de pedir desculpas é a quem lhe lê o blogue, e não a mim (se bem que eu também seja leitor). E segundo, porque quem tem um filho chamado Joaquim, como o meu, dispõe de indulgência automática aqui do Margens de Erro.

Tendências, 2ª parte

Neste post, apresentei os resultados das sondagens conduzidas desde Outubro até ao Natal de forma a se poderem detectar tendências de mudança, caso existissem. Na altura, disse que havia duas maneiras de o fazer: presumindo uma relação linear entre a passagem do tempo e os resultados (o que poderia ocultar outro tipo de oscilações e tendências não lineares) e aplicando uma regressão polinomial ponderada (ou "regressão local") aos dados, sensível a evoluções não lineares. O que sucede quando se fazem as mesmas análises às sondagens, acrescentado agora os resultados das duas primeiras sondagens de 2006 (Católica e Aximage)?

Cavaco Silva:

Em 2006, subida, aferida pelas sondagens Católica e Aximage, compensando assim anterior descida mostrada pela Eurosondagem e pela Intercampus. O facto de estas diferentes tendências serem mostradas por sondagens de diferentes institutos sugere a possibilidade de que subidas e descidas sejam,na realidade, inexistentes , reflectindo apenas diferentes opções técnicas. Contudo, o facto da Católica colocar Cavaco nos 60% é intrigante, porque se é verdade que a Aximage tem dado valores acima da média a Cavaco, o mesmo não sucedeu, até agora, com a Católica.

Mário Soares:



Se fosse só a Aximage, poder-se-ia atribuir isto ao acaso. Se fosse só a Católica, idem. Mas ambas as sondagens mostram Soares a ver interrompida a sua constante ascensão até ao Natal. É preciso mais sondagens para validar esta nova tendência que, como se verifica, é invisível quando se pressupõe uma relação linear entre o tempo e os resultados. Mas será essa relação linear? É sempre arriscado avançar teorias após as observações, mas pensemos um pouco. Será que a imagem de Soares que ficou dos debates, assim que a poeira assentou, lhe foi favorável? Será que as altas expectativas depositadas pelos seus apoiantes nos debates foram satisfeitas? Terá sido o ataque aos meios de comunicação social logo no início do ano uma estratégia sensata?

Manuel Alegre:

O facto de Alegre surgir à frente de Soares na sondagem Católica pode trazer alguma satisfação aos seus apoiantes, mesmo sabendo que a diferença entre um e outro nessa sondagem é inferior à margem de erro amostral. O que já não pode trazer satisfação é que nem esse resultado serve para inverter a tendência desde Outubro, que continua a ser de descida. A não se que a sondagem Aximage tenha estado muito ao lado, a sondagem da Católica não chega para validar uma forte convicção de que essa tendência foi estancada.


Jerónimo de Sousa:

Com uns resultados melhores e outros piores, Jerónimo de Sousa é, no entanto, o candidato cujas intenções válidas de voto têm permanecido mais estáveis.

Francisco Louçã:

Quase indistinguível de Jerónimo de Sousa, se bem que com maior instabilidade. Nada de novo.


Temos assim duas novas hipóteses levantadas pelas duas sondagens mais recentes: a de que Cavaco subiu na passagem de 2005 para 2006, e a de que Soares perdeu o gás na mesma altura. Aguardemos por mais sondagens para vermos se estas hipóteses se confirmam.

Católica, Presidenciais, 7 de Janeiro

Com a sondagem da Catolica divulgada ontem na Antena 1 e na RTP e hoje no Público, o quadro geral fica assim:



Outros aspectos possivelmente interessantes da sondagem:

- a sobrerepresentação dos simpatizantes do PS no conjunto dos que se dizem "indecisos" sobre em quem votar;

- a convicção maioritária - mesmo entre os simpatizantes do PS (dois em cada três) - de que Cavaco Silva será o próximo PR;

- a convicção minoritária -mesmo entre os simpatizantes do PS (um em cada cinco) - de que Cavaco Silva na Presidência irá "dificultar a acção do governo" ou fazer com que o governo fique com "menos hipóteses" de sobreviver até ao fim da legislatura.

sexta-feira, janeiro 06, 2006

Divulgação antecipada

Pelos vistos, os resultados das sondagens da Católica já têm direito a divulgação antecipada nos blogues, mesmo dizendo-se que não se sabe se são verdadeiros. E as que vamos fazer para a semana, já alguém tem resultados? Poupava-nos imenso trabalho.

Novidades?

Sondagem Aximage/CM, divulgada hoje, adicionada à lista:



Note-se, por um lado, a subida tremenda de Francisco Louçã, se bem que, como já vimos, as suas estimativas vêm exibindo grande instabilidade ao longo do tempo, sem tendência discernível.

Já sabemos que instabilidade também há nas estimativas do voto em Mário Soares, mas sabíamos também que havia uma tendência (de subida). Mantém-se? A julgar por esta sondagem, pelo menos em termos das estimativas de resultados eleitorais, a resposta é não. Pode ser um mero acaso ditado pelo erro amostral. Mas é a primeira vez que Soares desce numa sondagem da Aximage (começou com 11% em Outubro e terminou com 17% no final de Dezembro), e a descida contraria a tendência geral que já tínhamos visto que vinha, em geral, sucedendo desde Outubro ao Natal, no conjunto das sondagens.

Um ano

O primeiro post deste blogue foi escrito no dia 6 de Janeiro de 2005. Escrevi nessa altura:

Achei que seria bom que existisse em Portugal uma fonte de informação sistemática sobre as sondagens que vão sendo publicadas. É também provável que, por obrigação profissional, tenha de recolher alguma dessa informação, especialmente durante os próximos treze meses onde haverá eleições legislativas, autárquicas e presidenciais. É possível que tenha algumas coisas para dizer sobre essas sondagens. E essas coisas raramente são ditas (ou podem ser ditas) noutras fontes de informação que não um blogue. Logo, serão ditas e escritas aqui.

Nem tudo correu como eu gostaria. Suspeito que não terei resolvido sempre da melhor maneira o dilema entre, por um lado, a vontade de debater estes temas e, por outro, a necessidade de fugir ao papel de "polícia" de quem faz ou divulga as sondagens, papel para o qual não sou talhado, especialmente tendo em conta que, para além de "consumidor" de sondagens, sou também "produtor" e parte interessada.

Sei também que perdi demasiado tempo com questões eleitorais, ficando-me pouco tempo para pensar, escrever e debater outros temas que, de resto, me interessam bastante mais. O que é e como se mede isto da "opinião pública"? Qual é (e qual deveria ser) o seu papel no funcionamento da nossa democracia? Sondagens em geral, e sondagens eleitorais em especial, contribuem uma pequeníssima parte para a resposta às perguntas anteriores.

E lamento que, de todos os e-mails e comentários que li, sejam raríssimos aqueles que contestaram as minhas opções e interpretações técnicas. Eu conheço várias objecções a essas opções e interpretações, suspeito que outras existam, e sei que há pessoas que sabem muito mais de vários assuntos aqui debatidos do que eu. Portanto, de futuro, não se acanhem.

Apesar disto, o ano não foi mau de todo. Nunca imaginei que, num ano, este blogue pudesse ser visitado mais de 120.000 vezes, ou que lhe fizessem mais de 400 ligações noutros blogues. Não supunha que, entre sugestões e comentários de leitores e investigação que tive de fazer para comentar temas que foram surgindo, acabaria por aprender tantas coisas e descobrir tantas novas fontes de informação sobre estas questões. E creio - mas talvez isto não passe de wishful thinking e grave imodéstia - que o panorama geral da divulgação das (e dos comentários sobre) as sondagens terá mudado, de forma quase imperceptível mas real, desde que isto existe.

Agradeço a todos os aqui vieram, mas especialmente aos que divulgaram e comentaram o que aqui se escrevia nos seus próprios blogues, nos jornais, ou de outra maneira qualquer.

segunda-feira, janeiro 02, 2006

Homossexualidade em Portugal: sondagens

Não leio regularmente o Expresso e não vi a ficha técnica, mas registo o resumo do Ponto Media (já agora, parabéns pelos cinco anos) que mostra uma - previsível - taxa de recusas de mais de 60%!

Seja como for, vale a pena lembrar que os estudos do famoso Kinsey também apontavam para cerca de 10% dos homens com comportamentos exclusivamente homossexuais (notem a ênfase no "comportamento" em vez da "identidade") durante pelo menos três anos consecutivos entre as idades de 16 e 55 anos (enquanto que, nas mulheres, as percentagens são mais baixas).

Contudo, este "número mágico" de 10% tem sido muito criticado, devido ao facto da amostra de Kinsey não ser aleatória, e sim uma "amostra de conveniência". Nas minhas aulas, aliás, uso sempre o exemplo do relatório Kinsey para falar do enviesamento amostral: afinal, quem está interessado em falar do seu comportamento sexual a não ser aqueles que têm uma moral sexual mais liberal?

Uma série de estudos posteriores, com amostras propriamente representativas, têm obtido valores mais baixos. Mas depois aqui joga outro factor óbvio: relutância em assumir comportamentos socialmente censurados, que pode levar a subestimação do valor real. Pelo que esta "percentagem" é notoriamente difícil de obter. Um excerto de um artigo muito recente:

"Much attention has been given to estimating the rate of "homosexuality" among men and women. The commonly cited figure of 10 percent can be traced to Alfred Kinsey and his colleagues, who concluded that in the United States, "10 percent of the [white] males are more or less exclusively homosexual for at least three years between the ages of 16 and 53" (Kinsey et al. 1948:651). Kinsey et al. (1953) estimated that the rate for women was a third to half as large as that for men. A study based on national probability samples of American adults from 1988 to 1993 found that women were about half as likely as men to report having had a same-sex sex partner in the previous year (1.4 percent of women vs. 2.7 percent of men) (Laumann et al. 1994)" in Amy C. Butler, "Gender Differences in the Prevalence of Same-Sex Sexual Partnering, 1988-2002", in Social Forces, vol. 84, Setembro de 2005.

Este artigo em particular revela um aumento muito acentuado desde 1988 nos Estados Unidos da percentagem de homens e (especialmente) mulheres que declaram ter tido um parceiro sexual do mesmo sexo no ano anterior. Mas assume a dificuldade em explicar o fenómeno: aumento de comportamentos homossexuais ou aumento das pessoas que assumem esses comportamentos perante um inquiridor, em face de mudanças sociais, políticas, culturais e legais favoráveis?

Given the sensitive nature of the topic being studied, it will always be difficult to distinguish between changes in reporting bias and changes in actual behavior. The same arguments that normative, economic, and legal factors affect sexual behavior can be used to argue that they affect honesty of reporting that on a questionnaire.

O tema é muito interessante mas muito complexo, e merecia mais do que o espírito habitual no Expresso: o frissonzinho da primeira página, desta vez com tons de rosa...

terça-feira, dezembro 27, 2005

In the future, everybody will be a polling expert for fifteen minutes

De Mark Blumenthal, o Mystery Pollster cuja existência inspirou a criação desta modesta casa, um artigo (de acesso livre) na Public Opinion Quarterly, sobre o papel da internet em geral e da blogosfera em particular na difusão, discussão e melhoria dos métodos das sondagens, num número todo ele dedicado ao tema. Sinto-me como um filho orgulhoso dos feitos do pai.

Congratulations!

Mourinho na London Review of Books

Através do Bem Haja, chego a uma recensão de um livro sobre José Mourinho, escrita por David Runciman, professor de teoria política em Cambridge. Muito boa.

segunda-feira, dezembro 26, 2005

Tendências

É possível, contudo, que parte do que estamos a observar em termos de diferenças entre as sondagens se deva não apenas ao erro amostral ou a discrepâncias entre os instrumentos usados pelos diferentes institutos nos diferentes momentos, mas sim a uma real mudança nas intenções de voto válidas ao longo do tempo (causadas quer por mudanças de intenção de voto de um candidato para outro quer pela "entrada" ou "saída" de indivíduos das categorias de "indecisão" ou "abstenção).

Os gráficos seguintes permitem-nos apreciar visualmente a plausibilidade desta hipótese genérica. Vou manter isto também simples, para benefício de todos incluindo eu próprio, que tenho lacunas importantes de formação técnica quando de trata de analisar séries temporais.

A linha sólida é a que melhor se ajusta aos dados na pressuposição de uma relação linear entre a passagem do tempo e o resultado das sondagens. A vantagem desta análise consiste em que podemos ver até que ponto as diferenças entre sondagens podem ser tratadas mero "ruído" em relação a uma tendência geral. A desvantagem, claro, é a pressuposição de uma relação de linearidade entre a passagem do tempo e as intenções de voto, pressuposição essa que pode ocultar outro tipo de tendências. A curva tracejada resulta de uma regressão polinomial ponderada loess (ou "regressão local") aos dados, em que os pontos da curva são previstos pelas observações imediatamente adjacentes (e não por todas as observações, o que resultaria numa linha igual à da regressão linear). Vantagens e desvantagens são simétricas em relação as associadas à pressuposição de linearidade: sensibilidade a evoluções não lineares, mas excessiva sensibilidade a mudanças de curto prazo e "outliers".


A tendência de subida de Soares desde meados de Outubro é muito clara. A passagem do tempo explica mais de metade da variância nos resultados e, apesar das diferenças claras entre institutos (Eurosondagem sempre mais lisonjeira, Marktest e Aximage sempre menos), a subida é constante para todos.

Alegre desce. Os efeitos da passagem do tempo são menores que no caso de Soares e os dados ajustam-se menos bem à pressuposição de linearidade, mas a tendência está lá e também é estatisticamente significativa.


Jerónimo e Louçã estão estáveis, apesar de, como já sabemos, os resultados de Louçã exibirem maior dispersão. Mas essa dispersão terá de ter outra explicação que não o factor tempo.


Os resultados de Cavaco são os mais intrigantes. Grande dispersão, compreensível tendo em conta as maiores margens de erro. Linearmente, uma descida mas, no máximo, ultra-lenta e, na verdade, carecendo de significância estatística (até agora). Mas grandes outliers: Eurosondagem (em Novembro e agora esta última), Aximage (Outubro e esta última), o IPAM (na sondagem para o Diário de Coimbra). Inconsistência de tendências no interior de cada instituto: descida seguida de subida na Aximage, subida seguida de descida na Eurosondagem, descida seguida de subida na Marktest.

As dúvidas não são resolvidas olhando para os resultados brutos. Em regra, não olho para eles porque creio que há opções técnicas que influenciam dramaticamente a percentagem de indecisos e abstencionistas captados pelas diferentes sondagens, quer entre institutos quer entre sondagens feitas pelos mesmos institutos. Contudo, ignorando isso, a análise deste quadro mostra as "intenções directas" de voto a descerem continuamente na Marktest, a descerem e depois a subirem na Aximage e a subirem para logo depois descerem na Eurosondagem.

Assim, em síntese:
1. Sinais muito claros de subida para Soares, com dispersão grandemente explicada pela passagem do tempo;
2. Sinais claros de descida para Alegre;
3. Estabilidade genérica para Jerónimo e Louçã, mas maior incerteza para o segundo;
4. Incógnita (e, à falta de melhor, estabilidade) para Cavaco.

Em Janeiro voltamos a falar.

Dispersão

Uma das maneiras de interpretar os resultados de diferentes sondagens é olhar para a sua dispersão. Deste ponto de vista, o analista não faz qualquer pressuposição sobre a existência de efeitos sobre as estimativas resultantes da passagem do tempo, dos eventos políticos ou de qualquer outra dinâmica da campanha. No máximo, pressupõe que esses efeitos são erráticos, impossíveis de determinar ou negligenciáveis em relação às restantes fontes de erro, fontes essas ligadas quer ao facto de se usarem amostras para fazer inferências sobre o universo quer à miríade de factores (questionários usados, ordem das perguntas, etc, etc, etc) que podem produzir erro não amostral. Assim, o analista limita-se a constatar que há estimativas diferentes que resultam da medição da intenção de voto nas presidenciais e interpreta a sua maior ou menor dispersão como medida de uma maior ou menor incerteza acerca das intenções de voto num determinado candidato.

Quero manter isto o mais simples possível, e por isso abordo a questão da dispersão dos resultados para cada candidato consiste calculando simplesmente a amplitude (a diferença entre os resultados máximos e mínimo) e o desvio-padrão (distância em relação ao valor médio dentro da qual se encontram 68% das observações). Como se vê no gráfico seguinte, os resultados que vêm exibindo maior dispersão são os atribuidos pelas sondagens a Cavaco Silva e Mário Soares.
















Contudo, feita assim, a comparação entre os candidatos é enganadora. Por exemplo, seria sempre de esperar que a dispersão obtida para os resultados de Cavaco Silva fosse elevada em comparação com a obtida para os restantes candidatos, dado que a margem de erro amostral é tanto maior quanto mais próximos os resultados estejam de 50%.

Logo, uma maneira melhor de comparar a dispersão dos resultados é comparar aquela que se verifica nos resultados com a que deveria ser esperada se a única fonte de diferenças entre as sondagens fosse a margem de erro amostral. Para esse efeito, calculei a amplitude esperada em torno da estimativa média para cada candidato causada pelo erro amostral para uma amostra de 945 (a média da dimensão das amostras nas 14 sondagens publicadas até ao momento) e, de seguida, dividi a amplitude real por essa amplitude esperada para cada candidato:


Como se interpreta este gráfico? A diferença entre os resultados máximo e mínimo obtidos pelas sondagens para Mário Soares é 2,3 vezes superior ao que seria de esperar caso a única fonte de discrepâncias entre as sondagens fosse o erro amostral. No extremo oposto, temos Jerónimo de Sousa, cujos resultados nas 14 sondagens publicadas até ao momento têm estado quase todos dentro das variações expectáveis tendo em conta o erro amostral.

Por outras palavras: na hipótese de que não se consiga apoiar com os dados disponíveis qualquer teoria plausível sobre como a passagem do tempo está a determinar variações entre os resultados obtidos para cada candidato ou sobre como a utilização de determinadas opções técnicas está a conduzir a enviesamentos em relação à realidade, o maior nível de incerteza existe em relação às intenções válidas de voto em Mário Soares, cujos resultados exibem disparidades muito superiores ao que seria de esperar tendo apenas em conta o erro amostral associado às várias estimativas. Apesar da variação nos resultados de Cavaco Silva ser, em absoluto, igualmente grande, ela é bastante menos significativa, tendo em conta que se estão a estimar resultados mais próximos dos 50%.

Actualização

Quadro com sondagem SIC/Eurosondagem:



Título da notícia: Vitória à primeira garantida.

É extraordinário como, neste título com apenas quatro palavras, se consegue, pegando numa sondagem feita a um mês da eleição, interpretar a estimativa pontual obtida como indicando um "resultado eleitoral garantido", e ainda por cima não perceber que aquilo que a sondagem diz é que, tendo apenas em conta a margem de erro amostral, a inferência para o universo é que Cavaco terá neste momento entre 49% e 55% de intenções de votos válidas.

Sim e sim

Sobre os efeitos dos debates:

No Blogo Existo:
Como se torna evidente quando ouvimos as pessoas discutir o debate, uma pergunta dessas pode ser entendida de várias maneiras. Eis algumas:
1. Quem acha que revelou maior capacidade de argumentação?
2. Quem acha que foi mais convincente?
3. Quem acha que se defendeu melhor?
4. Quem o convenceu a si?
5. Quem acha que convenceu os outros?
6. Quem conseguiu alterar a seu favor a opinião do eleitorado?

Ontem, logo após o debate, o Director do Público opinou que a vitória táctica foi de Soares, mas a vitória estratégica foi de Cavaco. Entendo perfeitamente o que ele quer dizer, mas fico a pensar como responderia JM Fernandes à sondagem realizada.A ideia de perguntar às pessoas se mudaram de opinião em função do debate parece boa, mas tampouco funciona. Poucas pessoas estarão disponíveis para admitir que um mero debate inflectiu o seu sentido de voto, porque isso fá-las parecer algo volúveis, ou mesmo tontas.


De um leitor do Bloguítica:
Procurando acrescentar um dado adicional à questão, refiro que o resultado de um debate pode alterar-se de dia para dia. Isto é, na noite do debate pode ser um determinado resultado, no dia seguinte outro e assim sucessivamente. Nos estudos que costumo promover, só me "decido" acerca do resultado de um debate (por exemplo) ao fim de 4 ou 5 dias, isto é, enquanto avalio se as opiniões dos inquiridos não foram alteradas por outros acontecimentos. Os resultados vão-se alterando de dia para dia, em parte certamente pelas circunstâncias do próprio estudo, mas em parte também pelos comentários entretanto produzidos, pelas repercussões nos outros media, pelas repetições do best of nas várias televisões. Mas, em parte também porque o racional vai-se sobrepondo ao emocional, isto é, as pessoas deixam de olhar para o debate pelo debate propriamente dito e passam a reflectir sobre o debate em função dos seus objectivos políticos – intenções de voto.

sexta-feira, dezembro 23, 2005

Síntese

Apesar das dúvidas, aqui fica o quadro actualizado (hoje à noite será conhecida mais uma, mas atendo-lhe para a semana):



Bom Natal..

O debate

Na sondagem da Aximage, cujo universo é o dos eleitores residentes em Portugal em lares com telefone fixo, 82,5% dos inquiridos manifestam uma opinião sobre "quem esteve melhor" no debate Soares/Cavaco (com manifesta vantagem para Cavaco, 58,3% contra 24,1%). A acreditar nos dados da audiometria, que apontam para 14,6% de audiência média, e mesmo contando com o facto de esta última se reportar, suponho, ao total da população (incluindo não eleitores), isto só pode significar que a maioria dos eleitores formou uma opinião sobre quem esteve melhor no debate sem sequer lhe ter assistido. E pensando bem, por que não?

As sondagens de hoje: resultados e dúvidas

Foi divulgada ontem uma sondagem da Intercampus para a TVI, seguida de outra hoje da Aximage para o Correio da Manhã. Confesso-vos que eu próprio já não me consigo ler nem ouvir a escrever ou a falar sobre estas coisas, e não estranharei se a vossa paciência já se tiver esgotado há muito. Mas vejamos:

1. Intercampus, TVI, 22 de Dezembro: temos os resultados brutos. Os "não sabe/não responde" e dos "não vou votar" são agregados numa mesma categoria (14,5%). Depois apresentam-se os resultados após uma redistribuição de indecisos onde são tratados como abstencionistas. As minhas contas dão uma diferença de uma décima em dois dos candidatos, mas tudo bem: está tudo claro e bem explicado.

Mais confuso é o tratamento da notícia pela TVI. Escreve-se o seguinte:

De acordo com a sondagem Intercampus/TVI, se as eleições fossem hoje e tendo em conta os indecisos, o candidato da direita venceria com 45,6 por cento dos votos, um resultado que não chega para se eleito Presidente da República.

Bem, mas logo a seguir escreve-se:

Na verdade, e de acordo com a sondagem Intercampus/TVI, retirando os indecisos, Cavaco Silva obtém 53,3 por cento dos votos, um resultado que tendo em conta a margem de erro da sondagem garante a eleição à primeira volta.

Que confusão. Outro problema é que a TVI continua a não informar na ficha técnica como selecciona os locais do país onde escolhe alojamentos, como escolhe esses alojamentos onde faz inquéritos nem como selecciona os inquiridos dentro de cada alojamento, ou seja, não descreve o método de amostragem. Como calculo que não seja nada que não se possa explicar de forma relativamente simples, não seria melhor fazê-lo? Já agora, interpreto "entrevista directa e pessoal" como significando que foi um inquérito face-a-face, presencial. A ser assim, trata-se do primeiro do género divulgado na comunicação social desde que todos os principais candidatos estão confirmados.


2. Aximage, CM, 23 de Dezembro: Temos, na página 8, um gráfico de "tarte" com os resultados brutos, a saber:

Cavaco Silva: 56,5%
Mário Soares: 11,4%
Manuel Alegre: 10,3%
Jerónimo de Sousa: 3,7%
Francisco Louçã: 3,4%
Outros: 0,9%
Indecisos: 13,8%

A soma disto dá 100%. São apresentadas também estimativas para, cito, os "votos sem indecisos". Não se faz menção a qualquer método específico de redistribuição, pelo que a primeira interpretação possível é a de que as percentagens foram recalculadas redistribuindo proporcionalmente os indecisos pelos votos válidos, ou seja, tratando-os como abstencionistas. Os resultados apresentados no jornal são os seguintes:

Cavaco Silva: 61%
Mário Soares: 17,1%
Manuel Alegre: 13,1%
Jerónimo de Sousa: 4%
Francisco Louçã: 3,8%
Outros: 1%

Como se chegou a estes números? Não sei, mas sei outra coisa: de certeza que não foi redistribuindo os 13,8% indecisos proporcionalmente pelas restantes opções. Se assim tivesse sido, os resultados teriam sido estes:

Cavaco Silva: 65,5%
Mário Soares: 13,2%
Manuel Alegre: 11,9%
Jerónimo de Sousa: 4,3%
Francisco Louçã: 3,9%
Outros: 1,0%

Não passa de uma regra de três simples, simples mesmo: no caso de Cavaco, 56,5 está para 86,2 (100-13,8) como x está para 100. X é igual a 56,5*100/86,2=65,5. Para os outros é só repetir a operação. É possível que esteja a ver a coisa mal mas, sinceramente, não creio. Logo, das duas uma: ou a Aximage e/ou o Correio da Manhã se enganaram nas contas, ou usam um método de redistribuição diferente deste, mas que não é explicado.

Vou supor que estamos perante o segundo caso, aceitando como "bons" - respeitando as decisões de quem apresenta os dados - os resultados "sem indecisos" apresentados pelo jornal. Contudo, sendo assim, acho que teria sido melhor ter-se explicado o método de redistribuição de indecisos usado.

E mais uma vez, desculpem o que pode parecer excesso de zelo, mas eu só quero perceber bem o que é feito para obter estes resultados, e assim não se vai lá.

quarta-feira, dezembro 21, 2005

Actualização

Como prometido, a actualização dos resultados na base dos dados que me foram enviados ontem pela Marktest. Para além disso, incluo uma nova sondagem, de cuja publicação não me tinha apercebido, realizada pela GEMEO/IPAM e publicada no Diário de Coimbra.



A evolução da "poll of polls" (média móvel das últimas três sondagens) fica assim:



Sobre os debates:

1. Sondagem Eurosondagem, Telefónica, 780 entrevistas:
Mário Soares: 25%
Cavaco Silva: 23,7%
Não sabe/Não responde/ não assistiu: 51,3%

2. O post do Bloguítica sobre os debates e as sondagens exprime dúvidas sobre a utilidade da informação sobre o "vencedor" do debate, afirmando que o interessante seria saber "independentemente de quem foi o vencedor, na sequência dos debates, no universo dos sondados, quem é que mudou de orientação de voto? Mudou como? Que percentagem?".

Estou completamente de acordo, como aliás se depreende do que escrevi aqui, aqui e aqui. E para que a sondagem fosse mais útil, nem se tratava exactamente de fazer o que diz aqui o Ivan - "estratificar" a amostra por identificação partidária ou posicionamento ideológico - mas, tão só ... de perguntar qual essa identificação e posicionamento. A partir daí, teria sido possível ficar a conhecer que amostra temos desse ponto de vista, e a forma diferencial como a direita e a esquerda e os eleitores dos diversos partidos viram o debate.

Um exemplo, muito simplista mas que pode servir: estes resultados agregados obtidos na sondagem sobre o "vencedor" do debate podem ter acontecido porque a esmagadora maioria dos eleitores do PS e a maior parte dos eleitores sem identificação partidária ou "centristas" deram a vitória a Mário Soares. Isso significaria um excelente resultado para esse candidato, dado que é esse eleitorado que tem tido dificuldade em hegemonizar (os eleitores do PS, havendo uma parte deles que tem afirmado tencionar votar Cavaco) ou sequer atingir (os eleitores sem simpatias partidárias claras).

Mas os mesmos resultados na sondagem podem ter ocorrido apenas porque os actuais eleitores de Soares e dos restantes candidatos de esquerda deram a vitória a Soares por mera hostilidade genérica a Cavaco, sem que isso implique a capacidade de atingir o eleitorado que pode fazer a diferença. Mas nada sabemos sobre isto, porque a sondagem nada mais perguntou, aparentemente, do que "quem ganhou".

Dito isto, é evidente que o resultado, em si mesmo, enquanto facto político, pode não ser destituído de consequências, servindo potencialmente para galvanizar a candidatura de Soares e os seus apoiantes ou, por exemplo, para aumentar a percepção entre os eleitores de esquerda de que é o único adversário viável de Cavaco (minando assim, especialmente, a candidatura de Alegre). Mas isso seria ainda mais difícil de medir e apreciar.

terça-feira, dezembro 20, 2005

Marktest, resultados brutos

Neste post, mencionei de passagem que "a Marktest, sempre tão certinha na apresentação completa dos resultados brutos, esqueceu-se de o fazer desta vez."

Recebi dois e-mails, ambos muito amáveis. Um, de Luis Queirós, da Marktest, que me envia a ficha técnica completa depositada na AACS. Outro, de João Fernandes, do DN, onde se me rectifica a informação, dizendo que "os resultados brutos estão no DN".

Das duas uma: ou eu me enganei (e já não tenho comigo o DN para confirmar) ou então não me fiz entender. O que vi no DN foi um gráfico com os resultados brutos, mas não completos, ou seja, faltando-lhes a percentagem de inquiridos que declararam não tencionar votar e que declararam tencionar votar em branco (e/ou nulo). Daí que tenha deixado ambos os campos no meu quadro com um ponto de interrogação.

Desculpem o excesso de zelo, mas só acontece porque a Marktest nos habituou a fichas técnicas impecáveis. Mas é possível que não tenha visto bem. Será?

Seja como for, aqui vai o que faltava:

Não voto: 4,2%
Voto em branco:2,6%

E se quiserem a desgregação dos "ns/nr":

Ns:16,9%
Nr:4,7%

Amanhã actualizo o quadro.

Petição

O autor deste blogue pede, ou melhor, implora à SIC e à Eurosondagem que, dado terem decido empregar os seus recursos técnicos e financeiros na realização de sondagens após o debates com o fim de determinar quem foi o vencedor, não se esqueçam hoje de colocar alguma pergunta que permita caracterizar e desagregar a amostra do ponto de vista político ou ideológico, de forma a se poder saber, no mínimo dos mínimos, as percepções dos eleitores por identificação partidária, posicionamento ideológico, ou qualquer coisa do género. Aquela coisa da semana passada do "esquerda", "centro-esquerda", etc, já não era mau. É só uma pergunta. Vá lá.

Assinado,
A Gerência

Notas soltas sobre a sondagem Marktest

Algumas notas adicionais sobre esta sondagem, aproveitando comentários que já circulam na blogosfera:

1. Quem por aqui passa sabe que raramente cito as sondagens presidenciais que vão sendo divulgadas. Trata-se de uma questão de prudência e nada mais. Não posso, no entanto, deixar de ecoar os resultados da mais recente sondagem DN/TSF que dá 16% a Manuel Alegre e 13% a Mário Soares (Lusa, 20.12.2005).Depois dos polémicos -- ou talvez não, veremos... -- valores da Eurosondagem de Rui Oliveira e Costa, resta aguardar pelos próximos resultados, desta vez julgo que fornecidos pela sondagem da Universidade Católica (in Bloguítica)

Por lapso, o Paulo Gorjão colocou resultados errados no seu post. Os correctos são, arrendondando, 16% para Manuel Alegre e 15% para Mário Soares. Quanto ao resto, não creio que a sondagem da Católica seja a próxima a ser divulgada: em princípio, segundo entendi na SIC Notícias na passada 6ª feira, haverá mais uma sondagem no Expresso no próximo Sábado. E A Católica é depois disso...


2. Os números em bruto desta sondagem mostram uma subida do número de indecisos, que este mês atingem 21,6% dos inquiridos (in Super Mário).

Não creio que esses valores sejam comparáveis aos da sondagem anterior. A sondagem anterior foi feita no quadro do Barómetro Marktest, um inquérito longo que, imagino, gera uma elevada taxa de recusas à partida - recusas de inquiridos em fazerem parte da amostra - e que, por isso, surge com um baixa percentagem de inquiridos "ns/nr" (porque muitos já foram excluídos à partida). Esta sondagem, pelo contrário, parece ser, pela ficha técnica, uma sondagem curta e dedicada exclusivamente ao tema "presidenciais". Isso deverá ter levado a uma maior taxa de resposta ao inquérito mas, depois, a uma comparativamente mais elevada percentagem de inquiridos que recusam responder à pergunta sobre intenção de voto. É a minha suposição, mas só a Marktest poderá responder cabalmente a isto. Já agora, a Marktest, sempre tão certinha na apresentação completa dos resultados brutos, esqueceu-se de o fazer desta vez...

3. Discrepâncias entre sondagens, para aqueles que com elas se inquietam. A minha sugestão é que leiam o que se segue, se puderem várias vezes, e assim escusam de me ouvir perorar novamente - e com muito menos competência - sobre o assunto:

All polls are subject to sampling errors, so two polls taken under identical conditions will vary by a highly predictable amount. That variation depends on the sample size (and sample design) and the variability in the population. Polls also vary due to non-sampling errors. These come from question wording, order of questions in the survey, "house" effects due to different procedures across polling organizations, response errors and "everything else" that can lead to error in a poll. The combination of sampling and non-sampling error is often referred to as "total survey error". The problem is that we have well established formulas for calculating sampling error, but the modeling of non-sampling errors is much harder and lacks the formal properties that sampling errors possess. Sampling error reflects the variation in polls we'd find if there were no non-sampling errors. Total survey error reflects the actual variability we see.
(...)
Every polling organization can produce results that are outliers. What is important is spotting them and putting them in proper perspective. That is far more desirable than suppressing the results or pointing to them as examples of "bias". What matters is performance over the long term, not in any single sample.

Marktest, Presidenciais, 20 de Dezembro

Divulgada hoje a sondagem Marktest para o DN e a TSF:



A evolução da média móvel das últimas três sondagens fica assim:



Em relação às sondagens anteriores, duas confirmações: uma sobre tendências, e outra sobre a impossibilidade de inferências.

A tendência já tinha sido assinalada aqui e aqui: a subida de Soares e a descida de Alegre. Ela vê-se na comparação das sondagens Aximage entre si (Alegre de 19% para 14%, Soares de 12% para 17%), Eurosondagem (Alegre de 16,9% para 12,5%, Soares de 18% para 20,4%) e, agora, Marktest (Alegre de 19% para 16,2%, Soares de 13% para 14,8%). É demasiada regularidade para ser coincidência.

A impossibilidade de inferência já tinha sido assinalada aqui: "em rigor, acho que ninguém pode dizer com segurança quem recolhe, neste momento, mais intenções válidas de voto, Alegre ou Soares." É certo que, se a tendência anterior continuar, esta questão poderá resolver-se em breve. Mas as diferenças entre os resultados dos diferentes institutos continuam a ser muito grandes e, nalguns casos, em sentidos contraditórios, para além do facto de esta sondagem da Marktest ser, das cinco sondagens mais recentes, a terceira que coloca os dois candidatos a uma diferença inferior à margem de erro amostral.

Lá em "cima", tudo na mesma...

segunda-feira, dezembro 19, 2005

Antes da gritaria

O que fazer quando uma sondagem apresenta um resultado desviante em relação à maioria dos restantes estudos publicados? Em Portugal, grita-se muito. Noutros sítios, estuda-se e trabalha-se. Dois exemplos da segunda modalidade, aqui, no sítio cada vez mais do costume, e aqui, num que vai passar a ser. Vou ver se aprendo mais qualquer coisa.

Ainda sobre a última sondagem

Pergunta-se no Insurgente:

Será lícito dar conhecimento antecipado a terceiros de uma sondagem encomendada por entidades privadas (SIC, Expresso e Rádio Renascença)?

Não sendo jurista, a minha interpretação é esta:

1. Quando a sondagem eleitoral é realizada para "pessoas colectivas públicas ou sociedades de capitais exclusiva ou maioritariamente públicos", dar conhecimento dos resultados e de toda a ficha técnica a "terceiros" (os definidos na lei) é mais do que lícito: é um dever.

Lei 10/2000, Art. 12.º Comunicação da sondagem aos interessados. Sempre que a sondagem de opinião seja realizada para pessoas colectivas públicas ou sociedades de capitais exclusiva ou maioritariamente públicos, as informações constantes da ficha técnica prevista no artigo 6.º devem ser comunicadas aos órgãos, entidades ou candidaturas directamente envolvidos nos resultados apresentados.

2. A lei não contém nem um dever nem uma proibição de divulgação a terceiros de sondagens eleitorais realizadas para entidades privadas. O que terá certamente de suceder sempre é que:
- essa sondagem, se for publicamente divulgada, terá de ter sido previamente depositada na AACS;
- essa sondagem, se for publicamente divulgada, não o pode ser mais do que 15 dias depois da realização do respectivo trabalho de campo.

Lei 10/2000, Art. 5.º Depósito. A publicação ou difusão pública de qualquer sondagem de opinião apenas é permitida após o depósito desta, junto da Alta Autoridade para a Comunicação Social, acompanhada da ficha técnica a que se refere o artigo seguinte.

Lei 10/2000, Art. Artigo 10.º, nº 3: Nos dois meses que antecedem a realização de qualquer acto eleitoral relacionado com os órgãos abrangidos pelo disposto no n.º 1 do artigo 1.º e da votação para referendo nacional, regional ou local, a primeira publicação ou difusão pública de sondagens de opinião deve ocorrer até 15 dias a contar da data em que terminaram os trabalhos de recolha de informação.


3. No entanto, a lei menciona também que "as entidades credenciadas devem garantir que os técnicos que, sob a sua responsabilidade ou por sua conta, realizem sondagens de opinião ou inquéritos e interpretem tecnicamente os resultados obtidos observam os códigos de conduta da profissão internacionalmente reconhecidos," nomeadamente o código de conduta da ESOMAR (que pode ser descarregado aqui). Nesse código diz-se o seguinte:

"20. The following records remain the property of the client and must not be disclosed by the researcher to any third party without the client's permission:
(...)
b) the research data and findings from a marketing research project"

Pelo que se conclui que os resultados de uma sondagem não podem ser transmitidos a terceiros pela empresa/instituto que faz a sondagem sem o consentimento do cliente, mas que, obviamente, o podem ser desde que esse consentimento exista. E que, como é óbvio, podem ser transmitidos pelo cliente a terceiros se assim o entender.

Um elemento adicional: assim que os resultados de uma sondagem começam a circular por redacções de órgãos de comunicação, a probabilidade de que cheguem rapidamente às mãos de partidos ou candidatos é elevadíssima, mesmo que não haja uma decisão da direcção do órgão de comunicação social nesse sentido...

Arrumar a casa

sábado, dezembro 17, 2005

Eurosondagem, Presidenciais, 17 Dezembro

Cá está ela, fonte de controvérsia antecipada. Foi telefónica, realizada entre 11 e 14 de Dezembro, 2069 inquéritos, selecção aleatória estratificada por região de domicílios e aleatória de inquiridos em cada domicílio.

Cavaco Silva: 55,5%
Mário Soares: 20,4%
Manuel Alegre: 12,5%
Jerónimo de Sousa: 5,7%
Francisco Louçã: 4,8%
Outros:1,1%

Ao que parece, a candidatura da Manuel Alegre decidiu fazer uma participação à Comissão Nacional de Eleições e à Alta Autoridade para a Comunicação Social devido ao facto de, na anterior sondagem, a Eurosondagem não ter contemplado o cenário de desistência dos restantes candidatos de esquerda para Manuel Alegre. O dono da Eurosondagem, Rui Oliveira e Costa, pondera um processo judicial. Mas claro que isto só vem agora ao de cima devido à divulgação desta sondagem, cujos resultados são assim indirectamente contestados por Manuel Alegre (que ontem afirmava à imprensa que a Eurosondagem se "especializa" em colocá-lo em 3ª lugar), numa controvérsia para a qual as declarações algo estranhas de Jorge Coelho (que há dias anunciava o 2º lugar de Mário Soares nas sondagens que seriam divulgadas "nas próximas semanas") terá dado inestimável contributo.

Enfim, a confusão do costume. O que posso dizer é o mesmo que qualquer observador exterior a isto tudo poderia: quando olhamos para os resultados desta sondagem e os confrontamos com as anteriores, não se detecta nada de estranho. Pelo contrário. O que ela faz é, aparentemente, adicionar uma observação confirmatória de uma tendência já anteriormente detectada: a diminuição das intenções válidas de voto em Manuel Alegre e correspondente aumento das intenções válidas de voto em Mário Soares. É isso que as últimas sondagens da Católica e da Intercampus já estavam a dizer (ao colocarem os dois candidatos praticamente empatados, em contraste com quase todas as sondagens anteriores) e que a última da Aximage confirmou (ao colocar já Soares à frente de Alegre). Tanto barulho por nada. Abaixo, podem examinar o gráfico com a média móvel dos resultados das últimas três sondagens para cada candidato:

sexta-feira, dezembro 16, 2005

"Nas próximas semanas"...

Não assisti à Quadratura do Círculo e não encontro transcrições, mas segundo a TSF Jorge Coelho terá invocado "as sondagens já publicadas ou a publicar 'nas próximas semanas' e que colocam o ex-Presidente em segundo lugar" como fundamento da desistência dos restantes candidatos de esquerda.

Confesso que acho censuráveis - e já o escrevi aqui - algumas das acusações de "manipulação" das sondagens que têm emanado da candidatura de Manuel Alegre. Mas quando se fala em "sondagens a publicar nas próximas semanas" como se já se conhecessem os seus resultados, então já não se pode estranhar que Manuel Alegre venha depois falar em "sondagens falsificadas", "jogo sujo" e "manipulação".

Para já não falar do facto de estas declarações serem em si mesmas um erro político, dado que, com elas, Jorge Coelho terá diminuído o potencial impacto favorável à candidatura de Soares da sondagem que deverá sair amanhã, e cujos resultados, na base destas conversas, já todos conseguiremos adivinhar.

Enfim, palavras para quê, são artistas portugueses.

quinta-feira, dezembro 15, 2005

Debates e sondagens

Há dias, na RTP-N, Manuel Villaverde Cabral lamentava a falta de sondagens que nos pudessem ajudar a aferir o impacto dos debates. Tem toda a razão. E a verdade é que, em rigor, já existem sondagens sobre os debates. Duas, que eu saiba, até ao momento:

1. Eurosondagem, 5 Dezembro, N=769, Telefónica
Quem ganhou o debate Alegre-Cavaco?
Cavaco: 27,3%
Alegre: 15,7%
Não viu/não sabe/não responde: 57%

2. Eurosondagem, 14 Dezembro, N=757, Telefónica
Quem ganhou o debate Alegre-Soares?
Alegre: 20,7%
Soares: 19,3%
Não viu/não sabe/não responde: 60%

Agora não entendam mal o que vou escrever de seguida. Acho que o esforço financeiro feito pela SIC e o esforço técnico feito pela Eurosondagem para conseguirem conduzir trabalhos como estes em tão pouco espaço de tempo merecem elogios. Mas há alguns problemas.

Em primeiro lugar, quando se fazem inferências para a população, estes resultados sugerem que, por exemplo na sondagem do dia 5, pelo menos cerca de 40% dos portugueses com 18 ou mais anos assitiram ao debate Cavaco-Alegre. Isto não é, nem pouco mais ou menos, credível. Segundo os dados da telemetria - extrapolados para o universo - o debate Alegre-Cavaco teve 1,5 milhões de espectadores. Mesmo que todos eles tivessem mais de 18 anos, isto representa menos de 20% do universo relevante. Estas amostras sub-representam os eleitores que não assitistiram aos debates ou (pior) estão a recolher opiniões de pessoas que, de facto, não lhes assistiram.

Partamos do princípio, no entanto, que essa distorção da amostra não representa um enviesamento da distribuição de opiniões válidas. Mas permanece um problema: que conclusões tirar de semelhante informação? Certamente por razões de tempo, a sondagem nada nos diz sobre a composição política, ideológica ou a mera intenção de voto pré-e pós-debate daqueles que nos deram opiniões sobre "quem ganhou". E isto seria crucial para apreciar quaisquer efeitos do debate.

Com medição "pré/pós-debate" poder-se-ia aferir em que medida os inquiridos relatam uma mudança na sua intenção de voto após o debate. E mesmo sem este design mais complicado - que exigiria uma vaga de inquéritos antes do debate e outra depois dele e, provavelmente, não detectaria muitas mudanças declaradas - poder-se-ia pelo menos determinar qual a correlação entre preferências políticas e opiniões sobre o debate.

Por exemplo: se aqueles que declararam ter assistido ao debate Cavaco/Alegre correspondessem ao eleitorado de ambos os candidatos estimado pelas mais recentes sondagens (onde Cavaco tem mais eleitores que Alegre à razão de 3 para 1), um score 27/16 a favor de Cavaco teria sido nada menos que desastroso para o primeiro, dado significar que uma parte significativa daqueles que tenciona(va)m votar Cavaco acharam que Alegre ganhou o debate. Contudo, nada sabemos sobre quem deu opiniões sobre quem ganhou o debate a não ser...quem acham que ganhou o debate.

Por muito que se desejem sondagens, estudos como estes dão uma quantidade de informação insignificante em relação ao custo e esforço que certamente implicam. É certo que produzem um item noticioso, e é provavelmente por isso que são feitas. Mas pouco mais são do que isso. Fazer mais e melhor sai muito mais caro e não creio que os meios de comunicação social portugueses disponham de recursos para tal...

sexta-feira, dezembro 09, 2005

Balão de oxigénio para Bush

Os números de popularidade de George W. Bush mostram sinais de recuperação ou, pelo menos, sugerem que a sangria dos últimos meses se encontra estancada. Para uma análise sistemática dos últimos resultados vale a pena ir aos sítios do costume: aqui e aqui.

P.S.- Só uma pequena correcção ao Acidental, já que este post foi lá citado. Escreve-se ali que "George Bush está em fase de recuperação de popularidade, nomeadamente no que diz respeito à intervenção no Iraque". A primeira parte é correcta, a segunda não sabemos. Enquanto que a primeira resulta da análise de oito sondagens e mostra uma tendência estatisticamente significativa, a segunda resulta apenas da sondagem CBS, onde, de resto, a taxa de "desaprovação" baixou apenas 3 pontos (dentro, por isso, da margem de erro amostral). Desculpem a minudência mas é só porque tem implicações substantivas: na verdade, um factor muito mais plausível para a inversão na tendência de declínio da popularidade de Bush é, tão só, a baixa no preço dos combustíveis...

quarta-feira, dezembro 07, 2005

Um desastre

Para ler e meditar, os resultados de seis sondagens conduzidas na Jordânia, Líbano, Marrocos, Arábia Saudita, Egipto e Emiratos Árabes Unidos, sobre a percepção dos cidadãos acerca das motivações da política externa norte-americana em relação ao Médio Oriente, os planos nucleares do Irão, as perspectivas de democratização na região e outros temas relacionados.

Note-se como é praticamente nulo o capital político de que os Estados Unidos dispõem neste momento para aparecerem, aos olhos dos cidadãos no Médio Oriente, como uma potência benigna capaz de promover a democracia e o bem-estar. Alternativa: a França. Em resumo: um desastre.

Sondagens realizadas pela Universidade de Maryland e a Zogby International, aqui (pdf).

terça-feira, dezembro 06, 2005

Os efeitos dos debates

Nos últimos dias, há que diga que não têm, há quem diga que têm, tudo na base de dados recolhidos com um instrumento de medida habitualmente usado nestes coisas: o "palpitómetro". O "palpitómetro" tem vantagens e desvantagens. Por um lado, é de utilização fácil e e produz resultados imediatos. Por outro lado, esses resultados tendem misteriosamente a coincidir com as preferências políticas e interesses pessoais do utilizador. Mas não se pode ter tudo.

Longe de mim querer desincentivar as práticas tradicionais da cultura opinativa indígena. Contudo, caso haja alguém que tenha a intenção de saber alguma coisa sobre o assunto antes ou depois (de preferência, antes) de usar o "palpitómetro", deixaria aqui uma única sugestão de leitura, relativamente recente e que sintetiza quarenta anos de investigação sobre o tema nos Estados Unidos:

A meta-analysis of the effects of viewing U.S. presidential debates.

Algumas conclusões:

- os efeitos dos debates na percepção das qualidades pessoais dos candidatos são grandes, mas os efeitos na percepção da competência dos candidatos é reduzida. Há quem chame a isto efeitos na percepção dos atributos estilísticos em vez dos atributos políticos*;

- através dos mecanismos anteriores, os debates influenciam o comportamento de voto, especialmente quando as diferenças entre os candidatos do ponto de vista político e ideológico são reduzidas;

- efeitos maiores quando nenhum dos candidatos é o "incumbent" (já que, para este, os eleitores já tiveram tempo para formar uma imagem mais cristalizada).

Pode sempre dizer-se que isto é nos Estados Unidos e não aqui. Mas entre isto e o "palpitómetro", eu arriscava-me a dizer (usando, reconheço, o meu próprio "palpitómetro") que as condições são de molde a que os debates possam ter um efeito não irrelevante nas decisões de voto dos eleitores, tendo em conta:

- as pequenas diferenças ideológicas visíveis entre Jerónimo de Sousa e Francisco Louçã, por um lado, e Cavaco Silva,Mário Soares e Manuel Alegre, por outro;

- o facto de um dos factores que mais determina a exposição e percepção selectivas - a identificação partidária - ser, apesar de tudo, menos relevante nestas eleições do que nas legislativas;

- o facto de não estar a concorrer um Presidente para reeleição.

P.S. - Para uma bibliografia assustadoramente exaustiva sobre o tema nos Estados Unidos (não conheço nem um vigésimo das referências), ver aqui.

* Nimmo, D. & Savage, R. L. (1976). Candidates and their images: Concepts, methods, and findings. Santa Monica, CA: Goodyear.

Aximage, Presidenciais, 6 de Dezembro

Com a sondagem Aximage/Correio da Manhã divulgada hoje, ficamos com o seguinte quadro:



Nada de novo com as intenções de voto válidas em Cavaco, que exibem uma estabilidade crescente. Cada vez mais estáveis e convergentes são também os resultados de Jerónimo de Sousa (6-5%) e Francisco Louçã (5-4%).

O mesmo não sucede, contudo, com Alegre e Soares. São, como sempre, sondagens em número inferior ao que seria necessário para detectar tendências claras, mas a luta pelo segundo lugar parece estar a ficar cada vez mais renhida, como se verifica no gráfico seguinte onde se apresentam as médias móveis das últimas três sondagens:



Seja como for, análises como esta ou esta, perfeitamente compreensíveis no plano político, parecem contudo não fazer muito sentido em face dos dados disponíveis. Se é verdade que, das oito sondagens divulgadas na comunicação social após a confirmação de todas as principais candidaturas, Alegre aparece à frente de Soares em seis delas, dois desses casos, precisamente os mais recentes, consistem em margens insignificantes (Católica e Intercampus). Mais preocupante ainda para as expectativas dos apoiantes de Manuel Alegre é o facto de, quando olhamos para as sondagens da Aximage ao longo do tempo (mantendo constantes as opções técnicas e metodológicas adoptadas), Alegre passar de uma vantagem de 6 pontos sobre Soares para uma desvantagem de 3.

Em rigor, acho que ninguém pode dizer com segurança quem recolhe, neste momento, mais intenções válidas de voto, Alegre ou Soares. O resto é política. Seria preferível, contudo, que as acusações feitas a responsáveis de institutos de sondagens passassem da insinuação à fundamentação. Ou que, no mínimo, tivessem alguma espécie de congruência com os próprios resultados das diferentes sondagens.

quarta-feira, novembro 30, 2005

Intercampus, Presidenciais, 25 de Novembro

Sei que já tem uns dias, mas tenho andado ocupado. Seja como for, não há novidades.



P.S. - Começa a tornar-se um hábito que a Intercampus - ou os órgãos de comunicação que divulgam as suas sondagens - não explique na ficha técnica os critérios de selecção dos domicílios ou dos inquiridos.

domingo, novembro 27, 2005

Conflitos de interesses

Eduardo Pitta, no Da Literatura, insurge-se contra o facto de eu, ao mesmo tempo que colaboro com um instituto de sondagens, ter também um blogue sobre sondagens e opinião pública, e ver esse blogue citado no jornal para o qual o instituto com que colaboro faz sondagens. Segundo Eduardo Pitta,

Era como se os juízes viessem comentar nos seus blogues os processos que estão a julgar. Aparentemente, muita gente considera o procedimento benigno. Por este andar, vamos ter analistas a comentar nos jornais que encomendam as amostragens, os «resultados» da concorrência, contextualizando-os de forma a levar água ao moinho de eleição.

Não é nada que não me tivesse ocorrido. Há cerca de um ano, quando pensava se havia de começar este blogue ou não, questionei-me se isso representava um conflito de interesses. Pensei em vários exemplos. Poderá um novelista/poeta, especialmente um que escreva sobre literatura num blogue, criticar livros dos seus colegas de ofício em revistas literárias onde mantenha uma colaboração regular? Enfim, exemplos desse género. Nunca me ocorreu comparar as sondagens divulgadas na comunicação social e obrigatoriamente depositadas na Alta Autoridade para a Comunicação Social com matéria em segredo de justiça, mas se calhar foi falta de lembrança.

Creio que deverão ser os leitores a ajuízar. Sei que nunca ocultei onde trabalho. Cheguei mesmo a avisar que, tendo em conta que as opções metodológicas tomadas pelas sondagens da Católica são, em parte, da minha responsabilidade, tenderia a defendê-las pelo simples facto de que as defendo em abstracto, seja onde for que trabalhe, e por isso mesmo as ponho em prática. Interpreto os dados de que disponho, e nessas interpretações serei sempre, inevitavelmente, falível e subjectivo. Mas nunca interpreto dados que não coloque imediatamente aos dispor daqueles que lêem o que escrevo, para que todos possam fazer os seus próprios juízos e avaliar até que ponto sou ou não objectivo e isento. E procuro sempre sê-lo. Mas mais uma vez, terá de ser o leitor a dizer se isto chega.

Registo apenas que, mesmo tendo lido este blogue e especialmente este post, Eduardo Pitta não se tenha disposto a corrigir no seu blogue um único dos muitos erros que cometeu nesta sua análise dos resultados das sondagens de 5ª feira. Pelos vistos, questionar as coisas que escrevi não lhe interessa; o que lhe interessa é questionar o meu direito de as escrever.

quinta-feira, novembro 24, 2005

Numeracia, precisa-se (continuação)

De um leitor:
Dizer que os jornalistas deviam ser melhores (mais consistentes, mais fundamentados, mais enquadrados) mediadores de informação é apenas parte da solução para um problema complexo.Uma outra parte da solução deverá - creio que concorda - ser conseguida com uma maior literacia mediática de quem elabora os estudos. Quando queremos que a nossa mensagem passe de forma clara devemos, a montante, fazer todo o possível para assegurar que dela não podem ser tiradas conclusões erradas ou - o que acontece no mais das vezes - visões parcelares. E, no caso em apreço, ajudaria também acordar entre os principais operadores uma tipologia de comportamento idêntica, sobretudo quando os estudos são alvo de tanta atenção.

E de outro:
Não será que as empresas de sondagens poderiam definir uma metodologia comum (ou com ou sem ponderação de indecisos)? É que, tal como aconteceu hoje, basta chegar ao quiosque para se ficar perplexo. (...) Qual é o papel das empresas de sondagens nesta questão? Eu acho que não se podem demitir...

Gostava que ficasse claro que estou inteiramente de acordo com o que se diz nestas mensagens. Aliás, na próxima 4ª feira, no programa Clube de Jornalistas (gravado antes dos acontencimentos de hoje), ouvir-me-ão defender isto mesmo: quem faz as sondagens deve exercer, junto de quem as divulga, uma função pedagógica, esclarecendo os "clientes" sobre o que as sondagens "dizem" e "não dizem".

Mais: tal como defendi aqui e aqui há quase um ano (peço-vos a paciência de relerem), quem faz as sondagens, independentemente ou não de exercer essa "função pedagógica", deve à partida apresentar os resultados de forma a que este tipo de confusões nem tenham oportunidade de suceder. Não de trata de usar metodologias comuns, que quanto a isso cada um terá as suas opções, mas sim de apresentar sempre os resultados de formas comparáveis, esclarecendo as virtudes e limites de cada forma de os apresentar.

E mais ainda: estou perfeitamente convencido que, muito mais até do que através de qualquer imposição externa, a melhor maneira de resolver este tipo de problemas seria através de uma instância de auto-regulação, à semelhança do que existe nos Estados Unidos ou no Reino Unido, tal como defendi aqui.

Finalmente soube entretanto que a discussão ocorrida durante o Fórum TSF (que não ouvi), serviu, em grande medida, para esclarecer algumas das confusões criadas.

A responsabilidade é de todos, institutos de sondagens e jornalistas incluídos. Entendamo-nos, então.

Ponto de situação

1. Se bem que haja sondagens onde a existência de uma maioria absoluta de intenções válidas de voto para Cavaco Silva é incerta (Eurosondagem), todas as estimativas de todas as sondagens apontam para essa maioria absoluta. Ou seja, a probabilidade de que essa maioria absoluta seja fruto de erro amostral é cada vez mais diminuta. Pode mais, sim, ser fruto de um qualquer enviesamento comum a todos os estudos, mas não há sinais sobre que enviesamento poderá ser esse. Convém esperar pelas primeiras sondagens presenciais para discutir melhor esta questão.

2. Cinco das seis sondagens apontam para mais intenções de voto em Alegre do que em Soares, pelo que o raciocínio no ponto anterior se pode aplicar: é cada vez mais provável que, no universo, haja mais eleitores de Alegre do que de Soares. Contudo, ao contrário com o que sucede com a votação de Cavaco Silva, tem havido uma grande instabilidade nas estimativas atribuídas a Mário Soares, que oscilaram entre 11% e 18%, ou seja, uma amplitude de nada menos que 7 pontos (mais de metade que a sua estimativa mais baixa). É certo que as estimativas de Cavaco oscilam entre 52,6 e 62 (9,4 pontos), mas do ponto de vista relativo (em relação ao total de intenções de voto) essa dispersão é muito menos significativa do que se passa com Soares. Logo, creio que temos menos razões para estarmos seguros da existência actual de uma vantagem clara de Alegre sobre Soares do que sobre a existência actual de uma vantagem clara das intenções de voto em Cavaco em relação à barreira dos 50%.

3. Quanto a Francisco Louçã e Jerónimo de Sousa, quem disser que sabe qual deles têm actualmente mais apoio eleitoral não saberá o que está a dizer.

4. Na sondagem da Católica, alguns resultados interessantes:

- Eleitorado do PS é o mais dividido, não só entre Soares e Alegre, mas também (mais grave para as perspectivas da esquerda) entre Cavaco e a abstenção;

- Cavaco mobiliza o eleitorado sem simpatias partidárias com maior eficácia do que qualquer outro candidato;

- Entre que tencionam votar mas se dizem "indecisos" sobre em quem votar, o eleitorado do PS encontra-se ligeiramente sobrerepresentado, o que sugere algum (modesto) potencial de crescimento para os candidatos à esquerda de Cavaco. Contudo, o eleitorado do PS encontra-se fortemente sobrerepresentado entre os dizem ter a certeza que não irão votar. Aqui, o potential de crescimento será praticamente nulo, sabendo nós que as sondagens subestimam (em vez de sobreestimarem) os abstencionistas;

- Perante cenários hipotéticos de uma 2ª volta, Cavaco tem acima de 60% (tal como em todas as sondagens até agora) de intenções válidas de voto. Mas Alegre sai-se, neste momento e perante o cenário de uma 2ª volta, melhor do que Soares. Porque Soares tem muito maiores dificuldades em atrair numa 2ª volta os votantes dos restantes candidatos da esquerda, perdendo muitos para a abstenção;

- Mais de metade dos que se declaram eleitores de Manuel Alegre na 1ª volta acham que Soares é o candidato que pode obter melhores resultados perante Cavaco Silva. Leram bem? Repito: mais de metade dos que se declaram eleitores de Manuel Alegre na 1ª volta acham que Soares é o candidato que pode obter melhores resultados perante Cavaco Silva. Logo, o seu voto não decorre (se é que alguma vez decorreu) de uma decisão estratégica sobre "quem pode derrotar Cavaco Silva", mas sim da expressão de uma posição política independente do desfecho concreto da eleição.

Em resumo, na base destes dados, apesar de a maioria dos portugueses achar que é Mário Soares quem tem melhor hipóteses de contrariar a vitória de Cavaco Silva, a situação é-lhe muito pouco propícia. À parte a possibilidade de roubar eleitores ao próprio Cavaco Silva, que não pode ser excluída (Cavaco parte de um ponto tão alto que dificilmente poderá subir, apenas descer), o potencial de crescimento do eleitorado de Soares à esquerda parece depender em grande medida da captação de pessoas que, a esta hora, já serão dificilmente convertíveis:

- os que já dizem à partida que não tencionam votar, especialmente o eleitorado desmobilizado do PS;

- e os eleitores de Manuel Alegre, maioritariamente compostos por pessoas que declaram tencionar votar em Alegre apesar de acharem que Soares é quem tem hipóteses de obter um melhor resultado contra Cavaco Silva, o que mostra que a argumentação "estratégica" - o voto em Soares como única maneira de derrotar Cavaco - não deverá ser suficiente para os converter.