Quem está esperançoso ou angustiado com a possibilidade de as sondagens nos Estados Unidos estarem erradas, e muito especialmente quem acha que os resultados das sondagens são condicionados pelas preferências de quem as faz ou do meio de comunicação social que as encomenda e publica, pode ver todos os seus anseios ou receios confirmados por este paper: Evidence of Systematic Bias in 2008 Presidential Polling (via Andrew Gelman).
Claro que sou suspeito, mas por que não pensar que parte do enviesamento se deve ao próprio inquirido, recusando responder para certas sondagens ou ocultando-lhes o seu comportamento?
sexta-feira, outubro 31, 2008
quinta-feira, outubro 30, 2008
Obamercial 2
Aqui está ele:
O melhor comentário que li até agora, na Slate:
"whatever the next four years may bring, we're in for some damn good camera angles."
O melhor comentário que li até agora, na Slate:
"whatever the next four years may bring, we're in for some damn good camera angles."
quarta-feira, outubro 29, 2008
Obamercial
Hoje, vai passar um anúncio/programa com a duração de meia-hora, publicidade da campanha da Barack Obama, na Fox, NBC, CBS, Univision, MSNBC e BET, em horário nobre. Só a ABC e a CNN ficam de fora. NBC e CBS vão receber um milhão de dólares cada. Não se via disto desde Ross Perot.
Ainda sobre "forecasting", a questão racial e as sondagens
Recebi hoje a PS, e voltei a olhar para os modelos de forecasting de que tenho falado várias vezes. E há uma coisa muito interessante de que não me tinha dado conta. O modelo de Lewis-Beck e Tien prevê, como eu dizia aqui, 43% dos votos para McCain na base de quatro variáveis: popularidade de Bush em Julho; crescimento real do PNB do último trimestre de 2007 até ao 2º trimestre de 2008; se o incumbent concorre ou não; e o crescimentos dos empregos.
Simplesmente, Lewis-Beck e Tien defendem que "Obama will lose a chunk of votes because he is black". Logo, estimam factores de correcção para a votação inicialmente prevista para Obama - 57%. Esses factores de correcção resultam de duas fontes:
1. Um estudo de 2007 sobre a prediposição para votar num presidente negro;
2. A comparação entre as votações, estado a estado, de Kerry e Obama nas primárias.
E concluem que Obama terá 50,1%. Ora aqui vamos ter uma boa oportunidade para perceber se Lewis-Beck e Tien deviam ter mexido no modelo original ou não por causa da questão "racial".
Simplesmente, Lewis-Beck e Tien defendem que "Obama will lose a chunk of votes because he is black". Logo, estimam factores de correcção para a votação inicialmente prevista para Obama - 57%. Esses factores de correcção resultam de duas fontes:
1. Um estudo de 2007 sobre a prediposição para votar num presidente negro;
2. A comparação entre as votações, estado a estado, de Kerry e Obama nas primárias.
E concluem que Obama terá 50,1%. Ora aqui vamos ter uma boa oportunidade para perceber se Lewis-Beck e Tien deviam ter mexido no modelo original ou não por causa da questão "racial".
Outlier: chá e torradas
Há uns tempos, João Pinto e Castro sugeria à SEDES que, em vez de andar a dizer "renhaunau renhaunau" de seis em seis meses após reuniões com chá e torradas, desse ao pedal e criasse um blogue que "estimulasse a reflexão colectiva sobre temas de grande relevância para o país". Sobre "estimular a reflexão colectiva" ou a "grande relevância para o país" não sei, mas pelo menos o blogue já está. Agora deixa cá comer mais uma torradinha.
P.S.- E aí está, estimulada "a reflexão colectiva sobre temas de grande relevância para o país". Isto dos blogues é um bocadinho menos complicado do que parece :-)
P.S.- E aí está, estimulada "a reflexão colectiva sobre temas de grande relevância para o país". Isto dos blogues é um bocadinho menos complicado do que parece :-)
segunda-feira, outubro 27, 2008
Vale a pena ler
James Stimson, sobre os resultados das sondagens nos Estados Unidos:
Saturday 10/25: Stability and Variability
Variability: This is a race of considerable variability in various organization's estimates of what should be the same quantity. And at the same time I have never seen such stability in my estimates of the daily lead. A typical day sees about ten organizations report an Obama lead varying between 1 and 14 points. Thirteen points difference is a lot, more than double what would be expected from sampling fluctuation alone. This arises chiefly, it appears, from two sources, (1) initial assumptions about the partisan makeup of the electorate, and (2) varying likely voter assumptions.
Ler o resto aqui.
Saturday 10/25: Stability and Variability
Variability: This is a race of considerable variability in various organization's estimates of what should be the same quantity. And at the same time I have never seen such stability in my estimates of the daily lead. A typical day sees about ten organizations report an Obama lead varying between 1 and 14 points. Thirteen points difference is a lot, more than double what would be expected from sampling fluctuation alone. This arises chiefly, it appears, from two sources, (1) initial assumptions about the partisan makeup of the electorate, and (2) varying likely voter assumptions.
Ler o resto aqui.
domingo, outubro 26, 2008
Uma tempestade perfeita
O meu artigo de amanhã no Público é sobre - suspense - as eleições americanas. É o último que escrevo antes do dia 4 de Novembro. Quem se interesse poderá ler amanhã no jornal e depois de amanhã aqui. Mas quem se interesse muito - sim, estou a falar de vocês os três - pode descarregar isto, uma apresentação em Powerpoint que fiz há dias na Faculdade de Direito da UL e onde se coligem uma série de dados sobre os fundamentals desta eleição:
1. Mudanças na composição social do eleitorado (o famoso argumento Judis/Teixeira);
2. Mudanças na identificação partidária nos últimos anos;
3. Mudanças nas posições ideológicas nos últimos anos;
4. Avaliação do titular (incumbent);
5. Economia e percepções do estado da economia;
E ainda:
6. Temas da campanha;
7. Avaliação dos candidatos;
8. Mobilização.
Nada disto tem grandes pretensões nem grandes teorias por detrás a não ser as de coligir dados dispersos, ter uma visão das eleições que vá para além das sondagens de intenções de voto e presumir que há factores de médio e até longo prazo que ditam muito do que estamos a observar e cujo conhecimento ajuda a reduzir as incertezas.
1. Mudanças na composição social do eleitorado (o famoso argumento Judis/Teixeira);
2. Mudanças na identificação partidária nos últimos anos;
3. Mudanças nas posições ideológicas nos últimos anos;
4. Avaliação do titular (incumbent);
5. Economia e percepções do estado da economia;
E ainda:
6. Temas da campanha;
7. Avaliação dos candidatos;
8. Mobilização.
Nada disto tem grandes pretensões nem grandes teorias por detrás a não ser as de coligir dados dispersos, ter uma visão das eleições que vá para além das sondagens de intenções de voto e presumir que há factores de médio e até longo prazo que ditam muito do que estamos a observar e cujo conhecimento ajuda a reduzir as incertezas.
sexta-feira, outubro 24, 2008
Três perguntas.
Três perguntas num comentário ao post abaixo. Vou tentar responder, remetendo, sempre que possível, para quem sabe responder melhor do que eu:
1. Trata-se da fiabilidade das sondagens que são agregadas nos principais sites como o RCP, Pollster ou 538. No mesmo dia ou espaço curto de tempo, cerca de meia dúzia sondagens são capazes de ter 6 ou 8 pontos percentuais de diferença nos resultados (relativamente à distância entre candidatos), acontecendo isto com muita regularidade. Isto não compromete a confiança das sondagens?
Não devemos ficar surpreendidos com o facto de diferentes sondagens, conduzidas no mesmo momento, exibirem resultados cujas diferenças estão acima do que seria autorizado pelo erro amostral. Há uma multiplicidade de opções técnicas - amostragem, modelos de votantes prováveis, ponderadores, formato das perguntas, etc, etc, etc - que produzem essas diferenças. Há um livro muito bom de um antigo professor meu cujo título resume isso muito bem: The Total Survey Error Approach, em que "total" significa o erro amostral mais todas as outras fontes de erro. Como lidar com isto? Por um lado, importa procurar estimar em que medida há enviesamentos característicos trazidos por cada conjunto de opções metodológicas. Como essas opções tendem a ser estáveis em cada instituto, é possível estimar aquilo que se chama "house effects", ou seja, a tendência de cada instituto para favorecer/desfavorecer cada candidato ou partido. Mas isto mostra-nos apenas um determinado desvio em relação à (vamos chamar-lhe assim) "média", e não em relação à " realidade". O que é a realidade? Ninguém sabe. Mas o que o Nate Silver faz é tomar a prestação passada dos institutos de sondagens como indicador da sua aproximação a essa realidade, presumir que essa aproximação é um bom indicador da sua aproximação à realidade presente, e ponderar os resultados das sondagens na base disso. Aqui estão os indicadores do "track record" de cada instituto que o FiveThirtyEight usa nessas ponderações. É a abordagem mais "sofisticada" (mas também com alguns riscos. Nada garante que desempenho passado seja bom desempenho futuro, especialmente se as circunstâncias políticas e sociais mudarem. O próprio Nate Silver dá um exemplo). O Pollster.com e o RCP são mais agnósticos, o que também não é necessariamente boa ideia.
2ª A média das amostras penso que andam em cerca de 2000 pessoas por sondagem a nível nacional. Não será este um número demasiado baixo para um país de 300 milhões? Penso que 2000 é o número usado regularmente em Portugal, estou certo?
Não, não, e também não (sorry). Não sei o número médio, mas é fácil calcular olhando para esta lista. Sobre o - sempre intrigante - fenómeno de a dimensão do universo ser (quase completamente irrelevante para o erro amostral, ver aqui. Em Portugal, as amostras andam entre os 600 e os 1200. Só na véspera das eleições se costuma usar amostras maiores.
3º Esta já é de leitura de sondagens. Há já sondagens (em número e qualidade) suficientes para falarmos de uma tendência após o último debate presidencial, principalmente nos estados mais decisivos?
Sim, e parece que não teve efeitos.
1. Trata-se da fiabilidade das sondagens que são agregadas nos principais sites como o RCP, Pollster ou 538. No mesmo dia ou espaço curto de tempo, cerca de meia dúzia sondagens são capazes de ter 6 ou 8 pontos percentuais de diferença nos resultados (relativamente à distância entre candidatos), acontecendo isto com muita regularidade. Isto não compromete a confiança das sondagens?
Não devemos ficar surpreendidos com o facto de diferentes sondagens, conduzidas no mesmo momento, exibirem resultados cujas diferenças estão acima do que seria autorizado pelo erro amostral. Há uma multiplicidade de opções técnicas - amostragem, modelos de votantes prováveis, ponderadores, formato das perguntas, etc, etc, etc - que produzem essas diferenças. Há um livro muito bom de um antigo professor meu cujo título resume isso muito bem: The Total Survey Error Approach, em que "total" significa o erro amostral mais todas as outras fontes de erro. Como lidar com isto? Por um lado, importa procurar estimar em que medida há enviesamentos característicos trazidos por cada conjunto de opções metodológicas. Como essas opções tendem a ser estáveis em cada instituto, é possível estimar aquilo que se chama "house effects", ou seja, a tendência de cada instituto para favorecer/desfavorecer cada candidato ou partido. Mas isto mostra-nos apenas um determinado desvio em relação à (vamos chamar-lhe assim) "média", e não em relação à " realidade". O que é a realidade? Ninguém sabe. Mas o que o Nate Silver faz é tomar a prestação passada dos institutos de sondagens como indicador da sua aproximação a essa realidade, presumir que essa aproximação é um bom indicador da sua aproximação à realidade presente, e ponderar os resultados das sondagens na base disso. Aqui estão os indicadores do "track record" de cada instituto que o FiveThirtyEight usa nessas ponderações. É a abordagem mais "sofisticada" (mas também com alguns riscos. Nada garante que desempenho passado seja bom desempenho futuro, especialmente se as circunstâncias políticas e sociais mudarem. O próprio Nate Silver dá um exemplo). O Pollster.com e o RCP são mais agnósticos, o que também não é necessariamente boa ideia.
2ª A média das amostras penso que andam em cerca de 2000 pessoas por sondagem a nível nacional. Não será este um número demasiado baixo para um país de 300 milhões? Penso que 2000 é o número usado regularmente em Portugal, estou certo?
Não, não, e também não (sorry). Não sei o número médio, mas é fácil calcular olhando para esta lista. Sobre o - sempre intrigante - fenómeno de a dimensão do universo ser (quase completamente irrelevante para o erro amostral, ver aqui. Em Portugal, as amostras andam entre os 600 e os 1200. Só na véspera das eleições se costuma usar amostras maiores.
3º Esta já é de leitura de sondagens. Há já sondagens (em número e qualidade) suficientes para falarmos de uma tendência após o último debate presidencial, principalmente nos estados mais decisivos?
Sim, e parece que não teve efeitos.
quinta-feira, outubro 23, 2008
Ainda sobre os efeitos da "raça" no comportamento eleitoral nestas presidenciais.
Há muita gente (alguma dela particularmente competente) que se tem pronunciado sobre este assunto. Larry Bartels, por exemplo, usando dados do American National Election Survey de 2004, sugere que esse efeito pode andar por um custo de 3,7% para Obama.

Mas vejamos a questão por outro lado. Há meses que circulam modelos econométricos que prevêem, na base dos tais "fundamentals" - economia, cansaço/aprovação do incumbent, etc. - a percentagem de votos para candidatos do Partido Republicano (o incumbent). Estes modelos são "cegos" em relação à "raça" dos candidatos. Alguns deles podem tê-la indirectamente, se usarem sondagens sobre os candidatos -mesmo que distantes no tempo em relação às eleições - mas a maioria não tem. Os resultados estão no Pollyvote:
A vantagem máxima para o candidato Democrata é de 16 pontos, a mínima é de 0,2 pontos. Mas a média é de 5,4 pontos.
Agora olhem para aqui:

A estimativa actual da vantagem de Obama, excluídos indecisos e 3ºs candidatos, é de 8,3 pontos. Por outras palavras a vantagem de Obama é maior do que se poderia esperar "given the fundamentals". Claro que: ainda não é dia 4, e mesmo até à véspera do dia 4, as sondagens podem vir a revelar-se erradas. Mas se há alguma coisa que se possa dizer "given the fundamentals", é que o facto de Obama ser negro o favorece eleitoralmente. Absurdo, não é? Sim, mas o contrário, na base disto, também é.
quarta-feira, outubro 22, 2008
O Bartoon explica.
Este debate é interessante, e eu já tinha prometido que ia falar nisto. Um pretexto, então.
Também não gostei especialmente de ver Ronald Dworkin, depois de descrever (correctamente) as consequências (catastróficas) que uma vitória dos Republicanos e a designação de juízes para o Supremo com o perfil prometido por McCain teriam para a interpretação da Constituição Americana, terminar dizendo que "if a remarkably distinguished candidate like Obama loses, this can be for only one reason." Mas as razões porque não gostei são, eventualmente, diferentes das de Miguel Morgado:
1. Primeiro, não há nunca "only one reason".
2. Segundo, ao contrário do que também diz Mark Danner - e retoma João Galamba - , não me parece nada que, "given the 'fundamentals', (...) the contest is so close". So close? Dia 4 cá estaremos para ver. Mas isto não me parece nada close. Vantagens de 6-8 pontos no voto popular não é coisa de somenos e não aparecem todos os dias. Nixon ganhou a McGovern por 23 pontos em 1972, mas.. McGovern? De resto, esta vantagem - ou até bastante menos - é precisamente da ordem do que se poderia esperar given the fundamentals. Esta ideia de que Obama deveria estar a arrasar mas só não está por causa da raça perde sentido logo na parte do "arrasar", porque negligencia a actual polarização do eleitorado americano e tudo aquilo que dá estabilidade ao seu comportamento, independentemente de factores de mais curto-prazo, tais como a economia ou desempenho do incumbent (mas dia 4 espero de não ter de engolir isto tudo).
3. Finalmente, não gostei porque este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter. Ainda bem que a NYRB só é lida por intelectualóides como eu e vocês que estão a ler isto.
Claro que importa perceber por que razão "este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter." É porque, precisamente, o problema existe. Há quilómetros de estantes com coisas sérias escritas sobre o assunto: "Black and white voters do seem to prefer candidates of their own race in biracial elections and, consequently, it is exceedingly rare for black candidates to be elected outside of majority-minority political jurisdictions (Barker et al.1999, Canon 1999, Walton & Smith 2000)". De resto, o grande mérito estratégico da candidatura de Obama e o seu enorme pragmatismo tem residido em fazer com que o problema pareça não existir, desactivando-o como um elemento legítimo de contestação política e retirando-lhe saliência. Claro que os Republicanos têm tentando activá-lo subtilmente, como outros textos na NYRB sugerem (o de Andrew Delbanco, por exemplo). Mas não o podem activar explicitamente: Obama não lhes deu a oportunidade, e fazê-lo por iniciativa própria seria suicídio. Daí que Jeremiah Wright tenha estado ausente da galeria de ataques a Obama, e só surgirá, se surgir, como táctica última de desespero total por parte dos Republicanos.
Quanto ao resto, os meus textos preferidos neste NYRB são os de Joan Didion e de Paul Krugman. Didion, como sempre, para além da elegantíssima escrita, tem um dedo especial para desenterrar a forma como os temas reais e mais importantes na vida americana são retirados do debate político e mediático e substituídos ou misturados com temas fictícios:
Não acontece muitas vezes que a mensagem política "certa" seja "certa" de duas maneiras: por descrever correcta e profundamente a realidade, e por ser a mais adequada eleitoralmente. Mas desta vez aconteceu. Os Republicanos andam a agitar a frase "spread the wealth" que Obama disse a "Joe the Plumber", como se isso o fizesse perder votos. Um erro, parece-me. O Bartoon de hoje explica tudo isto muito bem.
Também não gostei especialmente de ver Ronald Dworkin, depois de descrever (correctamente) as consequências (catastróficas) que uma vitória dos Republicanos e a designação de juízes para o Supremo com o perfil prometido por McCain teriam para a interpretação da Constituição Americana, terminar dizendo que "if a remarkably distinguished candidate like Obama loses, this can be for only one reason." Mas as razões porque não gostei são, eventualmente, diferentes das de Miguel Morgado:
1. Primeiro, não há nunca "only one reason".
2. Segundo, ao contrário do que também diz Mark Danner - e retoma João Galamba - , não me parece nada que, "given the 'fundamentals', (...) the contest is so close". So close? Dia 4 cá estaremos para ver. Mas isto não me parece nada close. Vantagens de 6-8 pontos no voto popular não é coisa de somenos e não aparecem todos os dias. Nixon ganhou a McGovern por 23 pontos em 1972, mas.. McGovern? De resto, esta vantagem - ou até bastante menos - é precisamente da ordem do que se poderia esperar given the fundamentals. Esta ideia de que Obama deveria estar a arrasar mas só não está por causa da raça perde sentido logo na parte do "arrasar", porque negligencia a actual polarização do eleitorado americano e tudo aquilo que dá estabilidade ao seu comportamento, independentemente de factores de mais curto-prazo, tais como a economia ou desempenho do incumbent (mas dia 4 espero de não ter de engolir isto tudo).
3. Finalmente, não gostei porque este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter. Ainda bem que a NYRB só é lida por intelectualóides como eu e vocês que estão a ler isto.
Claro que importa perceber por que razão "este discurso é exactamente o contrário daquele que Obama tem tido e exactamente o contrário daquilo que lhe convém ter." É porque, precisamente, o problema existe. Há quilómetros de estantes com coisas sérias escritas sobre o assunto: "Black and white voters do seem to prefer candidates of their own race in biracial elections and, consequently, it is exceedingly rare for black candidates to be elected outside of majority-minority political jurisdictions (Barker et al.1999, Canon 1999, Walton & Smith 2000)". De resto, o grande mérito estratégico da candidatura de Obama e o seu enorme pragmatismo tem residido em fazer com que o problema pareça não existir, desactivando-o como um elemento legítimo de contestação política e retirando-lhe saliência. Claro que os Republicanos têm tentando activá-lo subtilmente, como outros textos na NYRB sugerem (o de Andrew Delbanco, por exemplo). Mas não o podem activar explicitamente: Obama não lhes deu a oportunidade, e fazê-lo por iniciativa própria seria suicídio. Daí que Jeremiah Wright tenha estado ausente da galeria de ataques a Obama, e só surgirá, se surgir, como táctica última de desespero total por parte dos Republicanos.
Quanto ao resto, os meus textos preferidos neste NYRB são os de Joan Didion e de Paul Krugman. Didion, como sempre, para além da elegantíssima escrita, tem um dedo especial para desenterrar a forma como os temas reais e mais importantes na vida americana são retirados do debate político e mediático e substituídos ou misturados com temas fictícios:
"The presence of Barack Obama in the electoral process allowed us to talk as if "the race issue" had reached a happy ending. We did not need to talk about how the question of race has been and continues to be used to exacerbate the real issue in American life, which is class, or absence of equal opportunity."
E Krugman:
"For a while, however, Democrats in general, and Barack Obama in particular, seemed to have lost the plot. Instead of running against the Republican economic record, Obama spent the primary season and the first few weeks of the general election campaign portraying himself as a "post-partisan" politician, someone who transcended the traditional party divide. In his speeches, he tended to hold both parties equally culpable for the country's woes, denouncing the failed policies of right and left equally. (...) But all of that has changed in the past few weeks. (...) These days, Obama doesn't try to place blame equally on right and left, he denounces "an economic philosophy that says we should give more and more to those with the most and hope that prosperity trickles down to everyone else," and describes the crisis as "a final verdict on this failed philosophy." He sounds, in other words, a lot like Bill Clinton in 1992. And that's a good thing."
Não acontece muitas vezes que a mensagem política "certa" seja "certa" de duas maneiras: por descrever correcta e profundamente a realidade, e por ser a mais adequada eleitoralmente. Mas desta vez aconteceu. Os Republicanos andam a agitar a frase "spread the wealth" que Obama disse a "Joe the Plumber", como se isso o fizesse perder votos. Um erro, parece-me. O Bartoon de hoje explica tudo isto muito bem.
terça-feira, outubro 21, 2008
Podemos acreditar no que estamos a ver? Depende.
Os textos no post abaixo sobre as possibilidades de recuperação de McCain pressupõem que aquilo que as sondagens nos estão a dizer é, "na média", verdade. Que Obama tem uma vantagem de mais de 5 pontos sobre McCain, que Obama subiu drasticamente desde a crise financeira, que McCain vem recuperando nos últimos dias.
Mas se isto tudo, ou parte disto, for mentira? E se houver um enviesamento sistemático nos resultados? Uma das fontes de enviesamento já aqui muito discutida é o chamado Bradley Effect, através do qual a vantagem de Obama sobre McCain poderá estar a ser sobrestimada. A segunda é o recurso a telefones fixos, através do qual a vantagem de Obama sobre McCain poderá estar a ser sistematicamente subestimada.
James Stimson, da UNC em Chapel Hill, recorda-nos um terceiro possível enviesamento, que desta vez tem repercussões naquilo que julgamos estar a observar nos últimos dias: as pressuposições sobre os votantes prováveis que estão inseridas nos modelos.
The entry of new tracking polls (with likely voter estimates) and the changeover of existing ones to likely voter estimates are confusing the situation this week. Because Republicans traditionally turn out at higher rates than do Democrats, the likely voter estimates shift the composition of samples in the Republican direction, producing better numbers for McCain. This is creating what appears to be an illusory trend toward McCain support, an apparent decline in the Obama lead. This is seen most clearly in the Gallup organization's now triple daily reports. With a pleasing transparency, Gallup is reporting registered voters numbers (as before) and two different likely voter estimates. One Gallup calls the traditional filter assumes that historic turnout patterns will prevail and thus African-Americans and young people, for example, are assumed to turn out at relatively low rates (compared to the perennial turnout champs, the middle-aged and middle class.) Knowing that such assumptions are likely to be inaccurate this year, Gallup is also using a filter (called Expanded) that is based only on what respondents say about voting intentions. I commend Gallup for leaving us free to make our own assumptions about turnout, rather than imposing its own on us (and usually without any information about what they are.) From its latest release (10/19) Gallup shows an Obama lead of 10 points (52-42) among registered voters, 7 points (51-44) among the Expanded likely voter set and only 3 points (49-46) with the Traditional likely voter filter. It makes quite a difference which one gets reported. There is no trend in the registered voter estimates. But if you compare the older registered voter numbers with the newer likely voter numbers the illusion of trend appears.
Mas se isto tudo, ou parte disto, for mentira? E se houver um enviesamento sistemático nos resultados? Uma das fontes de enviesamento já aqui muito discutida é o chamado Bradley Effect, através do qual a vantagem de Obama sobre McCain poderá estar a ser sobrestimada. A segunda é o recurso a telefones fixos, através do qual a vantagem de Obama sobre McCain poderá estar a ser sistematicamente subestimada.
James Stimson, da UNC em Chapel Hill, recorda-nos um terceiro possível enviesamento, que desta vez tem repercussões naquilo que julgamos estar a observar nos últimos dias: as pressuposições sobre os votantes prováveis que estão inseridas nos modelos.
The entry of new tracking polls (with likely voter estimates) and the changeover of existing ones to likely voter estimates are confusing the situation this week. Because Republicans traditionally turn out at higher rates than do Democrats, the likely voter estimates shift the composition of samples in the Republican direction, producing better numbers for McCain. This is creating what appears to be an illusory trend toward McCain support, an apparent decline in the Obama lead. This is seen most clearly in the Gallup organization's now triple daily reports. With a pleasing transparency, Gallup is reporting registered voters numbers (as before) and two different likely voter estimates. One Gallup calls the traditional filter assumes that historic turnout patterns will prevail and thus African-Americans and young people, for example, are assumed to turn out at relatively low rates (compared to the perennial turnout champs, the middle-aged and middle class.) Knowing that such assumptions are likely to be inaccurate this year, Gallup is also using a filter (called Expanded) that is based only on what respondents say about voting intentions. I commend Gallup for leaving us free to make our own assumptions about turnout, rather than imposing its own on us (and usually without any information about what they are.) From its latest release (10/19) Gallup shows an Obama lead of 10 points (52-42) among registered voters, 7 points (51-44) among the Expanded likely voter set and only 3 points (49-46) with the Traditional likely voter filter. It makes quite a difference which one gets reported. There is no trend in the registered voter estimates. But if you compare the older registered voter numbers with the newer likely voter numbers the illusion of trend appears.
As possibilidades de McCain
The State of the Race, por Jay Cost: "This makes a comeback for McCain quite difficult, but not inconceivable."
Today's Polls, 10/20, por Nate Silver: "McCain needs to get those numbers down about twice as quickly as Obama got them up, and he does not have any debates or other major public events to assist him."
Today's Polls, 10/20, por Nate Silver: "McCain needs to get those numbers down about twice as quickly as Obama got them up, and he does not have any debates or other major public events to assist him."
segunda-feira, outubro 20, 2008
O fim da "chatice"
Diogo Belford Henriques respondeu ao post abaixo. Espero não ser injusto se vir a coisa assim: DBH não gostou de uma sondagem pré-eleitoral da Eurosondagem que dava 4,8% ao CDS. Após as eleições, tendo o CDS-PP obtido 8,7%, exprimiu esse descontentamento, mas não tinha mais para argumentar que a simples constatação da discrepância. Mas lendo posteriormente o meu post onde descrevia alguns dos constrangimentos e dificuldades ligadas à realização de sondagens dos Açores, DBH descobriu um ângulo para criticar a sondagem que tanto o apoquentara, mesmo que vários aspectos do que descrevi nem sequer se apliquem ao estudo telefónico da Eurosondagem. E toca de transformar esses constrangimentos em omissões graves, acabando por acusar todos os que fizeram sondagens nos Açores de serem preguiçosos e incompetentes. E ainda houve tempo para levantar a hipótese de que tanta preguiça e incompetência não passassem de uma desconsideração aos açorianos.
Neste último post, o ângulo é algo diferente. DBH acha "grave" que as sondagens à boca das urnas nos Açores não tenham trabalho de campo em todas as ilhas e que o serviço público de televisão não pague tudo o que for preciso para garantir isso. Mas o que importa perceber é que todas as sondagens e todos os estudos deste género resultam de compromissos entre o ideal e o possível. Amostras de 15.000 inquiridos em vez de 5.000, ir a todos os locais de voto de uma freguesia ou ir a todas as freguesias em vez de ir apenas a algumas, incluir telefones celulares em sondagens telefónicas em vez de apenas telefones fixos, fazer 15 ou 20 tentativas de encontrar um inquirido aleatoriamente numa casa em vez de apenas 4 ou 5, dar um mês em vez de uma semana de formação aos inquiridores, etc, etc, etc, a lista do "ideal" nas sondagens é interminável e inatingível. O importante é garantir que aquilo que se sacrifica não é suficientemente "grave" para impedir boas inferências. E manifestamente não foi, o que não nos impede de reconhecer e tentar descobrir os custos que esses sacrifícios podem ter imposto, até para se perceber que sacrifícios são legítimos da próxima vez.
Eu acho que este tipo de discussão até pode ser, em geral, saudável, e só acontece porque há cada vez mais transparência na maneira como se fazem sondagens. Sabem-se coisas intrigantes de que dantes nem se fazia ideia, aparecem novas perguntas, e conversa-se. Acho, se calhar com alguma pretensão, que não dei um contributo completamente irrelevante para isso.
Mas acho também que há dois tipos de discussão sobre sondagens e duas opções para as pessoas, como DBH, que exercem funções políticas. Podem aprender alguma coisa sobre sondagens e passam a poder fazer questões e críticas interessantes a quem trabalha nisto. Eu conheço algumas pessoas assim em quase todos os partidos (uma delas tem um blogue e outra até foi Primeiro-Ministro). Mas também se podem limitar a ter um discurso estritamente político sobre sondagens. O segundo é perfeitamente legítimo, mas serve apenas para conversarem uns com os outros. Não serve para mais.
A "chatice"
Diogo Belford Henriques (DBH) comenta, num post no 31 da Armada, este meu post sobre as sondagens à boca das urnas nos Açores.
DBH confunde várias coisas, a saber:
1. "Porque (sic) foram os resultados das eleições de ontem diferentes da sondagem (Eurosondagem, não CESOP)?"
O meu post não tem a ver com esse assunto. O meu post tem a ver com o facto da realização de sondagens nos Açores introduzir dificuldades diferentes (e superiores) à realização de outro tipo de sondagens eleitorais, mesmo que sejam sondagens à boca das urnas (e, por isso, livres dos problemas trazidos pela abstenção não declarada e pela medição de intenções e não comportamentos).
2. "Ao contrário do que diz o Pedro Magalhães, é possível ir a todas as ilhas"
Ao contrário do que sugere DBH, nenhum meio de comunicação social está disposto a pagar o que seria necessário pagar para que um instituto de sondagens pudesse realizar trabalho de campo presencial em todas as ilhas dos Açores, dispondo assim de uma amostra representativa dos - neste caso - votantes em todo o arquipélago e evitando assim ter de estimar alguns resultados por extrapolação, com todo o risco e incerteza que isso implica. A não ser que DBH esteja a querer dizer que é possível ir a todas as ilhas, ou seja, que há meios de transporte para lá chegar caso se queira lá ir. Mas se é isso, La Palisse estará contente na sua tumba.
3. "É possível telefonar (se não puder ir) a eleitores em todas as ilhas"
Quando DBH me explicar como é que se fazem sondagens à boca das urnas pelo telefone, eu ficar-lhe-ei eternamente grato.
4. "É possível ler na internet os jornais e rádios de cada ilha e conhecer as notícias e a política local (...) Mas implica trabalho."
Não, não vou dizer que não é possível ler rádios. Mas vou dizer que qualquer organização tem de ponderar os recursos de que dispõe e os benefícios que tenciona recolher do seu investimento. E vou dizer também que, por muito investimento que se faça, é muito mais fácil a alguém que conhece a política nacional e algumas "políticas locais" saber onde procurar informação e interpretá-la correctamente do que a alguém que não as conhece. O meu post era uma confissão de ignorância. Fizemos investimento para compensar essa ignorância (que nos permitiu perceber, entre muitas outras coisas, que os resultados que estávamos a captar do CDS eram credíveis) mas esse investimento daria sempre, em comparação com o que fizéssemos noutros contextos com os quais temos maior familiaridade, menos retornos.
5. "É possível que os "pequenos partidos" decidam livremente e consigam ter bons candidatos em nove ilhas."
Sim, é possível. E?
E parece que a palavra "chatice" também foi mal interpretada. Foi usada no sentido de dizer que as eleições nos Açores, por razões que já devem ser óbvias, nos colocam problemas maiores que as outras. Mas não é "chato" trabalhar nos Açores. Faz-se o que se gosta e, ainda por cima, aprende-se. E não é chato ir aos Açores. São lindos. Têm uma pessoa ou outra um bocado obtusa. Mas isso é coisa que também há (se calhar até mais) no Continente.
P.S- Dou-me conta que a única parte do post que não comentei foi o parágrafo final. Mas essa é a única parte do texto que me parece verdadeiramente mal-intencionada, pelo que nem vale a pena comentar.
DBH confunde várias coisas, a saber:
1. "Porque (sic) foram os resultados das eleições de ontem diferentes da sondagem (Eurosondagem, não CESOP)?"
O meu post não tem a ver com esse assunto. O meu post tem a ver com o facto da realização de sondagens nos Açores introduzir dificuldades diferentes (e superiores) à realização de outro tipo de sondagens eleitorais, mesmo que sejam sondagens à boca das urnas (e, por isso, livres dos problemas trazidos pela abstenção não declarada e pela medição de intenções e não comportamentos).
2. "Ao contrário do que diz o Pedro Magalhães, é possível ir a todas as ilhas"
Ao contrário do que sugere DBH, nenhum meio de comunicação social está disposto a pagar o que seria necessário pagar para que um instituto de sondagens pudesse realizar trabalho de campo presencial em todas as ilhas dos Açores, dispondo assim de uma amostra representativa dos - neste caso - votantes em todo o arquipélago e evitando assim ter de estimar alguns resultados por extrapolação, com todo o risco e incerteza que isso implica. A não ser que DBH esteja a querer dizer que é possível ir a todas as ilhas, ou seja, que há meios de transporte para lá chegar caso se queira lá ir. Mas se é isso, La Palisse estará contente na sua tumba.
3. "É possível telefonar (se não puder ir) a eleitores em todas as ilhas"
Quando DBH me explicar como é que se fazem sondagens à boca das urnas pelo telefone, eu ficar-lhe-ei eternamente grato.
4. "É possível ler na internet os jornais e rádios de cada ilha e conhecer as notícias e a política local (...) Mas implica trabalho."
Não, não vou dizer que não é possível ler rádios. Mas vou dizer que qualquer organização tem de ponderar os recursos de que dispõe e os benefícios que tenciona recolher do seu investimento. E vou dizer também que, por muito investimento que se faça, é muito mais fácil a alguém que conhece a política nacional e algumas "políticas locais" saber onde procurar informação e interpretá-la correctamente do que a alguém que não as conhece. O meu post era uma confissão de ignorância. Fizemos investimento para compensar essa ignorância (que nos permitiu perceber, entre muitas outras coisas, que os resultados que estávamos a captar do CDS eram credíveis) mas esse investimento daria sempre, em comparação com o que fizéssemos noutros contextos com os quais temos maior familiaridade, menos retornos.
5. "É possível que os "pequenos partidos" decidam livremente e consigam ter bons candidatos em nove ilhas."
Sim, é possível. E?
E parece que a palavra "chatice" também foi mal interpretada. Foi usada no sentido de dizer que as eleições nos Açores, por razões que já devem ser óbvias, nos colocam problemas maiores que as outras. Mas não é "chato" trabalhar nos Açores. Faz-se o que se gosta e, ainda por cima, aprende-se. E não é chato ir aos Açores. São lindos. Têm uma pessoa ou outra um bocado obtusa. Mas isso é coisa que também há (se calhar até mais) no Continente.
P.S- Dou-me conta que a única parte do post que não comentei foi o parágrafo final. Mas essa é a única parte do texto que me parece verdadeiramente mal-intencionada, pelo que nem vale a pena comentar.
Ainda o Bradley effect
O Professor e o Monstro.
Larry Bartels tem um ensaio imperdível intitulado "The Irrational Electorate" na The Wilson Quartely. A economia comportamental está na berra, e chega a altura da sua influência se sentir também na Ciência Política. Bartels chega a citar um dos mais conhecidos livros de divulgação sobre o tema, que por acaso li nestas férias:
E uma curiosidade: Rush Limbaugh adorou o ensaio. Sim, Rush Limbaugh:

Outros livros relacionados que li nestas férias, já agora:
Achei-os todos muito bons, o Winner's Curse mais canonicamente académico, os restantes óptimos livros de divulgação académica (o Nudge mais "policy-oriented", aparentemente próximo dos círculos de Obama), como cá não há.
Voltando a Bartels:
"These and other recent studies offer abundant evidence that election outcomes can be powerfully affected by factors unrelated to the competence and convictions of the candidates. But if voters are so whimsical, choosing the candidate with the most competent-looking face or the most recent television ad, how do they often manage to sound so sensible? Most people seem able to provide cogent-sounding reasons for voting the way they do. However, careful observation suggests that these “reasons” often are merely rationalizations constructed from readily available campaign rhetoric to justify preferences formed on other grounds."
O ensaio é uma crítica à ideia de que os votantes são racionais e de que a sua ignorância possa ser compensada quer pelo recurso a "heurísticas" quer pela agregação das decisões individuais.
E uma curiosidade: Rush Limbaugh adorou o ensaio. Sim, Rush Limbaugh:
"I mention this story, actually it's an article from the Wilson Quarterly, the Woodrow Wilson Center for scholars: "The Irrational Electorate." It's by Larry Bartels who directs the Center for the Study of Democratic Politics in Princeton University's Woodrow Wilson School of Public and International Affairs. He is the author of Unequal Democracy: The Political Economy of the New Gilded Age, published earlier this year by the Russell Sage Foundation and Princeton University Press. Now, when you print it out, it runs four or five pages. I'm not a scholar, and Mr. Bartels is, and, to me, the first part -- I had to read this a bunch of times. It reads like gobbledygook, and what it is is an analysis of a whole bunch of studies worldwide over many, many decades of the electorates, the electorates in democracies. And let me just give you some excerpts. One sentence in this piece -- and this is about how people determine who they are going to vote for. People are very short term in their focus. They tend to vote based on how the economy is going, rewarding or throwing the bums out regardless of party. But here's some interesting bits for you."
Subscrever:
Mensagens (Atom)





