Fiquei a pensar por que razão nunca me teria lembrado disto, e comecei logo a congeminar um quadro comparativo para os vários jornais que permitissem essa pesquisa. Contudo, quando fui ao DN, aconteceu-me isto (pesquisas no motor de busca da página de abertura, expressões entre aspas, aspas essas que não sei se estão a funcionar, dado desaparecerem dos resultados da pesquisa):
Passos Coelho, 2826 resultados; Ferreira Leite, 9008. Ora bolas. Mas continua a ser interessante. Seria óptimo se houvesse maneira de obter estes dados de forma realmente fiável, em série temporal, e jornal a jornal. As empresas de recortes não terão isto? Os agregadores de notícias não permitirão este tipo de análise?
16 comentários:
Parece-me que num dos casos está a pesquisar só Ferreira. (È a palavra que aparece marcada). Não sei porque será.
Exacto. Se puser os nomes entre aspas, dá os resultados publicados no abrupto.
Para os posts que vou fazendo no A pente-fino, descobri estas duas páginas interessantes, ambos com uma excelente base de dados de notícias em Portugal:
http://www.destakes.com/
http://noticias.esquillo.com/
No meu browser, se puser os nomes entre aspas na página de abertura do DN acontece exactamente aquilo que mostrei no post. Se puser os nomes entre aspas na caixa própria que aparece na página de pesquisa, recebo "Acesso Negado
Não tem permissão para visualizar/fazer download deste item." Não me acontece, por isso, aquilo que jcd sugere...
Bem, os destakes não desagregam automaticamente por jornal. O esquillo sim, mas fazendo a pesquisa nota-se que falta muita coisa. Realmente, se não existe já, era bom criar um agregador que acompanhasse saliência de temas e de pessoas nas notícias, com possibilidade de desagregação temporal e por orgão de comunicação...
A diferença entre os dois resultados é que no primeiro usou-se «Ferreira Leite» e no segundo «ferreira leite».
Podem testar e confirmar.
Se a pesquisa for feita com maiúsculas, Ferreira Leite, obtêm-se 1308 resultados. Se for feita com minúsculas, ferreira leite, obtêm-se 9016.
É isso: acabo também de ver no Twitter que o detalhe está nas maiúsculas: "Ferreira Leite" e não "ferreira leite". Mas repito: era bom ter uns motores e agregadores nos quais se pudesse confiar, mesmo sabendo que as menções são uma pequena parte do que interessa saber (acabo de ver uma notícia "Silva Pereira ataca Ferreira Leite", uma menção mas, não necessariamente positiva)...
O Google fornece resultados que têm a vantagem de não serem manipuláveis pelo uso de maiúsculas ou minúsculas:
http://cli.gs/google-PC e
http://cli.gs/google-FL
Do Twitter:
@PauloQuerido@PCMagalhaes @GabrielfSilva e @vascocampilho, blogai isto: http://cli.gs/google-FL e http://cli.gs/google-PC ao menos é o Google...
O Google permite-nos fazer isto de forma controlável:
+"ferreira leite" +site:dn.sapo.pt
+"passos coelho" +site:dn.sapo.pt
O "+" indica que a expressão é obrigatória, ou seja, que não podem vir no resultado páginas onde ela não surja. As aspas indicam tratar-se, de facto, da expressão integral contida entre elas, não apenas das palavras separadas.
Na Universidade do Porto estamos a trabalhar nesta área com um projecto que se iniciou recentemente.
Um pequeno "esboço":
http://irlab.fe.up.pt/p/mm/topicos
Outro exemplo de um trabalho recente que podem achar interessante: http://irlab.fe.up.pt/p/verbatim/
Prometedor!
Não está relacionado com jornais, mas televisão: há uns tempos que a Marktest faz uma análise semelhante aos protagonistas das notícias de televisão, com análises semanais (http://www.marktest.com/wap/a/p/s~4/id~ea.aspx) ou anuais (http://www.marktest.com/wap/a/n/id~1276.aspx). Os resultados são interessantes.
Já agora, a própria Google tem um serviço semelhante, o Google Trends:
http://www.google.com/trends?q="passos+coelho",+"ferreira+leite"
Se colocar:
"pedro passos coelho": 10413 resultados
"manuela ferreira leite": 1626 (!) resultados
É verificar.
Enviar um comentário