PESQUISA

Participe da votação sobre os melhores canais de divulgação científica em português na internet.

segunda-feira, 6 de junho de 2011

Quem matou o Robin? - Do precipitado anúncio do fim das teorias científicas

Todo mundo sabe que foi o Coringa quem matou o Robin Jason Todd durante o arco "Uma morte em família" nos anos de 1980. Ou não? Bem, em meados da primeira década do novo milênio, ele retornou como o vilão Capuz Vermelho. Mais um caso dos twists quadrinísticos de volta do mundo dos mortos - mas não é uma praga (ou seria uma bênção) que assola apenas os gibis: Sherlock Holmes foi morto uma vez, apenas para ser posteriormente ressuscitado (ou, melhor, não chegou a morrer de fato, escapou da morte na queda de Reichenbach graças à técnica do baritsu), volta e meia anunciam a morte dos livros, dos blogues, da história, do mundo... Uma hora devem acertar.

Um desses sobreviventes marktwainianos são as teorias científicas. Há três anos a Wired embarcava na onda de um dos executivos do Google e anunciava: "O fim da teoria: dilúvio de dados torna o método científico obsoleto".

O processo estatístico do Google de coleta de dados disponíveis na internet (e fora dele) prescindiria de um modelo teórico na análise dos dados: "Na escala de petabytes, a informação não é uma simples questão de taxonomia e ordem tri ou quadridimensional, mas de estatística dimensionalmente agnóstica. Ela clama por uma abordagem totalmente diferente, uma que requer que deixemos de manipular dados como se pudessem ser visualizados em sua totalidade. Ela nos força a ver primeiro os dados matematicamente e estabelecer o contexto depois. Por exemplo, o Google conquistou o mundo dos anúncios com nada mais do que matemática aplicada. Ele não pretende saber nada sobre a cultura e as convenções da publicidade — assume apenas que melhores dados, com melhores ferramentas analíticas, podem fazer o dia. E o Google estava certo."

Avancemos três anos no tempo para os dias atuais. Fevereiro de 2011: "Google muda algoritmo e ajusta buscas para combater fazendas de conteúdo". O Google estava errado.

A semântica importa, o modelo importa. E a Wired não estava certa sobre o algoritmo do Google ser neutro em relação a modelos: assumir que apenas a quantidade de links para uma página dita a qualidade dessa página *é* um modelo de relevância de conteúdo (e é um modelo testável - o fato de o Google ter que mudar o algoritmo para remover os resultados ruins significa que o modelo foi refutado). As ferramentas analíticas do Google importam toda a teoria estatística em seu uso - p.e. assumem que média aritmética (de links, de cliques, de interocorrência de palavras, etc.) é uma boa medida de tendência central.

Diferentemente de Jason Todd, o processo científico de teorização não chegou a ser morto; diferentemente de Holmes, não chegou nem a cair no precipício. É mais o caso de Mark Twain, um anúncio exagerado de sua morte. (Mas perguntem se o editor da Wired e o executivo do Google estão mortos de vergonha.)

Nenhum comentário:

LinkWithin

Related Posts with Thumbnails