Introdução

Encontrar informação útil na World Wide Web é algo que muitos de nós consideram natural. De acordo com a Netcraft, uma empresa de pesquisa de Internet, existem atualmente cerca de 150 milhões de sites ativos na Internet [fonte: Netcraft (em inglês)]. A tarefa de vasculhá-los em busca de informações úteis é monumental. É por isso que os serviços de busca usam algoritmos - instruções matemáticas que informam aos computadores como realizar as tarefas que lhes são atribuídas.

Google Home Page
O serviço de buscas do Google recebe mais tráfego do que qualquer outro site da Web. Qual é exatamente o algoritmo secreto da empresa? Ninguém sabe ao certo.

O algoritmo do Google faz esse trabalho por você, conduzindo buscas em páginas da Web que contenham os termos de busca que você empregou e depois classificando a relevância dos retornos de acordo com diversos fatores, incluindo o número de vezes que o termo de busca aparece na página. As páginas que recebem classificação mais elevada surgem nas posições mais elevadas da página de resultados de busca (SERP) do Google, o que significa que os links que melhor atendem à pesquisa são os que surgem em posições mais elevadas na página do Google.

Para os administradores de páginas da Web, uma posição de destaque nos retornos do Google pode resultar em grande alta de tráfego e visibilidade. Em 2007, o Google superou a Microsoft e se tornou o site mais visitado da Web [fonte: The San Francisco Chronicle (em inglês)]. Com tamanho tráfego, obter um bom lugar em uma SERP do Google pode significar um grande estímulo ao número de visitantes recebidos pelo site.

Você conhece o ODP?

O Open Directory Project (ODP) é uma lista de sites mantida por uma grande equipe de colaboradores voluntários. Cada voluntário supervisiona uma categoria e, juntos, eles criam e categorizam uma lista imensa e abrangente. Como são pessoas reais que avaliam e categorizam cada página da lista, serviços de busca como o Google usam o ODP como banco de dados para resultado de buscas. Conseguir que um site seja incluído no ODP muitas vezes significa que ele será incluído nos retornos de busca do Google.

A função de busca por palavras de referência do Google se assemelha à de outros serviços de busca. Programas automatizados conhecidos como spiders ou crawlers percorrem a Web, saltando de link em link e construindo uma página de índice que inclui determinados termos de busca. O Google consulta esse índice quando um usuário executa uma busca. O serviço de busca cria uma lista de páginas que contenha os termos de busca digitados pelo usuários. Os spiders do Google também podem ter funções mais avançadas, como a capacidade de determinar a diferença entre páginas da Web que ofereçam conteúdo real e páginas de redirecionamento - páginas que existem apenas para conduzir tráfego a um outro site.

A colocação dos termos de busca afeta a maneira pela qual o Google localiza sites. O Google procura por termos de busca em todas as páginas, mas algumas seções são mais importantes do que outras. Por exemplo, incluir o termo de busca no título da página é uma boa idéia. O Google também procura pelos termos de busca entre os cabeçalhos de um site. Os cabeçalhos variam de tamanho e os termos de busca em cabeçalhos maiores têm valor superior aos de cabeçalhos menores. A dispersão de termos de busca também é importante. Os webmasters devem evitar o uso excessivo dos termos de busca desejados, mas muita gente recomenda que eles sejam repetidos regularmente ao longo de uma página.

Galeria de vídeo: algoritmos

O Haile é um percussionista robotizado que analisa a música que instrumentistas executam em tempo real e responde executando uma batida improvisada. O sistema foi projetado para combinar o poder de computação e a música algorítmica com a riqueza e a expressão de uma apresentação acústica. Veja o percussionista robô em ação nesse vídeo da Universidade Tecnológica da Geórgia.

Na seção seguinte, aprendemos mais sobre o sistema PageRank de classificação de páginas, patenteado pelo Google.