Encontrar informação útil na World Wide Web é algo que muitos de nós consideram natural. De acordo com a Netcraft, uma empresa de pesquisa de Internet, existem atualmente cerca de 150 milhões de sites ativos na Internet [fonte: Netcraft (em inglês)]. A tarefa de vasculhá-los em busca de informações úteis é monumental. É por isso que os serviços de busca usam algoritmos - instruções matemáticas que informam aos computadores como realizar as tarefas que lhes são atribuídas.
![]() O serviço de buscas do Google recebe mais tráfego do que qualquer outro site da Web. Qual é exatamente o algoritmo secreto da empresa? Ninguém sabe ao certo. |
Para os administradores de páginas da Web, uma posição de destaque nos retornos do Google pode resultar em grande alta de tráfego e visibilidade. Em 2007, o Google superou a Microsoft e se tornou o site mais visitado da Web [fonte: The San Francisco Chronicle (em inglês)]. Com tamanho tráfego, obter um bom lugar em uma SERP do Google pode significar um grande estímulo ao número de visitantes recebidos pelo site.
O Open Directory Project (ODP) é uma lista de sites mantida por uma grande equipe de colaboradores voluntários. Cada voluntário supervisiona uma categoria e, juntos, eles criam e categorizam uma lista imensa e abrangente. Como são pessoas reais que avaliam e categorizam cada página da lista, serviços de busca como o Google usam o ODP como banco de dados para resultado de buscas. Conseguir que um site seja incluído no ODP muitas vezes significa que ele será incluído nos retornos de busca do Google. |
A função de busca por palavras de referência do Google se assemelha à de outros serviços de busca. Programas automatizados conhecidos como spiders ou crawlers percorrem a Web, saltando de link em link e construindo uma página de índice que inclui determinados termos de busca. O Google consulta esse índice quando um usuário executa uma busca. O serviço de busca cria uma lista de páginas que contenha os termos de busca digitados pelo usuários. Os spiders do Google também podem ter funções mais avançadas, como a capacidade de determinar a diferença entre páginas da Web que ofereçam conteúdo real e páginas de redirecionamento - páginas que existem apenas para conduzir tráfego a um outro site.
A colocação dos termos de busca afeta a maneira pela qual o Google localiza sites. O Google procura por termos de busca em todas as páginas, mas algumas seções são mais importantes do que outras. Por exemplo, incluir o termo de busca no título da página é uma boa idéia. O Google também procura pelos termos de busca entre os cabeçalhos de um site. Os cabeçalhos variam de tamanho e os termos de busca em cabeçalhos maiores têm valor superior aos de cabeçalhos menores. A dispersão de termos de busca também é importante. Os webmasters devem evitar o uso excessivo dos termos de busca desejados, mas muita gente recomenda que eles sejam repetidos regularmente ao longo de uma página.
O Haile é um percussionista robotizado que analisa a música que instrumentistas executam em tempo real e responde executando uma batida improvisada. O sistema foi projetado para combinar o poder de computação e a música algorítmica com a riqueza e a expressão de uma apresentação acústica. Veja o percussionista robô em ação nesse vídeo da Universidade Tecnológica da Geórgia. |
Na seção seguinte, aprendemos mais sobre o sistema PageRank de classificação de páginas, patenteado pelo Google.
| FAVORITOS | |||||
| Faça do HowStuffWorks a sua página inicial | | | digg it! (?) | | | del.icio.us | |