Busca futura

As buscas definidas pelos operadores booleanos são buscas literais: o mecanismo procura por palavras ou frases exatamente como elas são digitadas. Isso pode ser um problema quando as palavras digitadas têm vários significados. "Bed", por exemplo, pode ser um local para dormir, um local onde flores são plantadas, o espaço de armazenamento de um caminhão ou um local onde o peixe desova. Se você está interessado em apenas um desses significados, você pode não desejar ver páginas que apresentem todos os outros. Você pode construir uma busca literal que tente eliminar significados indesejados, mas é bom se o próprio mecanismo de busca puder ajudar.

Uma das áreas de pesquisa do mecanismo de busca é a pesquisa baseada em conceito. Parte dessa pesquisa envolve o uso de análise estatística em páginas que contêm as palavras ou frases pelas quais você busca para encontrar outras páginas pelas quais você possa estar interessado. Obviamente, as informações armazenadas sobre cada página são maiores para um mecanismo de busca baseado em conceito e muito mais processamento é exigido para cada pesquisa. Muitos grupos estão trabalhando para melhorar ambos, os resultados e o desempenho desse tipo de mecanismo de busca. Outros prosseguiram em outra área de pesquisa, chamada pesquisas de linguagem natural.

A idéia por trás das pesquisas de linguagem natural é que você pode digitar uma pergunta da mesma maneira que perguntaria a um ser humano sentado a seu lado: sem necessidade de controlar os operadores booleanos ou complexas estruturas de pesquisa. Atualmente o site de pesquisa de linguagem natural mais popular é o AskJeeves.com (em inglês), que analisa a pesquisa por palavras-chave e depois aplica ao índice de sites que criou. Ele funciona apenas com pesquisas simples, mas a competição é grande para desenvolver um mecanismo de pesquisa de linguagem natural que possa aceitar uma pesquisa de grande complexidade.

Para mais informações sobre mecanismos de busca e assuntos relacionados, confira os links na próxima página.