Os fundamentos do cookie

Há algum tempo, li uma matéria detalhada sobre privacidade na Internet em um grande e respeitado jornal, e a matéria continha uma definição de cookies. Parafraseando-a, a definição era a seguinte:
    "os cookies são programas que os sites colocam no seu disco rígido. Eles ficam no seu computador juntando informações sobre você e tudo o que você faz na internet e, cada vez que o site quiser, pode descarregar toda a informação que o cookie coletou". [errado]
Definições como essa são comuns na mídia. O problema é que não está correta. Os cookies não são programas e não podem rodar como programas. Portanto, não podem juntar informações, nem podem coletar qualquer informação pessoal sobre você a partir de sua máquina.

Aqui está uma definição válida de um cookie: um cookie é uma parte de um texto que um servidor da web armazena no disco rígido do usuário. Os cookies permitem que um site armazene informações no computador do usuário e depois as recupere. As informações são armazenadas como pares de nome-valor.

Um site pode gerar um número de ID exclusivo para cada visitante e armazenar esse número em cada máquina de usuário por meio de um arquivo de cookie.

Se você usa o Microsoft Internet Explorer para navegar na web, pode ver todos os cookies armazenados na sua máquina. O lugar mais comum onde ficam armazenados é um diretório chamado c:windowscookies. Quando eu examino esse diretório no meu computador, encontro 165 arquivos. Cada arquivo é um arquivo de texto que contém pares de nome-valor, e existe um arquivo para cada site que deixou cookies na minha máquina.

Você pode ver no diretório que cada um destes arquivos é um arquivo de texto simples e normal. Quando você olha o nome de um deles, observa que cada site deixou um arquivo na máquina (a informação também está armazenada dentro dele). É possível abri-lo com um clique.

Eu visitei, por exemplo, o goto.com, e o site colocou um cookie na minha máquina. O arquivo de cookie para goto.com contém a seguinte informação:

        UserID A9A3BECE0563982D www.goto.com/  

O goto.com armazenou na minha máquina um par único de nome-valor. O nome do par é UserID e o valor é A9A3BECE0563982D. A primeira vez que eu visitei o goto.com, o site me designou um valor exclusivo de ID e o armazenou na minha máquina.

Observe que, provavelmente, existem vários outros valores armazenados no arquivo depois dos três mostrados acima. Isto são informações que o navegador usa para se organizar.

A amazon.com armazena um número um pouco maior de informações na minha máquina. Quando examino o arquivo de cookie que ela criou, ele contém o seguinte:

   session-id-time 954242000
   amazon.com/
     session-id 002-4135256-7625846
   A Amazon.com/
     x-main eKQIfwnxuF7qtmX52x6VWAXh@Ih6Uo5H
   A Amazon.com/
     ubid-main 077-9263437-9645324
   A Amazon.com/  

Parece que a amazon armazena uma ID de usuário principal, uma ID para cada sessão e a hora em que a sessão começou em minha máquina.

A grande maioria dos sites armazena apenas uma informação, uma ID de usuário. Mas o site pode armazenar muitos pares de nome-valor, se quiser.

Um par de nome-valor é simplesmente parte de um dado nomeado. Não é um programa e ele não pode "fazer" nada. Um site pode recuperar apenas a informação que ele colocou na sua máquina. Ele não pode recuperar informação de outros arquivos de cookie, nem qualquer outra informação.