Marcação: XML e RDF

Digamos que você queira tornar esta frase legível por um computador:

Anakin Skywalker é pai de Luke Skywalker.

É fácil para você descobrir o que esta frase significa - Anakin e Luke Skywalker são ambos pessoas, e há uma relação entre eles. Você sabe que pai é um tipo de parente, e que a frase também significa que Luke é filho de Anakin. Mas um computador não consegue entender nada disso sem ajuda. Para fazer com que um computador entenda o que esta frase significa, você precisaria adicionar informações legíveis por máquina que descrevem quem Anakin e Luke são e qual é a relação entre eles. Isso começa com duas ferramentas - Extensible Markup Language (XML) - linguagem de marcação extensível - e Resource Description Framework (RDF) - estrutura de descrição de recursos.

XML é uma linguagem de marcação como HTML (linguagem de marcação de hipertexto), com a qual você provavelmente já está familiarizado por navegar na internet. O HTML administra a aparência da informação que você vê na Web. O XML complementa (mas não substitui) o HTML ao adicionar tags (etiquetas) que descrevem os dados. Estas tags são invisíveis às pessoas que lêem o documento, mas são visíveis aos computadores. As tags já estão em uso na Web, e bots (robôs), como os bots que coletam dados para ferramentas de busca, podem lê-las.

O RDF faz exatamente o que seu nome diz - usando tags de XML, fornece uma estrutura para descrever recursos. Em termos de RDF, quase tudo no mundo é um recurso. Esta estrutura emparelha o recurso (qualquer substantivo, como Anakin Skywalker ou a trilogia "Star Wars") com um item específico na Web para que o computador saiba exatamente qual recurso é. Identificar de maneira clara os recursos evita que o computador confunda Anakin Skywalker com Sebastian Shaw ou Hayden Christiansen, ou a trilogia original com a Trilogia "Star Wars" One-Man (em inglês).

Para fazê-lo, o RDF usa trios escritos como tags de XML para expressar esta informação como um gráfico. Estes trios consistem de um sujeito, uma propriedade e um objeto, que são como o sujeito, o verbo e o objeto direto de uma frase. Algumas fontes chamam-nos de sujeito, predicado e objeto. O RDF já existe na Web - por exemplo, é parte de um feed de RSS.


Um trio de RDF tem um sujeito (Anakin Skywalker), um objeto (Luke Skywalker) e uma propriedade que une os dois

Até aqui neste exemplo, o computador sabe que há dois objetos nesta frase e que há uma relação entre eles. Mas ele não sabe o que são estes objetos ou como se relacionam entre si. Veremos a ferramenta para adicionar esta camada de significado a seguir.