A primeira etapa na identificação do conteúdo é montar um banco de dados de materiais que possam servir de comparação para outros arquivos. Para uma gravadora de discos, esse recurso incluiria todo o catálogo musical da empresa. O software de reconhecimento de conteúdo analisa cada música e cria uma etiqueta digital identificando aquela música. As etiquetas são chamadas de impressões digitais ou assinaturas.
![]() Foto cedida pela stock.xchng O software analisa uma música em partes procurando etiquetas para identificar a música |
O software analisa o som real da música preferencialmente à sua linguagem de codificação. Alguns programas analisam o ritmo e a batida da música. Outros medem a amplitude e a freqüência da música. O software de impressão digital pega geralmente várias amostras que duram apenas alguns segundos cada uma a partir de uma única gravação. Algumas empresas oferecem um software que analisa clips de áudio completos para obter a impressão digital mais completa possível. Pelo menos um produto atual analisa uma música quanto aos pontos de referência - momentos acústicos especiais no clipe - e então, analisa o som em volta dos pontos de referência. Em condições ideais, os pontos de referência serão prontamente identificáveis ao rastrear outras músicas.
Os programas usam algoritmos para analisar o som. A maioria usa o tipo de algoritmo Transformada Rápida de Fourier (FFT). Essa técnica matemática pode usar um conjunto complexo de sinais e rastrear quaisquer alterações dentro dele. Essas alterações - sejam de ritmo, batidas por minuto ou a amplitude e a freqüência do som no clipe - são mapeadas e convertidas matematicamente em uma impressão digital. As impressões digitais se apresentam, geralmente, no formato numérico.
Uma vez que uma empresa gravadora estabeleça seu banco de dados, ela fica preparada para ajudar a identificar músicas para potenciais clientes ou rastrear casos de violação de direitos autorais. Em qualquer caso, o software analisa os clipes de áudio desconhecidos do mesmo modo que fazia com as músicas no catálogo da empresa. Ele cria um hash, ou pequeno código que depende do conteúdo do arquivo de áudio. O software atribui impressões digitais aos clipes que então são comparadas com as impressões digitais do banco de dados. A seguir, veremos como, exatamente, ele determina se as músicas são as mesmas.