Identificando o som

Freqüentemente, os clipes de som que estão sendo analisados não são cópias limpas de uma música. A música estaria truncada ou poderia ser semelhante a uma música diferente. É aqui que os algoritmos mostram sua utilidade. A tarefa dos algoritmos é comparar as impressões digitais e determinar se o clipe de som que chega coincide com uma música (ou parte de uma música) no banco de dados dentro de uma determinada faixa de probabilidade.

O processo de identificação é semelhante ao modo como os especialistas do laboratório criminal costumavam comparar as impressões digitais do suspeito com aquelas encontradas na cena do crime. Antes da utilização de um software de computador sofisticado e métodos avançados para exame de impressões digitais se tornarem disponíveis, os especialistas tinham de procurar por pontos de similaridade entre as diferentes impressões digitais. Na maioria dos casos, o especialista precisaria demonstrar pelo menos 16 pontos de similaridade para que uma impressão pudesse ser considerada uma coincidência.

radio waves
Foto cedida pela stock.xchng
O software compara impressões digitais que representam ondas de som para tentar obter uma coincidência
Não há faixa de probabilidade padrão para o software de reconhecimento de conteúdo. A maioria dos programas permite que os clientes ajustem o nível de similaridade exigido para declarar uma coincidência. Por exemplo, você pode ajustar o programa para que ele só traga resultados coincidentes se o algoritmo determinar que exista pelo menos 95% de chances de que seja uma coincidência. Se o clipe que entra não cair nessa faixa, ele envia uma mensagem de erro ao usuário.

Quando o programa determina uma coincidência, uma aplicação de parceria pode assumir o controle. A aplicação pode enviar informações a alguém que deseja saber o título de uma música ou pode marcar uma música em um site da Web e enviar um e-mail para o departamento jurídico da empresa gravadora correspondente. Algumas empresas gravadoras têm usado esse software para rastrear sites de troca de arquivos ou para rastrear conteúdos nos sites da Web que baixam áudio. Todo o processo de análise e verificação de coincidências leva apenas alguns segundos.

Na próxima seção, veremos como o conteúdo de vídeo apresenta desafios diferentes quando comparados aos arquivos de áudio.