
Nos microprocessadores Intel antigos, comandos vão de um controlador de input/output (I/O) para um controlador de memória centralizado. O controlador de memória contata um processador, que pode requisitar dados. O controlador de memória coleta esses dados da memória e os envia para o processador. O processador faz cálculos baseado nesses dados e envia os resultados de volta para o controlador de entrada e saída (I/O) através do controlador de memória. À medida que os microprocessadores foram ficando mais complexos, com múltiplos processadores em um único chip, esse modelo se tornou menos eficiente.
Usando a velha microarquitetura, os chips da Intel tinham uma banda de memória de até 21 gigabytes por segundo. Mas o poder do microprocessador estava começando a ultrapassar a velocidade das transmissões de dados. A conectividade QuickPath melhora a banda de memória, permitindo que passe mais informação por segundo.
O QuickPath descentraliza e compartimentaliza a comunicação entre processadores e memória. Em vez de um controlador de memória centralizado, cada processador tem seus próprios controlador de memória, memória dedicada e memória cache. Os processadores se comunicam diretamente com o controlador de entrada e saída. Os comandos vão do controlador I/O para os processadores. Porque cada processador tem controlador de memória, memória e cache dedicados, não há gargalo centralizado. Cada processador pode se comunicar com sua memória dedicada a uma velocidade de 32 gigabytes por segundo.
Os processadores também têm interconexões ponto-a-ponto entre eles. Isso significa que se um processador precisa acessar dados dentro do cache de outro processador, pode enviar uma requisição diretamente ao respectivo processador e obter uma resposta. No interior de cada interconexão há diferentes percursos de dados. Os dados podem fluir em ambas as direções ao mesmo tempo, aumentando a velocidade de transferência de dados. As velocidades de transferência entre os múltiplos processadores e o controlador de entrada e saída podem chegar a 25,6 gigabytes por segundo.
O QuickPath também permite que os processadores peguem atalhos quando estão requisitando informações de outros processadores. Imagine um processor de quatro núcleos com processadores A, B, C e D. Há elos entre cada processador. Em arquiteturas mais velhas, se o processador A precisasse de uma informação do processador D, ele enviaria uma requisição. O processador D então enviaria uma requisição aos processadores B e C para assegurar-se de que D tinha o elemento mais recente daquele dado. B e C enviariam os resultados para D, que então poderia enviar a informação de volta para A. Cada rodada de mensagens é chamada de "hop" - esse exemplo tinha quatro hops.
O QuickPath pula um desses passos. O processador envia sua requisição inicial (chamada "snoop") para B, C e D, sendo D designado para responder. Os processadores B e C enviariam os dados para D, que, então, enviaria o resultado para A. Esse método pula uma rodada de mensagens, ficando apenas três hops. Parece uma melhoria pequena, mas sobre bilhões de cálculos, isso faz uma grande diferença.
Além disso, se um dos outros processadores tiver a informação requisitada por A, pode enviá-la diretamente a A. Isso reduz os hops para 2. O QuickPath também empacota a informação em uma carga útil mais compacta. (Em protocolos de comunicação, carga útil se refere ao dado real sendo transmitido. Ele é seguido por um cabeçalho que identifica o transmissor e o receptor do dado sendo transportado e é logo descartado assim que chega ao destinatário)