banner
Lar / blog / Arm fica mais perto da criação completa
blog

Arm fica mais perto da criação completa

May 14, 2024May 14, 2024

Demora muito para colocar um novo mecanismo de computação em campo e todo mundo reclama disso. Os clientes estão impacientes porque desejam mais desempenho e o melhor custo-benefício que sempre acompanha uma nova geração de chips. E aqueles que fabricam CPUs, GPUs e outros mecanismos de computação também estão impacientes. Eles querem esmagar a concorrência e ganhar mais dinheiro.

No Hot Chips 2023 desta semana, quando a Arm Ltd estava exibindo seus núcleos “Demeter” V2 logo após anunciar que iria a público (de novo), a empresa também lançou os subsistemas de computação “Genesis” N2, ou o pacote intelectual CSS, para abreviar . (Abordaremos o mergulho profundo do núcleo V2 separadamente.) Este esforço do Genesis tem uma chance de colocar CPUs Arm em campo mais rápido do que foi possível no passado.

Ao longo dos anos, a Arm está cada vez mais perto de montar CPUs completas para os clientes modificarem e levarem diretamente ao mercado. No final dos anos 2000, quando a Arm assumiu o controle dos smartphones e os fabricantes de servidores estavam pensando em como a arquitetura Arm poderia melhorar uma arquitetura X86 que era essencialmente um monopólio, os projetistas de chips de servidor começaram com uma licença de arquitetura Arm e conseguiram. Essa era uma maneira muito cara e demorada de criar um chip de servidor, embora fosse melhor do que começar com um ISA personalizado, com o qual o mundo não toleraria devido ao enorme trabalho de portabilidade de software.

Depois de muitas tentativas fracassadas de chips de servidor Arm - por gigantes de semicondutores estabelecidos como Broadcom, Qualcomm, AMD e Samsung, bem como startups como Calxeda e Applied Micro - e algum sucesso limitado da Cavium com suas CPUs ThunderX e ThunderX2, a Arm decidiu torná-lo um pouco mais fácil com seu esforço Neoverse, que foi lançado em outubro de 2018 e que forneceu não apenas um roteiro para núcleos de chips de servidor, mas arquiteturas de referência para transformá-los em CPUs adequadas com uma mistura de outras propriedades intelectuais da Arm, como on-die interconexões mesh e memória de terceiros, controladores PCI-Express e controladores Ethernet. Esses projetos Neoverse foram adaptados para nós de processo específicos da Taiwan Semiconductor Manufacturing Co, o que tornou ainda mais fácil para os fabricantes de chips de servidor agirem mais rapidamente.

Nunca tivemos certeza se o Neoverse era mais barato ou mais caro do que uma licença de arquitetura. Você poderia argumentar isso de várias maneiras diferentes. Neoverse teve mais trabalho realizado, mas graus de liberdade limitados em comparação com uma licença arquitetônica Arm. Talvez mais importante, como apontamos há um ano em Arm Is the New RISC/Unix, RISC-V Is The New Arm, se Arm não puder ser mais barato que o ISA e os designs RISC-V, que são de código aberto, ele pode ser mais rápido. Arm precisa ser mais rápido de qualquer maneira por causa da impaciência do cliente.

Aqui está o roteiro mais recente do Neoverse, que foi revelado em setembro de 2022:

Originalmente, havia apenas uma família de núcleos – a série N – mas Arm a trifurcou em três famílias de núcleos e três plataformas correspondentes, cada uma voltada para diferentes partes do mercado de sistemas. Os núcleos e plataformas da série N destinavam-se a cargas de trabalho de servidores convencionais, onde o desempenho por watt impulsionava o design, enquanto a série V tinha processamento vetorial mais pesado e destinava-se a cargas de trabalho mais intensivas em computação, como treinamento e inferência de IA e simulação e modelagem de HPC. A série E foi voltada para a computação de rendimento e otimizada não apenas para maior desempenho por watt, mas também para o maior rendimento em um envelope térmico ainda mais baixo do que a série N poderia oferecer. Agora não haverá apenas três famílias de núcleos e plataformas, mas duas abordagens: o DIY e o CSS, por assim dizer.

Então agora o novo roteiro do Neoverse se parece com a opção CSS instalada nele:

Adicionamos os codinomes para cada núcleo e plataforma onde os conhecemos.

O esforço da Neoverse permitiu que as empresas de chips ganhassem vantagem em seus projetos, e muitas o fizeram. A Fujitsu começou muito antes de qualquer um dos fornecedores atuais – anos antes de haver um esforço Neoverse – com seu chip A64FX e pode ser considerado a implementação “Kronos” V0 em muitos aspectos, uma vez que inventou as Scalable Vector Extensions e as levou para o 512. extremo do vetor de bits do Intel AVX-512. A Amazon usou o “Maya” Cortex A72 na pilha Neoverse original em seu chip Graviton1, o “Ares” N1 em seu chip Graviton2 e o “Zeus” V1 em seu chip Graviton3. A Nvidia originalmente usou sua licença de arquitetura Arm para criar seus processadores de servidor “Denver” há mais de uma década, mas mudou para os núcleos V2 para os chips de CPU “Grace” que estão chegando ao mercado agora. A Ampere Computing tinha núcleos N1 em suas CPUs Altra e Altra Max Arm, mas agora está fazendo núcleos personalizados. O Alibaba fez um núcleo Arm v9 personalizado, aparentemente, para seu processador Yitian 710, e se isso for verdade, então o Grace da Nvidia não possui os primeiros núcleos Arm v9 do mercado. O governo indiano está usando os núcleos V1 em seu processador “Aum” A48Z.