Sob sanções globais, a Huawei lança chip Ascend 910C com desempenho impressionante, desafiando a supremacia da NVIDIA e redefinindo o futuro da computação de IA
A mais recente notícia divulgada pela DeepSeek revela que o chip Ascend 910C da Huawei alcançou um desempenho equivalente a 60% do NVIDIA H100! Esse número pode surpreender muita gente. Dados de testes realizados pela equipe da DeepSeek mostram que, em tarefas de inferência, o chip 910C da Huawei apresentou um desempenho impressionante. Além disso, com otimizações manuais por meio de kernels CUNN personalizados, o desempenho pode ser ainda mais elevado. Esse resultado tem um significado enorme.
Vale lembrar que a Huawei alcançou esse feito sob severas restrições internacionais. Isso não apenas demonstra a força da indústria de semicondutores chinesa, mas também sinaliza uma possível mudança no cenário global de chips para IA. O suporte da DeepSeek trouxe vantagens cruciais para os chips da Huawei:
- Desde o início, ofereceu suporte ao chip Ascend da Huawei.
- Mantém um repositório PyTorch independente, permitindo converter CUDA para CUNN com apenas uma linha de código.
- Há um grande potencial de otimização de desempenho, com ganhos adicionais por meio de ajustes personalizados.
Mais impressionante ainda é o fato de que este chip foi fabricado pela Semiconductor Manufacturing International Corporation (SMIC), da China, usando tecnologia de 7nm e encapsulamento em chiplet, com 53 bilhões de transistores integrados. No livro Chip War , o autor Chris Miller detalha a complexidade da cadeia de suprimentos global de chips:
- O sistema de litografia ultravioleta da ASML, na Europa, é essencial para a fabricação de chips.
- A precisão óptica da Zeiss, da Alemanha, é indispensável.
- Mercados livres na Europa, nos EUA e no Sudeste Asiático garantem a fluidez da cadeia de suprimentos.
- A China, no entanto, permanece excluída dessa rede.
Seguindo caminhos convencionais, seria necessário cerca de 15 anos para a China construir instalações de produção similares às da TSMC. Agora, a Huawei provou que, mesmo cercada por limitações severas, é possível superar barreiras. Embora @immanuelg tenha apontado que “o Transformer não será a arquitetura definitiva para AGI”, a convergência dos modelos para essa arquitetura amplifica o valor das otimizações manuais de operadores específicos.
Isso corrobora a observação de @manjimanga: a China pode pular etapas tradicionais de competição tecnológica impulsionada por IA. No entanto, o campo de treinamento ainda é dominado pela NVIDIA. Yuchen Jin admitiu: “A estabilidade em ciclos longos de treinamento é o maior desafio para os chips chineses.” Isso envolve a integração profunda entre a arquitetura subjacente do chip e a pilha de software, além de décadas de vantagem do ecossistema CUDA.
Especialistas preveem que:
- Com a convergência dos modelos para a arquitetura Transformer, a importância do CUDA e dos compiladores PyTorch diminuirá.
- A contribuição da equipe da DeepSeek reduzirá significativamente a dependência da NVIDIA, economizando custos consideráveis.
- Treinamentos de longa duração ainda são um desafio, sendo a estabilidade o ponto crítico para os chips chineses.
A ascensão da Huawei pode provar algo crucial: quando não há saída, enfrentar as adversidades pode ser o melhor caminho. Será que a Huawei conseguirá liderar uma nova onda no campo de chips de IA? Qual é a sua opinião?