SenseNova 5.0: O mais recente modelo de IA da China supera o GPT-4 da OpenAI

O maior modelo da SenseTime, o SenseNova 5.0, sendo revelado no evento Tech Day em Xangai.


Em um novo desenvolvimento na esfera da inteligência artificial, a empresa chinesa SenseTime revelou o SenseNova 5.0. O modelo de IA parece ter superado o desempenho do Generative Pre-trained Transformer 4 (GPT-4), o grande modelo de linguagem multimodal da OpenAI.

O Medium relatou que o SenseNova 5.0 conseguiu superar o aclamado GPT-4 em uma variedade de benchmarks. Essas medidas incluem raciocínio lógico e escrita criativa.

O novo modelo demonstrou uma melhor capacidade de entender e gerar texto semelhante ao humano, mostrando praticidade e soluções eficazes sendo aplicadas a aplicações do mundo real.

SenseNova: Um modelo híbrido

O SenseNova 5.0, o maior modelo da SenseTime, foi revelado em 8 de abril de 2024, em um evento Tech Day em Xangai. Eles também lançaram a matriz de produtos de modelo grande “Cloud-To-Edge” full-stack.

Este novo modelo de IA generativa representa um avanço significativo no campo da IA. O modelo funciona como um híbrido, integrando arquiteturas de transformador e rede neural recorrente. Além disso, foi treinado em um conjunto diversificado de dados com mais de 10 bilhões de tokens de várias línguas e fontes.

A PR Newswire relatou que o SenseNova 5.0 passou por mais de 10TB de treinamento de tokens, cobrindo uma grande quantidade de dados sintéticos.

O modelo empregou um ‘Mixture of Experts’ para cobrir uma janela de contexto de aproximadamente 200.000 durante a inferência, aumentando sua eficácia. Seus principais avanços estão em conhecimento, matemática, raciocínio e capacidades de codificação.

O desempenho superior do SenseNova 5.0 rivaliza com o ChatGPT-4 com suas técnicas avançadas de otimização de aprendizado e pode lidar com grandes volumes de dados de maneira eficaz. Devido a isso, é capaz de produzir saídas mais precisas e entregar aplicações em diferentes indústrias.

‘Renovação constante, renovação diária e renovação contínua’
“Na era da AGI, os três elementos de dados, algoritmos e poder de computação estão passando por uma nova evolução”, disse Dr. Xu Li, Presidente e CEO da SenseTime, em um comunicado oficial. “O número de parâmetros do modelo aumentará exponencialmente, e o volume de dados crescerá maciçamente com a introdução de multimodalidades, levando a um aumento contínuo na demanda por poder de computação.”

Dr. Xu enfatizou que a empresa construiu a infraestrutura para a era da AGI com o SenseCore e nomeou o modelo de fundação como ‘SenseNova’, implicando ‘renovação constante, renovação diária e renovação contínua’. “Esperamos atualizar continuamente a velocidade de iteração dos modelos e suas capacidades de resolução de problemas, desbloqueando mais possibilidades para a AGI.”

Redação:
Related Post

Privacidade e cookies: Este site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.