Em um novo desenvolvimento na esfera da inteligência artificial, a empresa chinesa SenseTime revelou o SenseNova 5.0. O modelo de IA parece ter superado o desempenho do Generative Pre-trained Transformer 4 (GPT-4), o grande modelo de linguagem multimodal da OpenAI.
O Medium relatou que o SenseNova 5.0 conseguiu superar o aclamado GPT-4 em uma variedade de benchmarks. Essas medidas incluem raciocínio lógico e escrita criativa.
O novo modelo demonstrou uma melhor capacidade de entender e gerar texto semelhante ao humano, mostrando praticidade e soluções eficazes sendo aplicadas a aplicações do mundo real.
SenseNova: Um modelo híbrido
O SenseNova 5.0, o maior modelo da SenseTime, foi revelado em 8 de abril de 2024, em um evento Tech Day em Xangai. Eles também lançaram a matriz de produtos de modelo grande “Cloud-To-Edge” full-stack.
Este novo modelo de IA generativa representa um avanço significativo no campo da IA. O modelo funciona como um híbrido, integrando arquiteturas de transformador e rede neural recorrente. Além disso, foi treinado em um conjunto diversificado de dados com mais de 10 bilhões de tokens de várias línguas e fontes.
A PR Newswire relatou que o SenseNova 5.0 passou por mais de 10TB de treinamento de tokens, cobrindo uma grande quantidade de dados sintéticos.
O modelo empregou um ‘Mixture of Experts’ para cobrir uma janela de contexto de aproximadamente 200.000 durante a inferência, aumentando sua eficácia. Seus principais avanços estão em conhecimento, matemática, raciocínio e capacidades de codificação.
O desempenho superior do SenseNova 5.0 rivaliza com o ChatGPT-4 com suas técnicas avançadas de otimização de aprendizado e pode lidar com grandes volumes de dados de maneira eficaz. Devido a isso, é capaz de produzir saídas mais precisas e entregar aplicações em diferentes indústrias.
‘Renovação constante, renovação diária e renovação contínua’
“Na era da AGI, os três elementos de dados, algoritmos e poder de computação estão passando por uma nova evolução”, disse Dr. Xu Li, Presidente e CEO da SenseTime, em um comunicado oficial. “O número de parâmetros do modelo aumentará exponencialmente, e o volume de dados crescerá maciçamente com a introdução de multimodalidades, levando a um aumento contínuo na demanda por poder de computação.”
Dr. Xu enfatizou que a empresa construiu a infraestrutura para a era da AGI com o SenseCore e nomeou o modelo de fundação como ‘SenseNova’, implicando ‘renovação constante, renovação diária e renovação contínua’. “Esperamos atualizar continuamente a velocidade de iteração dos modelos e suas capacidades de resolução de problemas, desbloqueando mais possibilidades para a AGI.”