Revelado como o DeepSeek destruiu a bolha das gigantes tecnológicas de IA dos EUA

REPRODUÇÃO

A DeepSeek, empresa chinesa de inteligência artificial fundada em 2023, tem chamado a atenção da comunidade tecnológica global com o lançamento de modelos de IA que rivalizam com os produtos de ponta de empresas americanas como OpenAI e Anthropic.

A empresa alcançou resultados impressionantes com investimentos significativamente menores em dinheiro e poder de computação, despertando reações que variam de entusiasmo a preocupação entre pesquisadores e investidores.

No final de dezembro, a DeepSeek lançou seu modelo V3, um modelo de linguagem grande (LLM, na sigla em inglês) que demonstra desempenho comparável ao GPT-4 da OpenAI e ao Claude 3.5 da Anthropic.

Embora esses modelos ainda apresentem limitações, como a propensão a erros e a geração de informações incorretas, eles são capazes de realizar tarefas complexas, como responder perguntas, redigir textos e gerar códigos de programação. Em testes de raciocínio matemático e resolução de problemas, o V3 chegou a superar a média humana.

O custo de desenvolvimento do V3 foi estimado em aproximadamente US$ 5,58 milhões, uma cifra consideravelmente inferior aos mais de US$ 100 milhões gastos no desenvolvimento do GPT-4.

Além disso, a DeepSeek utilizou cerca de 2.000 unidades de GPUs H800 da Nvidia para treinar o modelo, um número bem abaixo dos 16.000 chips H100 empregados por outras empresas para projetos semelhantes.

No dia 20 de janeiro, a empresa surpreendeu novamente com o lançamento do modelo R1, focado em “raciocínio”. Este modelo, uma versão ajustada do V3, foi desenvolvido com uma técnica chamada aprendizado por reforço e é capaz de resolver problemas complexos de forma passo a passo.

O R1 demonstrou desempenho comparável ao modelo o1 da OpenAI, lançado em 2023, e também foi adaptado para versões menores e de código aberto, que podem ser executadas em computadores domésticos.

Os lançamentos da DeepSeek geraram um impacto significativo no mercado. O interesse pelo aplicativo de chatbot da empresa, alimentado pelo modelo V3, disparou, enquanto as ações de empresas de tecnologia, incluindo a Nvidia, sofreram quedas expressivas.

Em menos de uma semana, a Nvidia perdeu cerca de US$ 600 bilhões em valor de mercado, refletindo a reavaliação dos investidores sobre o futuro da indústria de IA.

Eficiência e inovação: os segredos da DeepSeek

Os avanços da DeepSeek estão centrados na eficiência, ou seja, na capacidade de obter resultados de alta qualidade com menos recursos. A empresa desenvolveu duas técnicas inovadoras que podem influenciar o futuro da pesquisa em IA.

A primeira técnica envolve o conceito matemático de “esparsidade”. Modelos de IA possuem bilhões de parâmetros que determinam suas respostas, mas apenas uma fração deles é utilizada para cada entrada específica. A DeepSeek desenvolveu um método para prever quais parâmetros seriam necessários e treinou apenas esses, reduzindo drasticamente o tempo e o custo de treinamento.

A segunda inovação está relacionada ao armazenamento de dados na memória do computador. A empresa encontrou uma maneira de compactar informações relevantes, facilitando o acesso rápido e eficiente durante o processamento. Essa abordagem permitiu que o V3 operasse com maior agilidade e menor consumo de recursos.

Impacto no mercado e na pesquisa

Os modelos e técnicas desenvolvidos pela DeepSeek foram disponibilizados sob a licença gratuita do MIT, permitindo que qualquer pessoa possa baixá-los, modificá-los e utilizá-los livremente. Embora isso represente uma ameaça para empresas que dependem de modelos proprietários para gerar lucros, é uma notícia positiva para a comunidade de pesquisa em IA.

Atualmente, grande parte da pesquisa em IA exige acesso a recursos computacionais massivos, limitando a capacidade de universidades e pequenas organizações de realizar experimentos significativos.

A eficiência dos modelos da DeepSeek pode democratizar o acesso à tecnologia, permitindo que mais pesquisadores desenvolvam e testem novas ideias.

Para os consumidores, a tendência é que o acesso à IA se torne mais acessível. Modelos menores e mais eficientes podem ser executados diretamente em dispositivos pessoais, como laptops e smartphones, reduzindo a dependência de serviços baseados em nuvem e assinaturas pagas.

Perspectivas futuras

Apesar dos avanços, ainda não está claro se a abordagem da DeepSeek levará a modelos com desempenho superior ou apenas a sistemas mais eficientes.

Para empresas e pesquisadores que já dispõem de recursos abundantes, a eficiência pode não ser um fator determinante. No entanto, para a maioria dos usuários e desenvolvedores, a redução de custos e a maior acessibilidade representam um passo significativo no avanço da tecnologia de IA.

Enquanto a DeepSeek continua a inovar, o setor de IA enfrenta um momento de transformação, com implicações que podem redefinir o equilíbrio de poder entre empresas e países.

A capacidade da empresa chinesa de competir com gigantes estabelecidos sugere que a próxima década será marcada por uma corrida global por eficiência e inovação em inteligência artificial.

Redação:
Related Post

Privacidade e cookies: Este site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.