Enquanto gigantes correm para monetizar IA, a DeepSeek investe no desenvolvimento de máquinas com capacidades cognitivas comparáveis às humanas
A startup chinesa de inteligência artificial DeepSeek está optando por focar em pesquisa em vez de buscar receitas, já que seu fundador bilionário decidiu não seguir os rivais do Vale do Silício e aproveitar um aumento repentino nas vendas. Segundo o Financial Times, a empresa sediada em Hangzhou, liderada pelo bilionário de fundos de hedge Liang Wenfeng, viu um aumento em seus serviços por meio de seu site e aplicativo gratuitos, mas também de clientes empresariais pagos. No mês passado, as receitas foram suficientes para cobrir os custos contínuos pela primeira vez, de acordo com duas pessoas com conhecimento de seu desenvolvimento.
O interesse no DeepSeek cresceu desde janeiro, após o lançamento de seu modelo de raciocínio R1 de baixo custo, que tem desempenho comparável aos concorrentes dos EUA e da China, mas foi construído com um orçamento muito menor.
Clientes, principalmente de setores como saúde e finanças, compraram interface de programação de aplicativos, ou API, para acessar os modelos R1 e V3 da DeepSeek, com uma demanda tão forte que a startup teve que suspender esses serviços temporariamente devido à falta de recursos alocados para fins não relacionados a pesquisa, de acordo com as pessoas.
Fontes do setor disseram que Liang demonstrou pouca intenção de capitalizar a fama repentina da DeepSeek para comercializar ainda mais sua tecnologia no curto prazo. Em vez disso, a empresa está concentrando a maioria de seus recursos no desenvolvimento de modelos e na busca para construir inteligência artificial geral — máquinas com capacidades cognitivas semelhantes às humanas.
Essas pessoas acrescentaram que o fundador rico e independente também se recusou a entreter o interesse de gigantes da tecnologia da China, bem como fundos de capital de risco e apoiados pelo estado para investir no grupo por enquanto. Muitos acharam difícil até mesmo marcar uma reunião com o fundador isolado.
“Nós puxamos conexões governamentais de alto nível e só conseguimos sentar com alguém do departamento financeiro deles, que disse ‘desculpe, não estamos levantando’”, disse um investidor em um fundo de tecnologia chinês multibilionário. “Eles claramente não estão interessados em escalar agora. É uma situação rara em que o fundador é rico e comprometido o suficiente para mantê-lo enxuto no estilo Navy Seal para sua busca por AGI.”
O surgimento do DeepSeek perturbou os mercados devido às dúvidas sobre se grupos de tecnologia dos EUA, como Google e OpenAI, conseguiriam manter sua vantagem técnica, bem como sobre a sensatez dos enormes planos de gastos em infraestrutura de IA de grandes grupos de tecnologia.
Sua abordagem também está em contraste significativo com muitas startups do Vale do Silício. A OpenAI aproveitou sua liderança inicial no desenvolvimento de modelos de IA para construir um negócio de consumo formidável em torno do ChatGPT, gerando receitas significativas com a venda de sua API.
A empresa sediada em São Francisco levantou cerca de US$ 20 bilhões em várias rodadas de financiamento desde 2019 e está em negociações com investidores liderados pelo SoftBank para levantar mais US$ 40 bilhões a uma avaliação de US$ 260 bilhões. A empresa queimou US$ 5 bilhões no ano passado, grande parte disso no treinamento de novos modelos, e obteve cerca de US$ 4 bilhões de receita. Ela cobra tanto de clientes corporativos quanto de consumidores individuais que usam seus vários modelos fechados.
A DeepSeek tem atualmente cerca de 160 funcionários, de acordo com uma pessoa familiarizada com o assunto. A OpenAI tem pouco mais de 2.000.
“A DeepSeek tem estado super focada desde o início na direção que está tomando”, disse Yusen Dai, um parceiro do fundo de capital de risco Zhen Fund, que investiu em várias startups chinesas de IA.
“Ela nem tinha nenhum produto de consumo até o lançamento do R1 [o modelo de linguagem de raciocínio grande da empresa]”, disse Dai em um podcast chinês esta semana.
A falta de ambição comercial da DeepSeek ajudou empresas de tecnologia como Alibaba e Tencent a conquistar clientes corporativos na China com sua infraestrutura e serviços mais maduros, levantando questões sobre se os fluxos de receita da startup são sustentáveis.
A Apple, por exemplo, escolheu o Qwen da Alibaba em vez do DeepSeek para lançar funções de IA em seus iPhones na China ainda este ano.
A Tencent viu suas vendas de API se multiplicarem depois que começou a adotar os modelos de código aberto da DeepSeek, de acordo com outra pessoa com conhecimento direto do assunto. Cerca de metade de seus clientes de nuvem, principalmente do governo e das finanças, tentaram usar os modelos da DeepSeek e 20 por cento deles estão solicitando a personalização de suas versões localizadas com o suporte da Tencent, acrescentaram.
A falta de foco da DeepSeek em promover seu próprio produto de mercado de massa, como o ChatGPT da OpenAI, contribuiu para a decisão da Tencent de adotar os modelos da startup, não apenas em sua plataforma de nuvem, mas também em seus aplicativos populares voltados para o consumidor, de acordo com a pessoa. A Tencent não quis comentar.
Liang, um bilionário que fundou um dos principais fundos quantitativos da China, o High Flyer, comprou cerca de 10.000 chips H800 e 10.000 A100 nos últimos anos, de acordo com uma pessoa com conhecimento do assunto. Os processadores foram obtidos antes de serem banidos para a China. A Nvidia se recusou a comentar.
A DeepSeek dependerá principalmente de provedores terceirizados para demanda futura que exceda sua capacidade existente, disse a pessoa com conhecimento dos planos.
A DeepSeek ganhou apoio de Pequim, onde o governo está contando com a IA para estimular o crescimento em sua economia em desaceleração. A startup ganhou acesso a data centers financiados pelo estado, aliviando suas restrições de computação.
A longo prazo, a DeepSeek pode achar o acesso limitado à nova geração de chips mais avançados da Nvidia um gargalo potencial e considerar futuras parcerias que podem ajudar a resolver esse problema, de acordo com fontes internas da indústria. Ela também pode ter que estar aberta a fundos apoiados pelo estado em algum momento, para ganhar mais apoio político, disseram eles.
Os engenheiros da startup estão trabalhando a todo vapor para o lançamento dos modelos R2 e V4, que estava inicialmente programado para maio, mas pode ser acelerado para manter o ritmo, disse uma pessoa com conhecimento do assunto.
“Estamos no estágio inicial de uma revolução em que a curva de melhoria tecnológica é íngreme”, disse Dai, do Zhen Fund. Ele acrescentou que as empresas devem se concentrar em avanços em vez de monetização porque “um estudante do ensino médio não pode ganhar muito dinheiro, enquanto se você treiná-lo para se tornar um PhD, ele pode ganhar muito mais”.
A DeepSeek não respondeu aos pedidos de comentário.