Redação no(a) ChinaEUAGuerra dos chipsInternacionalRhyan de MeiraTecnologia Em 30/01/2025, 10:13

Guerra da IA: OpenAI acusa DeepSeek de destilação ilegal

OpenAI investiga se DeepSeek usou destilação ilegal de seus modelos GPT, em meio a acusações de roubo de dados e violação de propriedade intelectual

Desde que a startup chinesa de inteligência artificial (IA) DeepSeek causou impacto no Vale do Silício e em Wall Street com seus modelos de baixo custo, a empresa tem sido acusada de roubo de dados por meio de uma prática comum no setor.

A OpenAI afirmou ter evidências de que a DeepSeek usou “destilação” de seus modelos GPT para treinar os modelos de código aberto V3 e R1 a uma fração do custo que gigantes tecnológicos ocidentais gastam em seus próprios modelos, segundo reportagem do Financial Times na quarta-feira.

A OpenAI e a Microsoft, principal investidora da criadora do ChatGPT, começaram a investigar se um grupo ligado à DeepSeek extraiu grandes quantidades de dados por meio de uma interface de programação de aplicativos (API) no outono, informou a Bloomberg, citando fontes familiarizadas com o assunto.

A destilação é um método de treinar modelos menores para imitar o comportamento de modelos maiores e mais sofisticados. A prática é comum internamente em muitas empresas que buscam reduzir o tamanho de seus modelos enquanto oferecem desempenho semelhante aos usuários.

Isso, combinado com o fato de que o treinamento de modelos geralmente depende de muitos dados de origem questionável, levou alguns especialistas a questionar a sinceridade da OpenAI em suas acusações de violação de propriedade intelectual.

“A destilação viola a maioria dos termos de serviço, mas é irônico – ou até hipócrita – que as grandes empresas de tecnologia estejam denunciando isso. Treinar o ChatGPT com conteúdo da Forbes ou do New York Times também violou seus termos de serviço”, disse Lutz Finger, professor visitante sênior da Universidade Cornell e ex-funcionário de empresas de tecnologia como Google e LinkedIn, em um comunicado por e-mail. “O conhecimento é livre e difícil de proteger.”

O cofundador e CEO da OpenAI, Sam Altman (à direita), está ao lado (da direita para a esquerda) do presidente e CEO do SoftBank Group, Masayoshi Son, e do presidente executivo da Oracle, Larry Ellison, enquanto o presidente dos EUA, Donald Trump, anuncia uma nova iniciativa de IA chamada Stargate em 21 de janeiro / Foto: AFP

A DeepSeek tem seus próprios modelos destilados que utilizam outros modelos de código aberto, como o Llama, da Meta Platforms, e o Qwen, do Alibaba Group Holding. O Alibaba é proprietário do South China Morning Post.

No entanto, a OpenAI alega que a DeepSeek usou o acesso à API dos modelos GPT de código fechado para destilá-los de forma não autorizada. A DeepSeek não admitiu o uso de destilação no treinamento de seus principais modelos, V3 e R1.

Com informações de South China Morning Post*