OpenAI investiga se DeepSeek usou destilação ilegal de seus modelos GPT, em meio a acusações de roubo de dados e violação de propriedade intelectual
Desde que a startup chinesa de inteligência artificial (IA) DeepSeek causou impacto no Vale do Silício e em Wall Street com seus modelos de baixo custo, a empresa tem sido acusada de roubo de dados por meio de uma prática comum no setor.
A OpenAI afirmou ter evidências de que a DeepSeek usou “destilação” de seus modelos GPT para treinar os modelos de código aberto V3 e R1 a uma fração do custo que gigantes tecnológicos ocidentais gastam em seus próprios modelos, segundo reportagem do Financial Times na quarta-feira.
A OpenAI e a Microsoft, principal investidora da criadora do ChatGPT, começaram a investigar se um grupo ligado à DeepSeek extraiu grandes quantidades de dados por meio de uma interface de programação de aplicativos (API) no outono, informou a Bloomberg, citando fontes familiarizadas com o assunto.
A destilação é um método de treinar modelos menores para imitar o comportamento de modelos maiores e mais sofisticados. A prática é comum internamente em muitas empresas que buscam reduzir o tamanho de seus modelos enquanto oferecem desempenho semelhante aos usuários.
Isso, combinado com o fato de que o treinamento de modelos geralmente depende de muitos dados de origem questionável, levou alguns especialistas a questionar a sinceridade da OpenAI em suas acusações de violação de propriedade intelectual.
“A destilação viola a maioria dos termos de serviço, mas é irônico – ou até hipócrita – que as grandes empresas de tecnologia estejam denunciando isso. Treinar o ChatGPT com conteúdo da Forbes ou do New York Times também violou seus termos de serviço”, disse Lutz Finger, professor visitante sênior da Universidade Cornell e ex-funcionário de empresas de tecnologia como Google e LinkedIn, em um comunicado por e-mail. “O conhecimento é livre e difícil de proteger.”
A DeepSeek tem seus próprios modelos destilados que utilizam outros modelos de código aberto, como o Llama, da Meta Platforms, e o Qwen, do Alibaba Group Holding. O Alibaba é proprietário do South China Morning Post.
No entanto, a OpenAI alega que a DeepSeek usou o acesso à API dos modelos GPT de código fechado para destilá-los de forma não autorizada. A DeepSeek não admitiu o uso de destilação no treinamento de seus principais modelos, V3 e R1.
Com informações de South China Morning Post*