A DeepSeek revirou a indústria da inteligência artificial, levando gigantes tecnológicas a terem quebras acentuadas na bolsa, sobretudo a Nvidia. Mas desde os primeiros dias que o modelo de IA chinês está envolto em polémicas. Primeiro polo ciberataque que sofreu, levando os Estados Unidos a avaliar as questões de segurança nacional. Mas é a legitimidade do modelo que tem sido contestada pela OpenAI, criadora do ChatGPT.

Quando foi o DeepSeek foi apresentado, a OpenAI teceu elogios à tecnologia, mas a dona do ChatGPT terá descoberto, entretanto, que a sua tecnologia facilitou o desenvolvimento da tecnologia da concorrência, por meios não legais. E disse que tinha provas disso, afirmando que o DeepSeek era uma versão destilada do ChatGPT.

Existem agora novas evidências que o DeepSeek poderá ser mesmo uma “cópia” do ChatGPT, desta vez pela Originality.ai, que publicou um estudo onde utiliza a sua ferramenta para detetar se existe plágio no modelo. A ferramenta Originality.ai foi criada para garantir às publicações online se os textos publicados foram escritos por humanos ou gerados por inteligência artificial.

A empresa publicou no blogue um estudo de um teste realizado ao modelo DeepSeek para verificar se este era mesmo uma versão destilada do ChatGPT. O teste é realizado com todos os novos modelos de IA lançados, consistindo em usar 150 prompts de texto onde se inclui: 50 prompts reescritas, 50 prompts de texto reescritas por humanos e 50 prompts para escrever artigos do início.

A ferramenta detetou o texto da DeepSeek com uma precisão de 99,3%. Segundo os investigadores, esta elevada certeza da ferramenta Originality.ai em detetar o modelo de IA chinês na primeira tentativa não é normal. A empresa diz que sempre que um novo LLM é lançado, experimenta a ferramenta para verificar se esta é eficaz “e até hoje normalmente vemos uma quebra de precisão quando um novo modelo é lançado”.

Essa falta de precisão não está a ser observada com o DeepSeek e os dois modelos de IA utilizados pela Originality.ai (GPTZero e RapidAPI Trending Content Detection Tool) identificam com mais de 99% de certeza. “Dessa forma, baseado na nossa investigação, é possível que o DeepSeek possa ser uma versão destilada do ChatGPT”.

Apesar de não ser uma prova conclusiva, é mais uma indicação das acusações feitas à DeepSeek. Ou seja, no caso da DeepSeek ter aprendido com o ChatGPT (como a OpenAI diz ter provas) de como gerar as respostas às prompts, é possível que gere texto com o mesmo estilo. O nível de precisão com que o Originality.ai detetou o DeepSeek sugere também que a startup chinesa possa ter utilizado o ChatGPT para treinar os anteriores modelos, antes do R1, como salienta a BGR.