As negociações já tinham sido reveladas, de forma não oficial, e o Reddit vem agora confirmar que chegou a acordo com a OpenAI para que os conteúdos daquela rede social possam ser usados pela dona do ChatGPT, no treino dos seus modelos de inteligência artificial.

Em comunicado, a OpenAI revelou que o acordo vai dar acesso a conteúdos em tempo real, como publicações e respostas dos utilizadores do serviço. Para a OpenAI abre-se o acesso a todo um universo de interações, que vão ajudar os modelos da empresa a compreender aquele tipo de conteúdo. Para o Reddit, a parceria vai dar acesso a “funcionalidades potenciadas por IA, tanto para os utilizadores como para os moderadores. Ainda não foi especificado que tipo de funcionalidades estão em causa, mas promete-se que a experiência de utilização da plataforma vai ser melhorada. Com o acordo, o Reddit ganha ainda um novo anunciante, a OpenAI.

Nos últimos meses, a OpenAI assinou vários acordos deste tipo para evitar processos judiciais, já que muitas empresas com conteúdos online começaram a questionar a legitimidade dos grandes modelos de linguagem para varrer a internet e absorver todo o tipo de conteúdo nos seus processos de treino.

A particularidade neste caso, está no facto do co-fundador e CEO da OpenAI, Sam Altman, ser também o terceiro maior acionista do Reddit, com 8,7% do capital. Já teve inclusive um lugar no conselho de administração da empresa, mas já não tem, e a OpenAI também garante que não foi ele a conduzir as negociações para o acordo.

Para o Reddit o licenciamento do acesso aos seus dados não é uma novidade, é aliás uma das grandes fontes de receita da empresa cotada, que mantém também acordos desse tipo com a Google, entre outras companhias. Em março, numa conferência com investidores, Steve Huffman, CEO, sublinhava o potencial de uma plataforma com duas décadas de conversas autênticas no seu histórico, num mundo cada vez mais marcado por conteúdos fabricados por máquinas. A empresa parece estar de facto a aproveitar bem esse potencial, já que no seu primeiro relatório aberto de resultados, depois de ir para a bolsa, reportou um aumento de 450% nas receitas não publicitárias. Pensa-se que a maior parte desse bolo vem de acordos deste tipo e o número foi anterior à parceria com a OpenAI.

O Reddit gere mais de 1000 milhões de publicações e 16 mil milhões de comentários. Resta saber se quem produz estes conteúdos diariamente, os utilizadores, vão manter-se confortáveis com a estratégia da empresa. Já começam a desenhar-se iniciativas para tentar apurar isso, à margem da companhia (com inquéritos, por exemplo).

Sony ameaça mais de 700 empresas

Ao mesmo tempo que o Reddit explora novas fontes de receita com a IA, a Sony Music faz o mesmo, mas com outra estratégia. A gigante do entretenimento enviou cartas a mais de 700 empresas de tecnologia e serviços de música em streaming a avisá-los de que não podem usar os seus conteúdos para treinar modelos de inteligência artificial, sem um consentimento expresso.

Na carta, a que o TechCrunch teve acesso, a Sony reconhece o potencial da IA, mas sublinha que a utilização não autorizada dos seus conteúdos para treinar, desenvolver e comercializar sistemas de IA priva a empresa e os seus artistas de uma “compensação adequada” e do controlo sobre um conteúdo que é seu. A carta também indica que a empresa tem razões para acreditar que, quem está a recebê-la, “pode já ter dado um uso não autorizado” aos seus conteúdos.

A Sony dá um prazo aos destinatários da carta para fornecerem um conjunto de informações sobre o uso abusivo dos seus conteúdos, como por exemplo, que indiquem que canções da editora já usaram em sistemas de IA, como lhe acederem, quantas cópias foram feitas ou quantas cópias permanecem. Garante que no fim do prazo, se não tiver recebido respostas, vai fazer valer os seus direitos de autor nas instâncias competentes na "máxima extensão permitida pela lei aplicável em todas as jurisdições".

Representante de artistas como Adele, Harry Styles ou Beyoncé, a Sony não detalhou os nomes dos destinatários da carta, mas sublinha que está a acautelar a sua propriedade industrial, legalmente protegida. Incluem-se neste leque registo áudio, vídeo, letras, metadados e tudo o que está à volta dos conteúdos criados com base no trabalho dos artistas que representa. Estes conteúdos estão a ser usados para treinar modelos, mas também para criar conteúdos novos, a partir dos originais.

“A evolução da tecnologia tem mudado com frequência o rumo da indústria criativa. A IA vai provavelmente dar continuidade a esta tendência de longa data. No entanto, esta inovação deve assegurar que os direitos dos artistas e dos autores, incluindo direitos de autor, são respeitados”, sublinha a Sony.