Como pensa o Claude da Anthropic? Investigadores desvendam o que se passa na “mente” do modelo

Francisca Andrade

1 abr 2025 14:12

O que se passa na “mente” de um modelo de IA? Os investigadores da Anthropic decidiram averiguar e, através de dois novos estudos, mostram como o Claude, o modelo de linguagem de grande escala (LLM, na sigla em inglês) desenvolvido pela empresa, raciocina.

Os investigadores explicam que modelos de linguagem como o Claude não são programados diretamente por humanos, mas sim treinados com recurso a vastos conjuntos de dados. Durante este processo, os modelos aprendem por si próprios a desenvolver estratégias para resolver problemas.

No entanto, estas estratégias são incompreensíveis para os programadores dos modelos. Inspirados pelo campo da neurociência, os investigadores desenvolveram uma espécie de “microscópio de IA” que permite identificar padrões de atividade e fluxos de informação.

“Saber como modelos à semelhança do Claude pensam permitirá ter um melhor entendimento das suas capacidades, assim como ajudar-nos a assegurar que funcionam como pretendido”, realçam.

Veja o vídeo

Ao usarem o “microscópio de IA”, os investigadores descobriram que o Claude é capaz de planear rimas de antemão ao escrever poesia. Por exemplo, quando lhe é pedido para criar duas frases que rimem, ainda antes de começar a segunda, o modelo já está a pensar em possíveis palavras que “encaixem”.

O Claude é capaz de falar várias línguas, no entanto, o modelo não tem seções separadas na sua “mente” para cada um dos idiomas. A equipa descobriu que o modelo usa uma “linguagem de pensamento” comum entre as línguas que sabe falar, o que sugere que é capaz de aprender algo num determinado idioma e de aplicar esse conhecimento quando está a falar outra língua.

Embora não tenha sido treinado para funcionar como uma calculadora, o modelo consegue fazer algumas contas de cabeça, em particular as que envolvem a soma de diferentes números. Para chegar ao resultado, os dois lados do “cérebro” do Claude trabalham em conjunto. Um lado apresenta uma estimativa e o outro tenta determinar o último dígito da soma com maior precisão, explicam os investigadores.

Além disso, quando lhe é pedido para realizar uma tarefa que envolve um raciocínio com múltiplos passos, o Claude realiza uma série de passos conceptuais intermédios. “O modelo está a combinar factos independentes para chegar a uma resposta em vez de regurgitar uma resposta memorizada”, indica a equipa.

Por outro lado, os investigadores descobriram um lado mais “sombrio”, com o Claude a tentar enganar os utilizadores quando há um conflito entre diferentes instruções ou objetivos.

As versões mais recentes do Claude são capazes de raciocinar durante algum tempo antes de apresentarem uma resposta final. No entanto, os resultados nem sempre são os esperados, uma vez que o modelo também é capaz de inventar explicações que parecem plausíveis e convincentes, mas que, na verdade, estão erradas.

Os investigadores indicam que modelos como Claude contam com um mecanismo concebido para evitar “alucinações”, ou seja, quando não sabem a resposta a uma determinada pergunta, optam simplesmente por não responder. Porém, o mecanismo não é perfeito e, ao manipulá-lo, é possível fazer com que o modelo “alucine” e invente informação acerca de tópicos que desconhece.

A equipa notou também que o Claude não é totalmente imune a táticas de “jailbreaking”, isto é, a técnicas concebidas para contornar os seus mecanismos de segurança. Em certos casos, o modelo reconhece que está perante um pedido potencialmente prejudicial, mas só se apercebe disso “a meio” da resposta.

Pergunta do Dia

Em destaque

Últimas

Casa dos Bits · Apps · 4 out 2025 18:29

Farto de fotografias desalinhadas? Griddr. ajuda a encontrar o enquadramento ideal
Casa dos Bits · Ciência · 4 out 2025 16:18

Lua de Sangue, cometas e fotos captadas por portugueses entre as melhores paisagens espaciais de setembro
Casa dos Bits · Multimédia · 4 out 2025 14:45

Como seria o clássico de Agatha Christie “Death on the Nile” se tivesse lugar nos anos 1970?

por Rui Parreira
Casa dos Bits · Equipamentos · 4 out 2025 12:05

SPC Zeus 2 é um smartphone para séniores mais compacto e simples de utilizar

por Rui Parreira
Casa dos Bits · Site do dia · 4 out 2025 10:55

Consegue adivinhar um filme a partir de uma imagem? Teste os seus conhecimentos em FrameGuess
Casa dos Bits · Apps · 3 out 2025 22:05

Fire Emblem Shadows é uma nova aventura de estratégia da Nintendo para smartphones

por Rui Parreira

Comentários

Entre com a sua conta do Facebook ou registe-se para ver e comentar

Relacionados Playlist

Autoplay

Notificações web	Coisa
Alertas SMS	Gerir

Como pensa o Claude da Anthropic? Investigadores desvendam o que se passa na “mente” do modelo

Veja o vídeo

Pergunta do Dia

Em destaque

Multimédia

App do dia

Site do dia

How to TEK

Últimas

Comentários

Relacionados Playlist

Como pensa o Claude da Anthropic? Investigadores desvendam o que se passa na “mente” do modelo

Veja o vídeo

Nova versão do modelo de IA Claude da Anthropic programa e é mais rápido a pensar e a responder

Pergunta do Dia

Veja também

Em destaque

Multimédia

App do dia

Site do dia

How to TEK

Comentários

Veja também