A OpenAI vai começar a lançar, durante esta semana, para os subscritores Plus e Teams de algumas regiões do globo, a funcionalidade de Voz Avançada (Advanced Voice), que permite ter conversas mais naturais, por voz, com o chatbot, e cinco novas vozes de IA. Os subscritores irão começar a receber a atualização a partir da próxima semana e serão avisados na aplicação quando a funcionalidade for ativada.

Enterprise e Edu terão acesso a partir da próxima semana. A Voz Avançada está a ser lançada para os utilizadores Plus e Team na aplicação ChatGPT ao longo da semana.

Apesar de a OpenAI referir que a novidade estará disponível para todos os subscritores, o modo Advanced Voice não será ainda disponibilizado na União Europeia, no Reino Unido, na Suíça, Islândia, Noruega e Liechtenstein.

Alegadamente a não disponibilização da solução União Europeia, no Reino Unido, na Suíça, Islândia, Noruega e Liechtenstein está relacionada com a Lei da IA. “De acordo com uma leitura rigorosa da Lei da IA, a voz avançada ChatGPT é ilegal nos locais de trabalho e nas escolas da UE, porque o sistema pode reconhecer as emoções de um utilizador. Isso é proibido pela Lei da IA”, diz a OpenAI na rede social X.

O Modo de Voz Avançado (Advanced Voice) não é apenas um “ChatGPT com texto-para-áudio”, utiliza sim uma tecnologia subjacente ao GPT-4o para analisar o tom e a velocidade da voz para captar pistas não verbais, como linguagem corporal, respondendo depois com emoção na sua própria voz. É, na prática, uma nova funcionalidade do modelo GPT-4o que permite aos utilizadores manterem conversas em tempo real, semelhantes às que teriam com outros humanos com o chatbot de IA sem a necessidade de uma janela de texto ou de áudio. Alguns subscritores Plus já tinham esta funcionalidade desde julho, em modo beta, depois da apresentação da mesma no “Spring Update” da OpenAI. Agora, nos próximos dias, muitos subscritores terão a possibilidade de experimentar a funcionalidade.

Advanced Voice Chat GPT4o
Advanced Voice Chat GPT4o créditos: OpenAI

A empresa também revelou cinco novas vozes para o chatbot (Arbor, Maple, Sol, Spruce e Vale), que pode ouvir aqui. As vozes estarão disponíveis nos modos Standard e Advanced Voice, juntando-se às quatro vozes (Breeze, Juniper, Cove e Ember) que o ChatGPT já oferece. A OpenAI também referiu que, “embora o vídeo e a partilha de ecrã não sejam atualmente suportados no Advanced Voice, essas capacidades serão implementadas numa data posterior”.

Além disso, a OpenAI está a incorporar novas ferramentas para conceder à Voz Avançada capacidades mais alinhadas com o resto da experiência do chatbot baseado em texto: memória e instruções personalizadas.

Aquando do lançamento da versão beta, o Advanced Voice só fazia referência a informações do chat que estava a decorrer. Agora, com a função de memória, a IA será capaz de recordar detalhes de conversas anteriores, reduzindo a necessidade de os utilizadores se repetirem. Da mesma forma, as instruções personalizadas foram concebidas para definir regras básicas que o modelo deve seguir ao gerar as suas respostas. Por exemplo, pode ditar que quaisquer respostas baseadas em codificação sejam apresentadas em Python.

A Voz Avançada só está disponível quando se utiliza a aplicação ChatGPT em iPhones e dispositivos Android, e apenas nas versões 1.2024.261 e posteriores da aplicação.

A indisponibilidade da funcionalidade na Europa, está já a ser alvo de memes na Internet, com os utilizadores visivelmente incomodados com a ausência da nova funcionalidade no Velho Continente, a demonstrar a sua insatisfação nas redes sociais.

Meme Advanced Voice Chat GPT4o
Meme Advanced Voice Chat GPT4o

O ChatGPT junta-se agora a outras alternativas de conversas por voz com os utilizadores. Há menos de duas semanas a Google lançou a versão mais avançada do modelo de Inteligência Artificial, que permite conversar por voz e que vai passar a ser gratuita. Para já só estará disponível para utilizadores Android e em inglês.