GPT-4.5 passa no Teste de Turing e engana humanos em 73% das vezes

GPT-4.5 passa no Teste de Turing e engana humanos em 73% das vezes
Fonte: GPT-4o / Next Gen Dev

Pesquisadores da UC San Diego demonstraram que sistemas de IA agora podem passar consistentemente no Teste de Turing, um marco na pesquisa sobre inteligência artificial. Nos experimentos, o GPT-4.5 da OpenAI foi confundido com um humano em quase três quartos das interações.

Os detalhes:

  • O Teste de Turing, criado em 1950, avalia se uma máquina pode convencer humanos de que é uma pessoa real apenas por meio de conversas em texto.
  • O estudo usou um formato de comparação direta, onde juízes conversavam simultaneamente com um humano e uma IA por cinco minutos.
  • As avaliações focaram mais em conversa casual e emoções do que em conhecimento técnico, com 60% das interações girando em torno de atividades do dia a dia e experiências pessoais.
  • Quando programado para assumir uma personalidade específica, o GPT-4.5 enganou os juízes 73% das vezes — superando até pessoas reais no teste.
  • O modelo LLaMa-3.1-405B da Meta também passou, mas com uma taxa de sucesso de 56%, enquanto modelos base como GPT-4o ficaram próximos de 20%.

Por que isso importa?

O Teste de Turing sempre foi um grande desafio para a IA, mas os avanços recentes mudaram completamente as regras do jogo. Com modelos cada vez mais sofisticados em texto, áudio, imagem e vídeo, diferenciar humanos de máquinas está se tornando um problema real. O que antes parecia ficção científica agora é um desafio prático para a sociedade. 🚀

Read more