GPT-4.5 passa no Teste de Turing e engana humanos em 73% das vezes

Pesquisadores da UC San Diego demonstraram que sistemas de IA agora podem passar consistentemente no Teste de Turing, um marco na pesquisa sobre inteligência artificial. Nos experimentos, o GPT-4.5 da OpenAI foi confundido com um humano em quase três quartos das interações.
Os detalhes:
- O Teste de Turing, criado em 1950, avalia se uma máquina pode convencer humanos de que é uma pessoa real apenas por meio de conversas em texto.
- O estudo usou um formato de comparação direta, onde juízes conversavam simultaneamente com um humano e uma IA por cinco minutos.
- As avaliações focaram mais em conversa casual e emoções do que em conhecimento técnico, com 60% das interações girando em torno de atividades do dia a dia e experiências pessoais.
- Quando programado para assumir uma personalidade específica, o GPT-4.5 enganou os juízes 73% das vezes — superando até pessoas reais no teste.
- O modelo LLaMa-3.1-405B da Meta também passou, mas com uma taxa de sucesso de 56%, enquanto modelos base como GPT-4o ficaram próximos de 20%.
Por que isso importa?
O Teste de Turing sempre foi um grande desafio para a IA, mas os avanços recentes mudaram completamente as regras do jogo. Com modelos cada vez mais sofisticados em texto, áudio, imagem e vídeo, diferenciar humanos de máquinas está se tornando um problema real. O que antes parecia ficção científica agora é um desafio prático para a sociedade. 🚀