Evaluamos cuatro sistemas (ELIZA, GPT-4o, LLaMa-3.1-405B y GPT-4.5) en dos pruebas de Turing aleatorias, controladas y prerregistradas en poblaciones independientes. Los participantes mantuvieron conversaciones simultáneas de 5 minutos con otro participante humano y uno de estos sistemas antes de determinar qué interlocutor consideraban humano. Al solicitarles que adoptaran una personalidad similar a la humana, GPT-4.5 resultó ser el humano el 73 % de las veces: significativamente más a menudo que...
|
etiquetas: ia , tecnología , avance , turing , investigación