85 meneos
1877 clics
BullshitBench: modelos de IA que responden preguntas sin sentido [ENG]
Esta comparación entre diferentes agentes de inteligencia artificial mide si los modelos detectan premisas incumplidas, señalan directamente las tonterías y evitan continuar con confianza con suposiciones inválidas.
|
Click para ver los comentarios