Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

21 meneos

795 clics

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

A continuación, una lista de algunas de las preguntas típicas con que se puede probar en plan rápido cualquier nueva versión de un LLM y hacerla fallar miserablemente, cuestionando si realmente ha mejorado, es tan potente como dicen o qué narices pasa en esas «cajas negras». Ojo que hasta ChatGPT-5 parece estar fallando en alguna de ellas, por infantiles que parezcan, concretamente en la comparación numérica y en la «prueba blueberry», aunque depende de quién te lo cuente, porque a mi me ha funcionado.

17 4 0 K 33

27 comentarios

17 4 0 K 33

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

61 alternativas europeas a Google, X, Gmail, Chrome, Maps, DropBox, Google Drive, WhatsApp y otros servicios populares

Dos bytes, un autor y 33 años: la historia completa del Virus Málaga

Lo que supone el cambio al Vehículo Eléctrico | Francisco Valverde

Todas las empresas tech están metiendo IA en todos sus productos. El problema es que nadie los quiere

LG da marcha atrás con Microsoft Copilot AI en sus TV con webOS

más votadas

LG da marcha atrás con Microsoft Copilot AI en sus TV con webOS

Todas las empresas tech están metiendo IA en todos sus productos. El problema es que nadie los quiere

Dos bytes, un autor y 33 años: la historia completa del Virus Málaga

Revolución en las baterías: el sodio destrona al litio con cargas ultrarrápidas y resistencia al calor

Lo que supone el cambio al Vehículo Eléctrico | Francisco Valverde

suscripciones por RSS

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales