La comparación de LLMs tiene retos inusuales. Su principal objetivo es generar textos indistinguibles de la escritura humana. El METR (Model Evaluation & Threat Research) en Berkeley (California) publicó en marzo"Measuring AI Ability to Complete Long Tasks". Según una métrica ideada por el grupo, la capacidad de los principales sistemas de IA se duplica cada 7 meses. En 2030, los LLM más avanzados deberían ser capaces de completar con fiabilidad del 50% una tarea basada en SW que a llevaría a los humanos 1 mes con semanas laborales de 40 horas.
|
etiquetas: llm , ia , ai , inteligencia artificial , metr , crecimiento exponencial
El mismo envio ya dice que es bastante complicado hacer evaluaciones sobre lo que genera la IA, pues no es fácil evaluar la calidad de los textos generados como hasta que punto podrían pasar por humanos. No es como evaluar un SW que resuelve en X tiempo una ecuación.
Supongo que uno de los cuellos de botella pudiera ser el nivel de… » ver todo el comentario
- "LLM Benchmarking Shows Capabilities Doubling Every 7 Months. By 2030, LLMs may do a month’s work in just hours"
IEEE Spectrum es la revista editada y pubicada por la asociación mundial de ingenieros Institute of Electrical and Electronics Engineers (IEEE):
- spectrum.ieee.org/ --> en.wikipedia.org/wiki/IEEE_Spectrum
- www.ieee.org/ --> es.wikipedia.org/wiki/Institute_of_Electrical_and_Electronics_Engineer
Servirá para generar ppts? Porque con eso nos ahorraríamos una pasta en jefecillos y en consultores.
El consultor está para cuando la directiva ha tomado una decisión, pero necesitan justificar por qué la han tomado.
Pero si nadie sabe a qué se deben las alucinaciones.
O sea, a veces bien, a veces mal
¿Papers? ¿Necesitas el currículum para validar argumentos? Cuando entiendas que las ideas se sostienen por su solidez y no por el número de publicaciones, igual podremos hablar en serio.
De momento, sigue coleccionando excusas y lloros, que tu berrinche personal no sustituye la comprensión técnica.
Dicho esto, los LLM no han parado de mejorar en este objetivo porque es donde más dinero se está invirtiendo y donde las mentes más inteligentes de nuestra… » ver todo el comentario
Por cierto, en ningún momento he insinuado que a los… » ver todo el comentario