La comparación de LLMs tiene retos inusuales. Su principal objetivo es generar textos indistinguibles de la escritura humana. El METR (Model Evaluation & Threat Research) en Berkeley (California) publicó en marzo"Measuring AI Ability to Complete Long Tasks". Según una métrica ideada por el grupo, la capacidad de los principales sistemas de IA se duplica cada 7 meses. En 2030, los LLM más avanzados deberían ser capaces de completar con fiabilidad del 50% una tarea basada en SW que a llevaría a los humanos 1 mes con semanas laborales de 40 horas.
|
etiquetas: llm , ia , ai , inteligencia artificial , metr , crecimiento exponencial