Actualidad y sociedad
10 meneos
248 clics
IA: tras los LLM, ¿son los TRM la futura revolución de la IA?

IA: tras los LLM, ¿son los TRM la futura revolución de la IA?

La IA entró en nuestras vidas con los LLM como ChatGPT. Pero estos modelos están mostrando hoy sus límites: la nueva frontera sustituye el lenguaje por el razonamiento. En un artículo científico cuya publicación hizo explotar la capitalización de Samsung en más de 60.000 millones de dólares, Alexia Jolicoeur-Martineau propone otro futuro para la IA: los «TRM».

| etiquetas: ia , trm , llm , modelos , cambios
Tiny Recursive Models (TRM)
Modelos Recursivos Pequeños

De nada



Pd
No, yo tampoco se lo que son
#2 Más bien TRileros Master para aumentar la burbuja... :troll:
#3 si los modelos son capaces de correr en local como MobileLLM-R1 poca burbuja hinchan. No sé si esos entran en esta definición.
#8 puedes probar el de #4, no se cuan distinto es respecto al de Samsung, obviando que es más específico para matemáticas y programación.
#2 LLM (chatgpt) es un modelo generalista que, ademas, genera la repuesta pòr partes (tokens). Si la una parte/token esta mal (1+1=3) el resto de la respuesta esta mal. los TRM son modelos especialidados que primero "razona" e "itera" y valida una unica respuesta (no la suma de los tokens) para asegurar que la respuesta que se es correcta. Al ser mas pequeño y especializado es mas facil de entrenar,
O al menos eso entendi del articulo.
Esto es como la arquitectura JEPA, MAMBA y tantas otras que han querido matar a los LLM desde que aparecieron. La realidad es que si tienen algo que puede realmente superar los LLM se demotrará en experimentos reales que demuestren un salto cualitativo a nivel de desempeño, todo lo demás son palabras bonitas, pero la ciencia no funciona de esa manera. Así fue como los LLM enviaron al ostracismo la RNN y las LTSM. Y no, los LLM no están estancados, por mucho que se lleve repitiendo esta frase desde que apareció chatGPT, la realidad la desmiente mes a mes.
Me ha parecido super interesante. A ver si prospera este camino.

Como ella dice, podría combinarse con LLMs y delegar en TRM específicos para cada tarea en cuestión.

Me imagino que los mercados de los chips atacarán ferozmente esta idea, ya que parece requerir menos recursos que la estrategia del LLM.
Está semana he enterado de la existencia de vLLM. Al principio pensaba que eran Visual LLM pero resulta que son LLM virtuales. Esto va tan rápido que no da tiempo a asimilar nada
TRM treasury risk management o tax and revenue management

menéame