#54 ¿Me dices cuándo fue la última vez que EEUU bombardeó otro país y secuestró a su presidente sin que dicho país atacase previamente a EEUU? Porque yo me tengo que ir a hace 20 años con la invasión de Irak para encontrar algo parecido...
#187 Llamar “razonamiento” marketing y “bucle de retroalimentación” realidad no hace tu explicación más precisa, solo más pobre. Un bucle de retroalimentación describe desde un termostato hasta un regulador de voltaje. Es tan genérico que sirve para todo y, por tanto, no explica nada. Si tu objetivo es reducir un sistema complejo al término más amplio posible, claro que te sale simple. También irrelevante.
Decir que “es tan simplificación como decir razonamiento” no es un argumento, es una forma de evitar entrar en la diferencia entre describir un mecanismo y describir una capacidad. Un LLM no se limita a repetir estados internos, ajusta trayectorias, mantiene coherencia y descompone problemas. Eso no es marketing, es funcionalidad observable. Si quieres demostrar que es teatro, toca señalar qué parte del proceso es fingida y cuál no. Hasta ahora, nada.
Y lo de “mi mensaje es simple y claro” es cierto, pero por la razón equivocada. Es simple porque recorta todo lo que no encaja en tu marco, y es claro porque no intenta describir el sistema, solo reafirmar tu reducción. La simplicidad no es una virtud cuando se obtiene a costa de borrar justo lo que define el comportamiento del modelo.
Si quieres hablar de cómo funcionan estos sistemas, perfecto. Pero si la discusión se limita a sustituir complejidad por la palabra más genérica disponible, no estamos analizando nada. Estamos empobreciendo la explicación para que encaje en tu molde.
#7 Es que es una "no noticia". Hay diversas maneras de trabajar desde España ... la más clara es hacerse autónomo, pero es solo una de varias posibilidades. No sé qué pretende este artículo.
#159 Decir que el modo razonamiento es solo un bucle de retroalimentación es una simplificación tan extrema que deja de describir el sistema para describir tu marco mental. Todos los sistemas inteligentes desde los años 50 funcionan con retroalimentación. Es un rasgo estructural, no una explicación.
El chain of thought no es un truco de marketing. Es una técnica para mejorar la calidad de la inferencia descomponiendo problemas en pasos intermedios. Que puedas ver esos pasos no lo convierte en un teatrillo, igual que ver los estados internos de un solver no convierte su proceso en un truco barato.
Y reducir un LLM a un perceptrón repetido muchas veces es como reducir un kernel a ifs y whiles. Técnicamente cierto en el nivel más trivial, completamente inútil para entender la capacidad emergente del sistema. La escala, la arquitectura y la dinámica interna importan. Ignorarlas no hace tu explicación más precisa, solo más incompleta.
Si tu argumento depende de rebajar el sistema al nivel más simple posible, entonces no estás describiendo cómo funciona. Estás describiendo lo poco que quieres ver de él. Y desde ahí no hay debate técnico posible.
#48 Decir que una IA es solo un "bucle de retroalimentación" es como decir que un motor de búsqueda es "un if gigante".
Técnicamente no es falso, pero revela más sobre el nivel de abstracción del que lo dice que sobre la tecnología.
#48 estoy de acuerdo en que no razonan como un ser humano.
Pero si voy a la definición de razonar, sinceramente me quedan dudas que lo que hacen los LLM grandes no pueda ser considerado algun tipo de razonamiento
#46, llevo por aquí ańos discutiendo con cuñaos que no paran de decir que los LLM se limitan a regurgitar palabras sin sentido.
Mira, para ser sincero, no se ni quien eres, así que no puedo, saber siquiera qué he discutido contigo y qué defendías tú en particular. De lo que sí estoy seguro es de que siempre he dicho lo mismo y la forma en que la IA se está desplegando es exactamente la forma en que pensé que lo haría y los que decían que esto era hype infundado son los que deberían meterse debajo de las piedras.
#44, y qué demuestras con esto? Que dije en cuestión de meses y han pasado dos meses.
En todo caso si crees que el ritmo de despliegue e implantación de la IA desde que apareció chatGPT es un fracaso, no vale la pena que sigamos discutiendo porque no nos vamos a poner deacuerdo ni en la hora que es.
Lo que está pasando es lo que dije que pasaría, no sería ninguna moda, no desaparecería, se convertiría en una herramienta imprescindible para la mayoría de la gente y no pararía de mejorar. Todo se está cumpliendo y los que decían que los LLM no iban a dar más de sí a la semana de aparecer chatGPT son los que han hecho verdaderamente el ridículo.
#42, ponme un comentario donde diga que la AGI va a llegar en dos meses. A mi es que la verdad me aburre hablar de AGI porque cada uno le da el significado que le sale de los cojones. A mi me interesa qué pueden hacer los modelos de IA y qué no. Y lo que afirmo y he afirmado siempre es que la mejora va a ser constante y sostenida, la IA no se va a estancar y cada vez será mejor, predicción que se ha cumplido, los LLM daban más de sí cuando hace tres años decíais que no lo harían y seguirán dando más de sí. Los que os pensais que el futuro pasa por algo que no sea IA por un tubo sois los que haceis el ridículo.
#39, te lo he explicado en #35, los fundamentos matemáticos se los LLM son deterministas, no es algo discutible, lo que comentas es un problema que tiene cualquier software que corra en cualquier GPU de forma paralela. Si ejecutas un LLM en una CPU, algo técnicamente posible aunque tome mucho tiempo, su comportamiento es determinista.
Esto no afecta a los límites, capacidades y potencial que tengan los LLM modernos y cualquier arquitectura que derive se ellos. Eventualemente un modelo determinsta puede dar respuestas que son una castaña y uno estocástico puede dar respuestas en las que confiar la inmensa mayoría de veces. Son cosas independientes.
Respecto a mis predicciones, los que se deberían meter debajo de una cueva son los que hace 3 años decían que los LLM no podían dar más de sí, que no tenían margen de mejora y que no iban a pasar de una moda pasajera.
Mis predicciones se han cumplido al pie de la letra y más que se van a cumplir, los LLM y otras arquitecturas basadas en redes neuronales van a impregnarlo todo de ahora en adelante. El desarrollo de la humanidad de ahora en adelante estará íntimamente ligado al desarrollo de este tipo de modelos, desde trabajos simplones como el se un programador o cualquier otro oficinista, hasta trabajos más elevados como el de investigador, matemático o cualquiera que trabaje empujando las fronteras del conocimiento, incluso trabajos artísticos o creativos. Todos los trabajos cognitivos van a estar acompañados y dirigidos por IAs y quien siga diciendo que esto es una moda y que algún día volveremos a trabajar como lo hacíamos en 2019, sí que está haciendo el ridículo.
#38 toma, aquí tienes un croquis donde Rick & Morty te explican porque los LLMs no son deterministas. básicamente lo mismo que he puesto en #39, hecho con IA generativa:
#34, los fundamentos matemáticos de los LLM son deterministas, esto no es discutible, no es opinable, no tiene sentido debatir sobre ello porque es una verdad fundamental, el autor mezcla conceptos relacionados con la computación paralela y la presición del hardware que afectan a cualquier tipo de software de un determinado grado de complejidad y no solo a los LLM.
#36 Eso lo hace mi lavadora Balay de hace... 25 años, según el peso dura más o menos el programa de lavado. Lo único que no tiene es el display que pone el tiempo restante.
Una cosa fue cambiar de movil, en mi caso un Nokia por un Samsung. Cambiar un dispositivo electronico de una marca europea por una asiatica es algo que no me cuesta. Tenemos tanta o mas confianza en marcas de electrodomesticos "chinos" (sony, nintendo, LG). Lo normal es que todo lo electronico sea "made in China". Y si tu nuevo telefono chino te sale mal, pues en fin, mala suerte, si, pero es asumible que se te rompa un movil de digamos 150euros.
Cambiar de coche europeo por uno de una marca china desconocida no tiene nada que ver. Si hago un gasto de 10, 15 o 20.000 euros en un coche de una marca que no conozco, o que no tiene experiencia en coches, pues ni tiene mi confianza, ni me puedo permitir que me salga mal y comprarme otro si fuera necesario.
Por ahora, si tuviera que elegir entre un coche termico caro y europeo, y uno a mitad de precio chino, pues no esta claro cual elegiria. Probablemente el europeo.
#16 “ que a todas luces era la tecnología que iba a dominar en pocos años”
Cuando salió el iPhone hubo una corriente importante que decía que para negocios no iba a sustituir a BlackBerry por el teclado físico. Eso de que a todas luces… a toro pasado desde luego