Qué es y como instalar y correr en local la IA LLM: qwen3.5

11 meneos

281 clics

Qué es y como instalar y correr en local la IA LLM: qwen3.5

Qué es y como instalar y correr en local la IA LLM: qwen3.5. Los nuevos modelos agenticos y multimodales de alibaba.

| etiquetas: qwen , ia , alibaba

9 2 0 K 166

11 comentarios

9 2 0 K 166

#1 Yorga77

Para los que tenemos equipos viejos o de baja potencia nunca vale ninguno de estos modelos.

0 19

#2 fingulod

Depende que entiendas por "baja potencia", hay versiones que si sirven... ahora, la calidad no es la misma, para que nos vamos a engañar.

En el artículo figuran.

0 7

#5 Loquevaleunpeine *

Depende de que necesites de una IA, cómo dice hay modelos que funcionan hasta en el móvil, también hay modelos muy pequeños especializados en tareas concretas, leer documentos, resúmenes, etc. Lo importante con los modelos pequeños es ser muy concretos el lo que le pides y darle mucho contexto, cómo si hablaras con un crio pequeño.

Tengo la misma gráfica, prueba Gemma 4 26b. Obtuve resultados bastante decentes incluso en programación. También tienes Supergemma 4 26b sin censura en… » ver todo el comentario

0 6

#6 fingulod

Yo tengo una AMD 9060 con 16 Gb... ¿qué modelo iría mejor? Gemma4 26 me daba miedo, pero si dices que va bien...

0 7

#7 Loquevaleunpeine

Me veo en la obligación de preguntar... Miedo de qué?? jejej

No la tengo ni la he probado, ojo, hablo por lo que he leído por ahí. Con 16 GB de VRAM yo probaría primero Gemma 4 26B cuantizado, no me iría de primeras al 31B porque ahí ya vas más justo.

Si tira bien, perfecto, si ves que se atraganta, baja contexto a 4K o 2K. La RAM te puede ayudar bastante descargando parte del modelo, pero la VRAM sigue mandando para que vaya fino.

Para trastear yo empezaría con LM Studio, Jan u Ollama, y probaría varios cuantizados hasta encontrar el punto entre velocidad y calidad. Al final depende del uso que quieras darle y si te importa mucho la velocidad de respuesta.

0 6

#8 fingulod

Pues tienes razón... tampoco pierdo nada por ir a mayores. Que el contexto se quede muy corto.

0 7

#9 Loquevaleunpeine

Claro, lo peor que puede pasar es que el modelo no cargue, de todos modos, por ejemplo LmStudio te avisa antes de descargar si tu hardware no lo soporte, otros simplemente fallan en la carga si te quedas sin memoria, acto seguido la memoria se descarga y aquí no ha pasado nada.

0 6

#10 fingulod

Ya, es qué cuantificación poner, y que no sea demasiado lento. Y sobre todo, que se quede sin contexto.

Estoy bajando supergemma4-26 IQ3_M a ver qué tal.

Vale, estoy bajando la multimodal... lo mismo no era necesario

0 7

#11 Loquevaleunpeine

Lo mismo no jeje Cómo digo, depende del uso que le quieras dar, las pruebas que he visto del multimodal la verdad es que son alucinantes, sobre todo con el tema del video tiene una segmentación bastante potente. Pruébala igualmente, a lo mejor te sorprende.

0 6

#3 founds

yo estoy jugando con openclaw qwen3.5 cuantizado y sin censura, en mi 3060 12G, con la 4b va pero es bastante tonta, el tema de las tools come más vram. Mi impresión es que sin una buena tarjeta, o el uso que le quieras dar al modelo, no vale la pena

0 6

#4 tommyx

Yo amplíe de RAM el portátil para luego ver qué sin una gpu te puedes morir

0 10

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

Super ZSNES: los creadores originales de ZSNES vuelven con un emulador de SNES acelerado por GPU

Dassault Aviation elige un sistema de propulsión español para su avión espacial de demostración VORTEX-D

WSL9x: subsistema de Windows para Linux ejecutándose en Windows 95/98 [ENG]

Nissan reduce las tierras raras utilizadas en el motor Leaf EV en un 90% (ING)

VIDEO | De contenedores a unikernels: más rápido, más seguro, más ligero

suscripciones por RSS

Qué es y como instalar y correr en local la IA LLM: qwen3.5