De hecho lo más interesante que tiene Deepseek no es el modelo en si (que ya es mucho decir), sino que han liberado la metodología que utilizaron para pasar de Deepseek V3 a Deepseek R1, hablando mal y pronto, sale más barato tomar las salidas de un modelo de razonamiento como R1 y usarlas para entrenar a un modelo como Ollama y Qwen por ejemplo y convertirlos en modelos razonadores, que tratar directamente de crear un modelo razonador a partir de los modelos ya existentes.
Está hablando ruso, así que no sé si lo que tú dices es cierto.