Tecnología, Internet y juegos
13 meneos
227 clics
¿Cómo puede la IA identificar a un gato? Guía ilustrada [ENG]

¿Cómo puede la IA identificar a un gato? Guía ilustrada [ENG]  

Mira la foto de un gato y lo reconocerás al instante. Pero intenta programar un ordenador para que reconozca fotos de gatos y te darás cuenta de que no es nada sencillo. La detección de gatos es un ejemplo de lo que los investigadores llaman una tarea de clasificación. Dado un objeto —en este caso, una imagen—, el objetivo es asignarlo a la categoría correcta. Hay mucho que los investigadores aún desconocen sobre el funcionamiento interno de las redes neuronales. Pero no son completamente inescrutables. ¿Por dónde empezar?

| etiquetas: ia , ai , inteligencia , artificial , gato , clasificador , neurona , red
Echándole un vistazo rápido, como introducción muy básica está bastante, bastante bien. Luego la cosa se puede complicar tremendamente, pero eso, está bastante bien.
#8, cuando un futbolista golpea el balón para hacer una vaselina, está haciendo una aproximación de cálculo de tiro parabólico en su cabeza de acuerdo a las leyes y constantes de la física aunque no lo parezca. Cuando clasificamos gatos en imagenes, hacemos algo parecido.

Puede que la forma de operar sea distinta a la de una máquina, pero la lógica subyacente sobre la que se sustentan es la misma, una aproximación biológica a problemas fundamentalmente matemáticos.
#6, un ser humano también necesita haber visto antes unos cuantos perros para identificar los patrones que los caracterizan, y aunque te suene contra-intuitivo también se basa en estadística, nada de alma, inspiración divina o algo intangible.

Hay muchos papers de clasificación de imágenes basándose en una aproximación zero-shotz, es decir, solo necesitan haber visto un objeto una sola vez para identificarlo y estos modelos cada vez tienen mejor desempeño.…   » ver todo el comentario
#7 aunque te suene contra-intuitivo también se basa en estadística, nada de alma, inspiración divina o algo intangible

Un humano no hace nada de estadística. Observa las características del gato y las asocia al concepto de gato.
Una IA no sabe identificar nada. Lo que hace es comparar con fotos. En su entrenamiento hay miles de fotos de gatos debidamente etiquetadas como gato. Las han etiquetado personas baratas. Si le enseñas la foto de un gato, la IA busca alguna foto que se parezca a la enseñada, lo que quiere decir que el gato debe estar en la misma posición.
#2 that’s not because a clever programmer discovered a way to isolate the essence of “catness.”

A un humano le enseñas un gato y dice: "Ahhh, un gato es esto" y ya está. Ya puede identificar a cualquier gato. Esto es porque ha adquirido el concepto de gato.

Un LLM no puede hacer nada parecido, no adquiere conceptos, de ahí que necesite miles y miles de fotos para poder decir que algo es un gato.

Una de las consecuencias de no usar conceptos es la imposibilidad de razonar.
#2 #3 Usad la cabeza anda.
Si a un humano que nunca ha visto un felino le enseñas un siamés y luego un gato persa, un egipcio y una pantera ¿cual de todos te dirá que es un gato y cual no?.
Así que un humano no "razona". Ve muchas imágenes de gatos y planteras y aprende a diferencirlos.
Además está lo que dice #4. Saca un "patrón medio" de todos los gatos que ha visto (ese patrón no será una imagen sino una especie de algoritmo) y si al pasar la imagen del supuesto gato por el algoritmo da un valor de coincidencia algo pues te dice que es un gato y si el valor es bajo pues te dice que no.
#10 Si a un humano que nunca ha visto un felino le enseñas un siamés y luego un gato persa, un egipcio y una pantera ¿cual de todos te dirá que es un gato y cual no?.

Si no ha visto nunca un gato, no lo podrá saber.

Saca un "patrón medio" de todos los gatos que ha visto

No. Por favor. No hableis de lo que no sabeis. Un LLM no hace nada de eso. La única media que saca es entre varias fotos muy parecidas. Eso es lo que le permite aproximar las fotos de su entrenamiento…   » ver todo el comentario
#10 ese patrón no será una imagen sino una especie de algoritmo

Las redes neuronales contienen ejemplos y ya está. Nada de algoritmos.

un humano no "razona". Ve muchas imágenes de gatos y planteras y aprende a diferencirlos.

Aprende a diferenciarlos en base a sus características. Hace falta haber visto un solo gato para eso. Para poder distinguirlo de una pantera, basta con haber visto una sola pantera. Esas características se asocian al concepto de gato y de pantera…   » ver todo el comentario
#2, no es así como funciona una red neuronal. No compara nada con nada etiquetado anteriormente.

Lo que ocurre es que hay un tipo de transformación matemática llamada convolución que depende de cómo esté configurada se excita más o menos en función de la forma o textura que se dibuja en la imagen (una convolución puede excitarse cuando hay un borde recto, otra cuando tiene forma curva, otra cuando tiene una textura tipo ropa, etc, etc). El resultado de la excitación que produce una convolución…   » ver todo el comentario
#4 Estás confundiendo el qué con el cómo. Muy bien la explicación de cómo lo hace, pero en definitiva lo que hace es comparar la imagen con las imágenes de su entrenamiento.
#4 aprende a conocer por si sóla qué características de la imagen son relevantes para determinar si hay un gato o no.

Una red neuronal no hace absolutamente nada de esto. Lo que hace es calcular valores medios. Pero no puede sacar valores medios de dos imágenes muy distintas, ya que eso no serviría para nada. De ahí que necesite miles de fotos de gatos vistos en todas las posiciones posibles.

ni se utilizan als imágenes de entrenamiento cuando llega una imagen sobre la que queremos hacer una predicción

Puers claro que se usan esas imágenes. No va a usar los resultados de la bonoloto. Es que hay cosas que da vergüenza tener que decirlas.
comentarios cerrados

menéame