Sabemos que en ocasiones, nuestros modelos basados en algoritmos de Machine Learning, fallan, no ofrecen los resultados esperados. ¿Cuál es el motivo? Motivos, puede haber muchos, pero vamos a centrarnos en los tres principales. Sobre dos de ellos ya hemos hablado en otras ocasiones en nuestro blog.
Por miles de motivos, desde que los datos no tengan capacidad de representación suficiente, hasta que haya un sesgo en ellos que sobreentrene el modelo en alguna dirección concreta.
#1 lo que nunca me convence es el tema de "depuración y normalización" de los datos, ya que muchas aplicas un cierto criterio que puede ser subjetivo.
ya he visto alguna charla sobre casos expuestos, y al final aplican un descarte de datos que muchas veces paso por "quitar lo que me parece feo", lo cual me parece un error.
Comentarios
Por miles de motivos, desde que los datos no tengan capacidad de representación suficiente, hasta que haya un sesgo en ellos que sobreentrene el modelo en alguna dirección concreta.
#1 lo que nunca me convence es el tema de "depuración y normalización" de los datos, ya que muchas aplicas un cierto criterio que puede ser subjetivo.
ya he visto alguna charla sobre casos expuestos, y al final aplican un descarte de datos que muchas veces paso por "quitar lo que me parece feo", lo cual me parece un error.