#39 es exactamente lo mismo, pero con otras palabras. Al final si tienes un sistema de revisión automática tienes que ponerle de una forma u otra los casos que aceptas y los casos que no aceptas, no sirve con solo poner los que aceptas, por lo tanto si o si en algún momento tendrás que poner frases en negativo. Lo único que queda es encontrar la forma de hacerlo que te de el mejor resultado.
Pero eso es solo un detalle que se puede solucionar, o como poco tratar de mejorar, con prueba y error. Realmente el principal problema es que cualquier LLM funciona muy bien con casos simples, pero funciona como el culo en cuanto le pones a trabajar en entornos reales, con datos que no han sido filtrados previamente para una prueba manual. Un ejemplo tonto;
En tu empresa hacen una prueba de concepto, y te piden que hagas una petición a un LLM para reconocer si hay un coche en la imagen, lo cual es extremadamente sencillo, además te dan 1000 imágenes seleccionadas y separadas para que puedas sacar una tabla de la verdad de forma sencilla, y tachán, funciona en el 99.9% de los casos, el 0.1% es despreciable y se puede ignorar porque se gana en eficiencia.
Te dan el ok y te dicen que vamos a ponerlo en producción, porque los jefes son así de simples y no son capaces de entender que una prueba simple no es extrapolable a todos los casos de uso, se lo explicas y les da igual. Luego en producción resulta que tienes que añadir 50 casos diferentes con 20 excepciones simples y otras condicionales, el resultado es que falla más que una escopeta de feria, porque es simplemente imposible hacerlo de una vez, lo cual te lleva a poner diferentes capas de actuación, ejemplo; primero mirar si hay un coche, después en otra capa si hay una furgoneta, después si hay un camión, después si es rojo, después si es azul, etc, etc. Y ya no es un 0.1% de probabilidad de fallar, es un 1% o 2% primero porque los datos no están previamente filtrados, y además es ese porcentaje por cada capa que… » ver todo el comentario
#25 Añado: si siguen el modelo de Australia o Francia, la responsabilidad recaería en las plataformas exclusivamente, por lo que son las empresas las que deben tomar medidas "razonables" para verificar la edad. Además, se excluirían plataformas de mensajería como WhatsApp, y otras orientadas a niños y/o estudiantes como YouTube Kids o Google Classroom.
#5 Aznar se dejo allí olvidada la maquina de hacer abdominales o el extendedor-alargador de pene, es que todo se pierde durante la celebración de las fiestas salvajes en la isla.
#6 Son 3'5 millones...
Me parece que son demasiados.
Sobre todo teniendo en cuenta que ya habían publicado una buena cantidad antes.
Por ahí lo dicen #1 y #2 (que escribimos al mismo tiempo), seguramente los archivos importantes no están o están censurados.
#44 está diciendo que regularizar 500k inmigrantes es más importante que la investigación espacial. Una medida con 0 impacto en la humanidad, en unos años nadie se acordará de esta medida de Sánchez, en cambio se se seguirá estudiando la carrera espacial y como conquistamos el espacio.
Por cierto de las investigaciones que se usaron para el proyecto Apollo ya han salvado la vida a más de 500k personas, el procesado de imágenes de un tac salió del programa Apollo
#12 se lo he leído ha A. Maestre hace un rato:
"El gobierno ha puesto el paro por debajo del 10% por primera vez en 18 años para desviar la atención sobre algo."
#33 En la propia noticia ponen las fotos de las que no se deben comprar (aunque supongo que no estarán todas). Luego, también hay un enlace a otro artículo con un recopilatorio de homologadas.
#30 Lo del cacao, el de verdad, ha sido brutal. El cacao puro desgrasado de Mercadona costaba entre 2,50€ y 2,75€ en 2021 y ahora lo he visto a 4,95€. Carrefour hasta retiró su cacao puro de marca blanca porque a ese precio no lo venderían.
Los Cola Cao y Nesquik llevan muy poco cacao pero aprovechando la subida del mismo le pegan un buen sablazo a sus clientes.
"19:18
Antonio Tejero, golpista del 23-F, en estado crítico
La familia de Antonio Tejero, el hombre que protagonizó el intento de golpe de Estado el 23 de febrero de 1981, ha aclarado este jueves que el exteniente coronel se encuentra en estado crítico. Horas antes se había informado de su muerte."
#98 Habrá que rezar para que sufra como les gusta al beaterío santotereso para ganarse el cielo.
No quiero ni pensar el sufrimiento que hubiera provocado si se hubiera salido con la suya...
#2 Si crees que esto es un win, te equivocas. Esto es un movimiento para que el juicio acabe en un tribunal superior por ser Mazón aforado, y el mismo motivo por el que la jueza no quería involucrar a Mazón.
#72 Bueno, espero que sirviera para algo. Pero creo que esa forma de pensar indica que todos sabemos ya que el caso tiene que centrarse en Mazón ... Igual, si existiera la objetividad, el testimonio podría haber servido ,.... qué co-ones, es verdad, ya me callo.
Pero eso es solo un detalle que se puede solucionar, o como poco tratar de mejorar, con prueba y error. Realmente el principal problema es que cualquier LLM funciona muy bien con casos simples, pero funciona como el culo en cuanto le pones a trabajar en entornos reales, con datos que no han sido filtrados previamente para una prueba manual. Un ejemplo tonto;
En tu empresa hacen una prueba de concepto, y te piden que hagas una petición a un LLM para reconocer si hay un coche en la imagen, lo cual es extremadamente sencillo, además te dan 1000 imágenes seleccionadas y separadas para que puedas sacar una tabla de la verdad de forma sencilla, y tachán, funciona en el 99.9% de los casos, el 0.1% es despreciable y se puede ignorar porque se gana en eficiencia.
Te dan el ok y te dicen que vamos a ponerlo en producción, porque los jefes son así de simples y no son capaces de entender que una prueba simple no es extrapolable a todos los casos de uso, se lo explicas y les da igual. Luego en producción resulta que tienes que añadir 50 casos diferentes con 20 excepciones simples y otras condicionales, el resultado es que falla más que una escopeta de feria, porque es simplemente imposible hacerlo de una vez, lo cual te lleva a poner diferentes capas de actuación, ejemplo; primero mirar si hay un coche, después en otra capa si hay una furgoneta, después si hay un camión, después si es rojo, después si es azul, etc, etc. Y ya no es un 0.1% de probabilidad de fallar, es un 1% o 2% primero porque los datos no están previamente filtrados, y además es ese porcentaje por cada capa que… » ver todo el comentario