Hace 1 año | Por rojo_separatist... a xataka.com
Publicado hace 1 año por rojo_separatista a xataka.com

Midjourne V5. El nuevo motor cuenta según sus creadores con "mucha mayor calidad de imagen, salidas más diversas, rangos estilíticos más amplios, soporte para texturas, formatos de imagen más anchos, mejores prompts para imágenes, y rango dinámico más amplio", entre otras mejoras.

Comentarios

asfaltaplayas

#1 por lo general les quedan horribles.

snowdenknows

#1 #6 ya está casi arregladas

marraski

#26 sigue habiendo algo totalmente evidente en todas esas cosas (no se si llamarles fotos la verdad), y es la ausencia ABSOLUTA, de defectos.... incluso en fotos retocadas puedes apreciar algún cambio de tonalidad de la piel, algún lunar, alguna peca, algún pelo fuera de su sitio, si amplias lo suficiente, lo encuentras.... aqui nada.......... pero es que es lógico, no hay defectos por que no es real,
pieles absolutamente uniformes, posturas e iluminaciones perfectas, pelo como si fuera un solido....
de momento, han mejorado, pero siguen siendo demasiado "perfectas"

marraski

#40 pues sí, razon llevas... los cristales, las flores de la izquierda, la textura de la tela de la chaqueta, pero sobre todo el vello entre el labio superior y la mejilla, ese podría ser un detalle que me hiciese decantarme por una foto natural....
aun así.... la uniformidad en las separaciones en las arrugas, la casi total uniformidad del tono de la piel, la iluminación casi perfecta y la casi ausencia de textura en los límites de zonas sobre iluminadas siguen cantando un poco..... aun así está claro que han mejorado....

no se explicarlo... pero sigue habiendo cosas que son demasiado perfectas... los límites de los objetos, la ausencia de sombras en los lugares pequeños

D

#52 como si no se retocaran las fotos digitales constantemente, las únicas fotos no retocadas son las analógicas cuando se procesan tradicionalmente y las ves en papel de revelado

marraski

#73 que si, obviamente que no digo que no se haga en las fotos, "tradicionales" digo que en estas imágenes todo parece demasiado "perfecto" incluso para los estándares del retoque a nivel comercial

l

#85 es muy extraño todo, da una sensación rara...

snowdenknows

#52 #73 pero es que esta IA (midjhourney) está pensada para fotos artísticas, es así queriendo. Stable Diffusion por ejemplo es más mundana

D

#91 stable diffusion lo puedes descargar y entrenar , puedes descargarte extensiones y hacer lo que quieras

i

#73 la fotografía química también se puede retocar y manipular, como la famosa de Stalin.

Fernando_x

#35 métele en el prompt las imperfecciones que quieres que tengan, y hecho.

KernelPanic

#35 imagen generada con la V5.... Amplia, amplia

marraski

#62 que si, obviamente que son increíbles, pero, no se explicarlo, hay algo que los hace diferenciarse.... si me dices que eso es un dibujo hiper realista con lapices de colores o pintura, te diría que increible, pero sigue habiendo muchas cosas "demasiado perfectas..."
ojo, sin desmerecer un gramo el mérito de haber llegado a este punto

D

#62 Ya que no es un ser real, se puede decir melafo?

l

#62 sigue siendo rara, hay algo que no me cuadra.

l

#35 no son fotos.

eldet

#8 el truco es no dibujarlas, como en la miniatura lol

pedrobz

#8 Pues me impresionado, la de abajo a la derecha le ha quedado muy bien, muy pocos defectos, el más cantoso un dedo que es solo medio porque aparece difuminado, y una mancha justo arriba de ese dedo difuminado.

neiviMuubs

#1 en la propia noticia adjuntan un tweet que invita a la esperanza, en la linea del que adjunta #8 .



Se ven todavía a menudo fallos, en plan dedos torcidos y proporciones un tanto de valle inquietante, pero desde luego el avance pinta ya espectacular, ya no son el desastre que se estaba viendo con personas de aspecto increible pero veias sus manos y parecian un grupo de chistorras mutantes anidadas.

thorin

#1 Es lo que tiene Midjourney, que todavía están peleándose con las manos.
Cómo Stable Diffusion es de código libre hay modelos y herramientas que te permiten hacer manos gracias al trabajo de la comunidad: https://www.reddit.com/r/StableDiffusion/comments/112naoe/almost_perfect_hands_with_controlnet_depth_module/

#2 Tener que usar Discord para generar imágenes es estúpido por parte de la compañía.

D

#11 ¿Y lo que se ahorran en almacenamiento y en infrastructura?

D

#22 Sin duda, Escudo de Roble.

Fe de ello que tienen la webapp aquí: https://www.midjourney.com/app pero sólo para gestionar la cuenta y ver galerías.

En cualquier caso, a mi me parece que utilizar Discord es un acierto.

editado:
Añado que probablemente estén computando en Azure o otro proveedor cloud.

snowdenknows

#24 discord me parece un rollo, a veces no veo mi foto

D

#28 Ocurre en ocasiones. Si vas a la webapp y te logueas con tu cuenta de discord es posible que la encuentresen en tu galeria.

ReySombra

#28 Hay que ser usuario de pago para poder hacer mensajes directos al bot. Así solo salen tus fotos en el hilo.

S

#24 Un acierto por qué? A mi simplemente me parece una moda y una forma de no ponerlo a disposición de cualquiera, metiendote por una app propietaria.

thorin

#36 Además es eso. Al ser propietaria Discord puede fastidiar el negocio de Midjourney en cualquier momento.

l

#41 hay alguna IA de estas que sea gratuita?

D

#36 En mi caso personal porque es una manera conveniente de almacenar las imágenes por categoria (canales), de compartir las imágenes y de acceder al servicio.

D

#36 stable diffusion esta disponible para descargar e instalar en un ordenador con una buena tarjeta grafica , puedes instalarle extensiones y entrenarlo en lo que quieras , https://stable-diffusion-ui.github.io/

D

#22 Sí, con 1 000 000 000 de usuarios seguro que es una tontería en dinero la infraestructura que necesitas. Nadie habla de la GUI, si no de la infraestructura necesaria.

thorin

#50 ¿Donde digo que la GUI se monte en ninguna infraestructura?

D

#51 Es que la dificultad no es montar una GUI y ya, está en servirla a millones de personas, miles de forma concurrente.

Decir que montar una GUI es muy fácil, pues claro que lo es. Pero ese no es el problema.

thorin

#63 No sé cómo decirlo ya.

Con montar, me refiero también a la infraestructura.

Y la infraestructura de correr una GUI para un millón de personas es un chiste comparado con la infraestructura necesaria para que un millón de personas creen imágenes cuando les apetezca. Sobre todo porque la creación de imágenes está basada en GPUs dedicadas.

D

#64 Ahí es que estamos de acuerdo ... la infra para correr ese modelo de IA para atender a todas las peticiones de generado de imágenes me da vértigo. Quizá alguna queue y generarlas en asíncrono por multitud de instancias consumiendo la queue

thorin

#67 Si quieres ver cómo se puede hacer, Stable Horde es básicamente lo mismo que Midjourney y es de código abierto: https://stablehorde.net/

D

#71 Interesante, aunque para millones de usuarios toca construir capas adicionales. No puedes llamar al Rest API directamente ...

Yo lo imagino como una GUI conectada vía websockets contra un backend que forma parte de la GUI "cliente" ... Cuando recibe una petición ha de publicar a un broker de mensajes la petición junto con a quién hay que responder .... Al otro lado del broker de mensajes está quien va procesando las peticiones y va publicando de vuelta también a través del broker de mensajes las respuestas. El primer backend al que está conectado la GUI es el que va enviando las respuestas de vuelta a las GUIs cliente.

La GUI al final necesitaría de algún Apache o Nginx que sirviese alguna Single Page App sencilla y esta conectaría vía websockets contra el backend que iría recibiendo las peticiones.

Suena más sencillo lo que han hecho... a la escucha de Discord, publicar al broker qué hay que generar y a quién hay que responder... y las instancias que están generando imagenes, publicar hacia Discord las respuestas. Así toda la parafernalia de websockets, GUIs, escalados horizontales para atender a miles de usuarios te lo ahorras.

Tren_de_Lejanias

#11 Sí, o manos de varios dedos, o varias manos directamente. La cara al menos está mejorando bastante.

Honzo

#11 Te puedes bajar el proyecto y ejecutarlo en tu pc sin limite ni censura

Varlak

#11 Pero para ser justos a los humanos también es lo que más nos cuesta, las manos y las caras, no solo porque sean más difíciles de dibujar (que también) sino además porque tenemos una absurda proporción del cerebro dedicada a identificar manos y caras, así que cualquier mínimo defecto, cualquier proporción inusual es identificada al instante. Es absolutamente increíble que en pocos meses las imágenes hechas por IA hayan pasado a ser la maravilla que son ahora, no puedo ni imaginarme cómo será el mundo en unos años.

snowdenknows

#9 #20 lo volvemos a hablar em 2 meses en la version v6 #12

Narmer

#27 Encantado. Estoy convencido de que mejorará hasta el punto de hacerlo indistinguible. Imagina lo que se ahorrarán en actores en Hollywood.

Malaguita

#46 Espera, esa mierda genera videos? Es para un amigo.

D

#12 No sé si funciona ese sistema. He visto muchas fotos artificiales que estaban repletas de detalles en el fondo y no se pedían en el prompt.

maria1988

#9 Pues si fuera por eso, todas las fotos mías o de mi hermana te parecerían falsas; ambas tenemos un número anormal de incisivos. A mí lo que más me rechina es la textura de la piel, parecen fotos a las que les han pasado mil filtros, porque esa piel no se puede simular ni con maquillaje.

Narmer

#13 Por número anormal de incisivos supongo que te refieres a agenesia de incisivos laterales, que es una de las anomalías de número más frecuentes y con componente genético. También hay casos de un incisivo extra en la arcada inferior, pero son más raros y, como no se suelen ver, pasan más desapercibidos.

No, a lo que me refiero es a la relación de número y tamaño que se ve en la fotografía. He visto muchos miles de bocas a lo largo de mi carrera y te aseguro que la de esta foto salta mucho a la vista por lo “rara” que es.

maria1988

#23 Sí, a mí me falta el incisivo superior izquierdo, como a mi abuela paterna. Me resulta curioso que la mayoría de la gente no se dé cuenta si no se lo digo, porque es algo que se nota bastante, sobre todo porque la sonrisa no está "centrada". A mi hermana le falta un incisivo inferior, como a mi padre, pero es cierto que eso apenas se ve.

S

#31 A mi no me extraña tanto que no se note, al menso conscientemente no, simplemente porque te tienes que fijar. Es como la gente que lleva lunares en la cara, a menos que te fijes mucho, no te vas a dar cuenta si luego desaparece... o te puede pasar con tus propios lunares, si aparecen o desaparecen...

c

#31 yo me he decidido a ponerme una ortodoncia debido a un apiñamiento superior bastante marcado, que siempre me ha acomplejado, y cuando lo he hecho mis familiares no se lo explican porque dicen que tampoco es tanto. Es probable que yo no muestre mis dientes salvo lo imprescindible, y por ello la gente apenas lo note. Pero es curiosa la diferencia entre lo que percibimos de nosotros mismos y cómo nos ven los demás.

maria1988

#55 Totalmente cierto. Yo sonrío muy a menudo y sin embargo ninguno de mis amigos se dio cuenta hasta que no se lo dije. Y hablamos de defectos visibles en la cara; si ya nos vamos a otras partes del cuerpo es aún más raro que alguien lo note.
Como anécdota, una amiga de mi hermana tiene un brazo amputado a la altura del codo, ligeramente por encima de la articulación. No lleva prótesis y en verano suele ponerse una rebeca para disimularlo. Pues bien, mucha gente no se da cuenta cuando la conoce.

S

#9 Aprovecho lo que pone #13, me parece que muchas IAs juegan con eso para intentar dar el corte. Ahora chatgpt lo hace bastante bien, pero los primeros intentos de hacer pasar a un bot por humano consistían en que aceptaras que chateabas con un niño que no sabía bien tu idioma, y pasaba. Y claro, así puedes pasar por aceptable muchas cosas...

La calidad es bastante buena, y cuando empieces a ver cosas raras puedes sospechar, pero no puedes dejar de lado la posibilidad de que la foto sea rara por razones reales. Y si a eso sumamos los filtros de las cámaras, alguna que lo usa de forma automática (como pillaron a Samsung con la luna) ya tampoco puedes fiarte de que sea una foto falsa, una rara, o una mal retocada...

maria1988

#38 Justo. A mí la mayoría de fotos que pasan por filtros automáticos, sobre todo cuando se aplican a las caras, me rechinan muchísimo.
Entiendo que se puede retocar una foto bien, de modo que la persona tenga mejor aspecto sin dejar de ser natural, pero eso no es lo que solemos encontrar ya que la filtros automáticos no son tan buenos. Lo peor es que hoy día está tendencia se aplica también a los vídeos, da la sensación de estar viendo hablar a un muñeco en lugar de a una persona.

S

#42 Me has recordado el vídeo de "señor juez, no soy un gato". lol

D

#87 pon big breakfast, a ver que sale

D

#87 las IA tienden a poner grandes tetas, pero a mí me salió en este caso average , con Lexica salen asi

D

#87 esto es en Lexica

cogeiguen

Coño, parece que por fin pone una cantidad normal de dedos.

D

#7 Parece. Pero no.

redscare

Yo lo que no tengo claro es a que se refieren con una foto real. Porque hoy en día cualquier fotógrafo profesional le mete tal cantidad de post-procesado digital a sus fotos que no se yo hasta que punto es correcto decir que el resultado es una foto real.

t

#25 Que no parezca una ilustración.

D

Yo he entrado, y ni he sabido como crear una puta imagen.

El manual es un lío.
Al final creo una en una especie de chat donde hay cientos de personas creando y no he podido encontrarla.

Tienen que currarse más toda la mierda de pantallas que tienen.

Joice

#2 Yo lo intenté una vez y acabé en esa cosa monstruosa llamada Discord, donde todo me parecía caótico y no entendía nada. Pensé: "tío, te estás haciendo muy viejo para esto". Así que lo cerré todo y para otro día...

SaulBadman

#15 Que rabia que cada vez sea más normal pedir ayuda en Discord en vez de fotos y lugares así. De esa manera se "pierde" la información y no es indexada por ningún servicio de búsqueda aparte del buscador de Discord (que no es lo mismo)

D

#15 pones un prompt como este "a very atractive 30 years old scandinavian woman with white hair , smiling ,hairstyle bun ,wearing a Tight Fitted Dresses Sleeveless Open Side Gold Fastening Bodycon Dress gold , window with showing urban neon lights, blade runner , cinematic lighting, Shot on ,50mm lense, Ultra- Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography, Photoshoot, Shot on 70mm lense, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Lonely, Good, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting,,Global Illumination, Screen , Ridley scott movie, --ar 4:7 - " copy paste, seguramente se ouede reducir mucho y conseguir los mismos resultados

E

#2 #15 yo creo que es más el interés que tengáis porque realmente son 2 minutos. Para mí también era nuevo discord y lo que hice fue crearme un canal, meter el bot de midjourney en ese canal y luego "/imagine" y ya lo que se te ocurra

D

#93 Lo de los 2 minutos ni de coña si no has usado antes esa caótica interficie.

Joice

#93 Venga lo voy a intentar. 2 minutos... Bueno que sean 22.

ReySombra

#16 La primera y la segunda de la fila de abajo están cojonudas.

D

#2 Puedes crear tu propio server, añadir al bot de Midjourney y jugar en él sin tener que entrar en las salas comunes.

ReySombra

#17 Para eso hay que ser usuario de pago

pedrobz

#18 Y tendria razon... El teclado qwerty viene de las antiguas máquinas de escribir, y se hizo asi a proposito para que no se escribiera demasiado rápido y que los "martillos" con las letras (no se como se llaman) no se atascaran entre ellos.

D

#18 ¿Tu sabes porqué Google arrasó con el resto de buscadores cuando salió hace algo mas de 20 años?

D

#68 Si quieres contar algo, hazlo directamente, no me vengas con preguntas retóricas.

D

#69 No es una pregunta retórica.
Es una pregunta.

Tiene dos posibles respuestas: Si y No.

D

#70 ¿Y tú qué dices? ¿Que sí o que no?

maria1988

#68 Porque su algoritmo era mejor que el de sus competidores, ya que daba resultados más relevantes para el usuario.
Los creadores de Google entendieron cómo funciona internet y diseñaron un algoritmo llamado Page rank, que ordena los resultados en función de los enlaces entre las páginas web, considerando más relevantes los sitios más enlazados por sitios que a su vez son relevantes.
Si te interesa el tema, hay bastantes artículos de teoría de grafos dedicados.
No sé qué tiene eso que ver con la noticia.
CC. #18

D

#21 Eso ya lo he hecho, pero como es un canal donde escribe mucha gente, la imagen se va par arriba y la pierdes.

A ver, usabilidad, joer, podian aprender del chat de openai.
Mira que es fácil hacer las cosas fáciles.

Lito

#66 pero tienes la notificación sobre tu imagen, así que puedes recuperarla cuando quieras (o usar el buscador).

D

#72 Repito: Usabilidad.
La mayoría de los informáticos no saben diseñar un sistema para un usuario.
Esto, guste o no, es una verdad como un templo.

Lito

#74 y a mí que me cuentas

D

#75 Pasaba por aquí...

D

#66 me recuerdas a alguien hace unos 20 años en clase de CAD que perdía los dibujos, todo lo tuyo está aquí , te pongo una captura de pantalla

D

#81 Superevidente, vamos, que si no sabes como va, no sabes que significan los iconos, no sabes usarla.
Usabilidad.

D

#84 con dedicarle un poco de tiempo no es más, toneladas de videos sobre eso en youtube o simplemente buscas

awezoom

#2 pagas la suscripción y puedes abrirle un chat privado al boy donde solo están tus imágenes.

El servidor te explica claramente cómo funciona todo: si no has sido capaz de entenderlo, el problema está en tu lado, siento decírtelo.

D

#56 Pongo la mano en el fuego a que a ti no te dejan tratar con los clientes el tema de la usabilidad de un software.

awezoom

#65 hace mucho que no curro para clientes. Esa suerte que tengo.

D

#2 pues yo los hice en 5 minutos

b

La artificial es la de la izquierda

mudito

¿Igual de bien que no podemos diferenciar un artículo normal de uno hecho en Xataka ?

M

#83 Ya pero eso no da dinero, y por desgracia el avance tecnológico es por el porno o por videojuegos o por %_menor_de_otras_cosas_en_conjunto.

M

El porno esta que se frota la manos (y otras cosas). Pero como estamos en un mundo capitalista, los avances tecnológicos no son por los "fans del porno" si no por las "empresas del porno". ¿Se puede sacar dinero porno de esto?

D

#47 Cantidades brutales.
Juntas una IA para generar vídeo, otra para generar conversación, y le añades una de esas muñecas hiperrealistas para el desahogo final, y tienes unos cuantos millones de tíos encantados de dejarse cientos de euros al mes mientras no se arruinen.

M

#59 ¿Cuando montamos la empresa?

D

#88 Ya lo están haciendo.
¿Recuerdas cuando hace un par de años no sé quién (M$, G...) dejó que el público usara a su IA de chat y en menos de dos meses era absolutamente machista, xenófoba y sexualmente inapropiada?
Cogieron el resultado de ese aprendizaje y lo partieron en dos, una parte para ayudar a crear la siguiente versión que no se haga hija de puta y obscena, la otra para usar como chatbot para adultos. No recuerdo el nombre de la compañía de porno que está en el asunto, pero ya tienen millones de financiación y esas cosas. Uno o dos años más y podremos pedirle en conversaciones de vídeo a un chica/chico/animal artificial que se meta por el culo tal o cuál dildo mientras saca la lengua como si fuera idiota. Vamos a ir de mal en peor.

awezoom

#97 yo creo que lo que tenían que hacer es IAS para generar porno infantil para que nunca nadie necesitara abusar de ningún niño real para generar el contenido que los pederastas buscan. Porque nunca dejarán de buscarlo y consumirlo, así que lo mejor sería sintetizarlo para que tengan contenido para aburrirse sin joder infancias de verdad.

D

#47 el porno está en stable difusion, te lo descargas y puedes hacer lo que quieras en tu ordenador , en discord tienen un canal NSFW

Malinke

Pues para mí dinero gastado en nada, porque poca importancia me supone eso. Vale que para algún asunto valdrá, pero la mitad es tontería.

awezoom

#92 pues yo ya he hecho trabajos de diseño con cosas de SD. No tal cuál me las da, pero entre bocetos para saber por donde tirar o trozos parciales que luego integro con otras cosas, a mi me parece brutal.

m

que enseñe las manos…

1 2