Hace 9 meses | Por blodhemn a genbeta.com
Publicado hace 9 meses por blodhemn a genbeta.com

En el festival CogX, celebrado en Londres, Fry compartió con el público un fragmento de un documental histórico aparentemente narrado por él mismo… pero la sorpresa fue mayúscula cuando Fry aclaró que nunca había pronunciado ninguna de las palabras que se oyeron en el documental, ni había dado permiso para 'recrearla'. El reputado intérprete británico Stephen Fry denuncia que entrenaron a la IA con sus audiolibros de la saga infantil.

Comentarios

D

#5 derechos de imagen y/o sonido? Me suena a copyright.

Magankie

#16 no es tan así. En teoría, para usar una imagen en la que tú sales es necesario pedir tu consentimiento. En la práctica, la gente está regalando sus imágenes en redes sociales, las cuales tienen ya todos los derechos de explotación.

stygyan

#21 no todos los derechos. Lo que firmas habitualmente cuando aceptas los términos de uso es simplemente para que la puedan mostrar tanto en su página como en otras, sin ánimo de lucro. No estás entregando derechos de venta ni de uso para AI.

daphoene

#37 "No estás entregando derechos de venta ni de uso para AI."

En realidad, sí, les cedes los derechos de explotación del contenido tuyo que subes. Al menos era así cuando me leí los términos de Facebook cuando me hice la cuenta.

D

#21 Es que no es su imagen, ni su voz, porque como dice el afectado "nunca ha dicho esas palabras". Son derechos derivados de su obra, una lectura de Harry Potter con la que han alimentado una IA.

Han hecho una obra derivada de su obra, sin permiso. Eso es copyright.

Y ojo, no digo que no haya que legislar eh, solo digo lo que es actualmente.

D

#16 suplantación de identidad

D

#27 Si en algún lado sale su nombre, sí, si no, es copyright de la voz.

No puedes suplantar algo si no dices ser ese algo.

JackNorte

#1 Justo hoy el dia de los piratas arrrrrrrr

c

#1 Propiedad vocal, no intelectual

j

#1 Hombre,si has firmado el consentimiento,no creo.
Si no sabías lo que firmabas, ni te leíste la letra pequeña, a reclamarle ahora al maestro armero.

lonnegan

#26 No creo que haya firmado el consentimiento para hacer eso.

j

#28 Créeme que si lo están haciendo es porque pueden legalmente.

S

#73 ya, una leche. Parte del negocio de las empresas de tecnologías "disruptivas" es aprovechar cualquier vacío legal con una tecnología para hacer el pirata hasta que la legislación de normalice.

l

#1 Propiedad biológica creo que lo llaman.

Ehorus

#13 como dicen en MNM , que den conciertos .. oh, wait...las IAs también dan conciertos..

D

#15 pues que se hagan informáticos

D

#15 Justo en #41

Manolitro

#13 y llegará un momento que nadie conocerá a este señor, igual que nos pueda pasar hoy con un locutor famoso de la radio de los años 30. En ese momento ya no tendrá sentido tratar de recrear nada, porque no será reconocible igualmente. Tampoco tendrá sentido que se hagan películas con la imagen de Bruce Willis, como parece que se van a empezar a hacer

borre

#30 Ahora que has dicho eso, me gustaría saber quien era el narrador del NODO.

Ahora que leo, parece que fue Ignacio Mateo
https://www.guillermoorduna.com/voces

snowdenknows

#13 así es, pero bueno, es casi como un imitador que cobra bolos y que imita a un famoso lucrándose de él

e

#13 y a los traductores, tanto en papel como simultanea.

j

#13 Precisamente la gracia es que sean voces conocidas. Con voces desconocidas el TTS ya hace mucho que es prácticamente indistinguible.

Bartolo_one

#2 Comunismo si te fijas bien.

Moreno81

#2 Si si... Robado. Si tú te descargas una copia de internet de una película, según las leyes estás ROBANDO... Pero vamos, veo que se van a inventar algo para que no sea tan evidente,

s

#44 de que país?

g

#44 La ley dice que eso es robar porque la ley la hace el que quiere que pases por caja para ver sus pelis, no porque eso sea robar. Si se pudiera copiar coches de lujo a coste cero también lo llamarían robar, aunque el dueño del original tuviera el suyo en el garaje.

LoboAsustado

¿Y la voz de los ya fallecidos , como Constantino Romero?

Magankie

#8 completamente cierto, a no ser que como hizo Robin Williams lo pongas en el testamento.

j

#8 Eso es de otra època, cuando la cosa todavía era artesanal.
Ahora que es industrial,si quieres trabajar tendrás que firmar por duplicado el consentimiento, perder todos los derechos.

v

#8 la voz de Lola Flores de ese anuncio la puso Lolita o Rosario

Acido

#49
No, la voz de ese anuncio no la puso ni Lolita ni Rosario.
Al menos no exactamente, ya que ni la voz de Lolita ni de la Rosario son iguales que la de su madre, ni tiene sentido que se pusieran a imitar la voz de su madre.

Lo qué si hicieron, aparte de dar permiso para hacer el anuncio (supuestamente cobrando, como herederas de los derechos de imagen de su madre) fue asesorar dando su opinión, es decir, colaborar con el equipo técnico para sugerir cómo debían ser los gestos de la cara o la entonación de la voz.

https://www.lavanguardia.com/television/20210121/6188764/asi-hizo-revivir-lola-flores-anuncio-cruzcampo.html

Tengo duda de si grabaron a alguna de ellas, o las dos, para tomar ejemplos de entonación.

Como ingeniero de teleco, e interesado en Inteligencia Artificial, he conocido un poco de cerca el asunto de síntesis de voz:

* La boca, garganta, etc... es una cavidad, una caja de resonancia, como puede ser la de una guitarra, o la forma de un saxofón, una trompeta, etc...
Esto es lo principal que determina que la voz de cada persona sea diferente, porque el tamaño y forma de esa cavidad es diferente en cada persona.

Obviamente hay personas con voz similar, y en familiares igual que se parece la cara también se suele parecer la voz... Pero no suele ser igual. A veces se confunde la voz de un chaval de 18 años con la voz de su padre.

Esa caja de resonancia cambia, tanto con la edad, como también en cada vocal que se pronuncia: no es lo mismo cómo colocas la boca para pronunciar la A que la O, por ejemplo.

* Por otro lado, están las cuerdas vocales, que actúan en parte como las cuerdas de una guitarra y en parte como una armónica. Como una armónica porque al soplar vibran las cuerdas vocales y como una guitarra en el sentido de que la longitud de la cuerda, el material y la tensión afectan a la frecuencia fundamental.

Por ejemplo, las mujeres y los niños, al tener menor tamano del cuerpo y de las cuerdas, tienen frecuencia fundamental más alta... como si en una guitarra oprimes una cuerda más abajo, haces que esa cuerda no pueda vibrar en toda su longitud, sino en una longitud más corta: menor longitud implica menor longitud de onda del sonido, mayor frecuencia, es decir sonido más agudo.

Lola Flores en su edad adulta tendría una frecuencia fundamental media al hablar... que puede ser muy similar a la de sus hijas y otras mujeres.
Pero lo que sería más distinguible y propio de Lola, y diferente a otras mujeres sería la cavidad vocal. Eso sería lo que solemos llamar "la voz de Lola Flores". Lo que se hace es tomar muestras de voz grabada de Lola Flores, por ejemplo, de entrevistas en radio y televisión... Y de ahí se "calculan" o captan las características de su cavidad. En eso poco pueden hacer sus hijas excepto opinar: esta voz se parece más y esta se parece menos... Pero el proceso automático calcula o capta eso bastante bien.

Ahora bien, no basta con hablar con "su voz" sino también la entonación, que es una mezcla de cómo hacía variar las cuerdas vocales y otras cosas como las pausas.
En esto las hijas no solo podían dar una opinión sino que podían imitar la entonación que usaba su madre. Es posible que lo hicieran... Por un lado, como hijas, saben mejor que nadie la manera de hablar de Lola. Pero, por otro lado, cualquier persona oyendo a Lola puede imitar eso, así que no era absolutamente imprescindible que las hijas se pusieran a imitar a su madre fallecida... lo cual podría ser un poco incómodo para ellas.
Y no solo se puede hacer imitando, claro, las máquinas también pueden hacerlo y de hecho hemos visto en numerosos ejemplos cómo sistemas automáticos sin intervención de personas (ej: imitadores) captan esas características de entonación, esos estilos o peculiaridades.

En el vídeo del enlace que puse se puede ver que hay una actriz, que no es ninguna de las hijas, que pronuncia la frase del anuncio, y pronuncia esa frase con un estilo similar, entonación y acento similar, al que usaría Lola Flores.
Del mismo modo que en la imagen del vídeo se cambia la cara de la actriz por la de Lola, manteniendo los movimientos / gestos hechos por la actriz, también a nivel sonoro se cambia la "cavidad" (la voz) y quizá un pequeño ajuste a la frecuencia fundamental, manteniendo el estilo o entonación.
Las hijas, Lolita y Rosario, podrían limitarse a elegir entre varios intentos y a dar sobre la marcha algunos consejos u opiniones, como asesoras... sin que fuese totalmente necesario que imitaran la voz de su madre, ni que grabaran sus voces imitando.

Lo que es seguro es que ni la voz de Lola, ni la que apareció en el anuncio, voz muy similar a la de Lola, no son iguales que las voces de Lolita ni Rosario.

v

#64 del mismo medio de comunicación
"Lolita presta su voz a Lola Flores en un anuncio"
https://www.lavanguardia.com/gente/20210203/6218356/lola-flores-anuncio-lolita-rosario-cerveza-cruzcampo.html

Acido

#66

Gracias por el enlace.
Desconocía eso.

Me fui a buscar más y encontré otro enlace:

https://www.rtve.es/television/20210203/lolita-interpretar-lola-flores-madre-emocionado-enormemente/2072602.shtml

En este otro hay un vídeo donde se ve a Lolita grabando su voz, tal como haría una actriz de doblaje. Aunque este vídeo no demuestra que la voz usada en el anuncio sea exactamente la suya, la de Lolita, es claro que si Lolita ha dicho que sí, que han puesto su voz, pues tiene que ser verdad.

Además, fui a ver el anuncio otra vez y sí me pareció cierto que hay ciertos matices que parecen de Lolita, y no de Lola Flores.

Así que estaba equivocado en lo que dije en #64
Sigue pareciéndome un poco extraño que pudiendo tener "la voz" de Lola, con los matices de ella, hayan optado por la voz de Lolita. Pero, por un lado, supongo que doblar es bastante más barato / sencillo y, por otro lado, aunque la voz no suene 100% a Lola Flores, tiene la ventaja de un habla más natural. La voz sintética, cuando intentas mezclar características de diferentes personas, me temo que suena peor, menos natural, más raro. Otro punto a favor es que Lolita consigue hacer una muy buena interpretación de la voz de su madre, aparte de tener ya de serie un "color" de voz similar.

De todos modos, todos los cantantes, y Lolita es una de ellas, están acostumbrados a la post-producción. No descarto que haya un poco de "retoque" de la voz de Lolita... sobre todo cuando Lola dice "¡Por el acento!". Esa parte me parece muy del color de viz de Lola Flores y me resulta extraño que sea 100% de Lolita... Es como que esa parte no me cuadra que sea una imitación de Lolita tan perfecta, por mucho empeño que haya puesto. Puedo estar equivocado... pero es la parte que yo diría "esa no es la voz de Lolita".

v

#80 has hablado del color de la voz, yo sí que oigo la voz del anuncio como más clara, más fina que la de Lola Flores. Que bueno, tampoco es muy fiable mi percepción porque recordaba su voz más 'oscura' incluso más que en la de la serie de Movistar, Lola.

j

#6 No des ideas.

LoboAsustado

#31 Pues que el sistema operativo te de los mensajes con la voz de Darth Vader tendría su puntito lol

Battlestar

Esto es todo una campaña organizada para generar odio hacia las AI porque temen que les quiten el trabajo tinfoil

j

#3 A Stephen Fry ya le han quitado el trabajo de narrador o voz de audio libros.

abnog

#29 Lo dudo mucho. Una cosa es que puedas recrear la voz de alguien y otra muy distinta que puedas vender algo creado con esa voz.

j

#12 #3 Pues para evitar polémicas. Ya debería salir IA con carácter propio, en el sentido de escribir libros, poesías, dibujos, doblaje, etc.

Otra cosa. Es el tema económico. Que debe de ser de resolución socio politico. Y para todos.

Al final. La tecnología es lo que se pretende. Mayor eficacia, soluciones, quitar trabajo, evitar la soledad, precisión en medicina, mayores recursos, evitar accidentes laborales, de tráfico, etc.

C

#3 Es que les terminarán quitando el trabajo. Una película de Marvel se puede hacer perfectamente sin ningún actor real. Es (casi) todo CGI, como un videojuego. Si puedes "pegar" la cara y la voz de Robert Downing Jr. y de Jennifer Lawrence "gratis", para qué les vas a pagar una millonada por salir en la peli? Si no se regula el tema, en 4 días toda esa gente a la calle. Más si consideramos que un actor digital ni se cansa, ni tiene cambios de humor, ni caprichos, ni monta follones, ni nada de nada. Y puede trabajar en 30 películas a la vez si hace falta!

angelitoMagno

Al final, lo que va a detener a las IA va a ser el copyright y la ley de cookies

thorin

#4 La SGAE es nuestra esperanza contra Skynet.

thorin

#46 Necesitaban empezar a comprar AK47 y granadas para luchar contra los Terminator.

recom

#4 Eso es poner puertas al campo.

elGude

La piratería está acabando con la cultura.

powernergia

#47 Me refería mas bien a que los medios quedarán en manos cada vez mas de grandes empresas y capitales.

caramelosanto

#51 pero ya vivimos en esa realidark.

DayOfTheTentacle

Los contratos que se hacen telefónicamente van a perder toda legitimidad (si es que tenía mucho el "si" repetido)

Nexo

Se nota que ya no nos leemos los artículos.

La presidenta del sindicato es Fran Drescher y nadie se ha acordado de "La niñera".

#SAD

D

#69 Pues es algo que no entiendo, porque si las redes neuronales sirven para algo es precisamente para cosas de estas. La única explicación razonable es que los actores salen más baratos, en el sentido económico que no el geográfico.

D

La revolución ha comenzado!

caramelosanto

#14 Hail Skynet!

j

#77 No. La voz no es nueva. Es una voz que imita a la perfección a la de ese señor, como cuando en Terminator II llaman a los padres adoptivos de John Connor y el T-1000 contesta al teléfono con una voz idéntica que la de la "madre".

powernergia

Nos hacen mucha gracia las cosas que pueden hacer las IA, pero los prejuicios van a ser brutales.

powernergia

#17 No es solo que no se vayan a socializar los pedios de producción, es que las IA abrirán brechas tecnológicas (y sociales) aún mas grandes.

rojo_separatista

#38, es probable, como también lo es que quienes preferían cerrar los ojos no tengan más remedio que abrirlos.

caramelosanto

#38 analfabetos tecnologicos. Esto se parecera al choque de civilizaciomes en cuanto el desfasaje sea de más de un peldaño.

No es sólo tener la capacidad economica para usar estos avances, sino la velocidad de adaptación que tengamos a estas techs, quienes no lo usen quedarán tan desfasados como ver a una persona en carroza desde arriba de un tren.

Mimaus

#47 bueno, también se decía que los nacidos en la era de la tecnología la iban a dominar desde pequeños y raro es el que sabe hacer algo más que entrar al tiktok desde el teléfono o usar apps que lo dan todo hecho...
Una cosa es usarla y otra saber cómo funciona.

f

#12 me da que quieres decir "perjuicios", y estoy de acuerdo (y, de aquellos, vendran los "prejuicios" luego)...

e

#12 La palabra perjuicio significa 'daño material, físico o moral', mientras que prejuicio significa 'juicio u opinión, generalmente negativo, que se forma inmotivadamente de antemano y sin el conocimiento necesario'.

G

La única solución que veo a esto es que las obras producidas mediante IA no puedan tener derechos de autor, si  no adiós a ilustradores, escritores , actores y demás fauna

MAVERISCH

#53 No. Deben tener derechos de autor los propietarios de la voz cuando la usa una İA. ¿Qué es eso de que te dejen de llamar de un trabajo porque una IA usa tu voz? Que usen su puta voz, que aprendan, y no la de otros.

j

#56 Precisamente ése es uno de los objetivos de la huelga de actores y escritores: que no se use su voz ni su imágen eternamente y sólo cobrando una actuación. Igual los guionistas, realizadores, ... con su trabajo.

MAVERISCH

Es una puta desfachatez

D

Esto de robar la voz empezó con Vocaloid.



Seguimos con la misma técnica. Pero no veo por qué estos generadores de texto tan modernos de ahora no pueden dedicarse a mezclar muestras y generar una voz distinta para cada personaje. Falta mucho todavía.

caramelosanto

#41 dale un mes y monedas, te leo en el próximo paper.

e

#41 falta mucho? Hablamos a final de año a ver qué tal va el asunto...

j

#41 Siri, como muchos otros, está generado así. La Siri española (Iratxe Gómez, una de ellas) lo ha contado varias veces, que tuvo que leer muchos textos, pero ninguno era "abandone la rotonda en la tercera salida".
La diferencia es que ella sabia para lo que trabajaba y encontraría su voz en surtidores de gasolina, contestadores y demás, no concretamente en Siri, pero formaba parte del contrato.
A este le han pillado sus locuciones y sin contrato ni nada han generado la voz

D

#76 Por aclarar. No se trata de pronunciar un texto nuevo, que eso lo hacen de coña, sino de crear una voz nueva, como si fuera humana, pero no previamente existente. Para hacerlo bien, una voz que le pegue al personaje.

L

Alguien debería re-doblar con IA todos los episodios de Los Simpsons con la voz de Carlos Revilla después de su muerte

esehombresimpatico

No sabía que era Fry, hace mucho no veo Futurama

Naranjin

Anda que no llevan años las IAs quitando el trabajo a las personas...ojalá pudiéramos recordar las huelgas de campesinos, operarios de fábricas, etc etc...que siga subiendo el nivel de mierda...a ver qué tal...

powernergia

#20 Las automatizaciones llevan mucho tiempo con nosotros, y mientras que hay crecimiento los puestos perdidos en unos sitios se compensan con creces en otros.

¿Hasta cuando va ha haber crecimiento?.

astronauta_rimador

#39 el problema és cuando estos cambios te pillan ya con más de 40 años, a ver quién es el guapo que se adapta.

powernergia

#42 Eso está claro, pero creo que es otro tema.

No creo que estas automatizaciones creen puestos de trabajo netos, ni mucho menos.