Publicado hace 1 año por Nadaquever a githubcopilotinvestigation.com

Quizá no te importe que GitHub Copilot utilice tu código abierto sin preguntar. Pero, ¿cómo te sentirás si Copilot borra tu comunidad de código abierto?

Comentarios

frankiegth

#0. Confiar en los de Micro$oft es como hacerse trampas al solitario.

D

Copilot: una IA a la que tú entrenas.

ccguy

#22 depende de lo que ponga el contrato, supongo.

Yo a mi empresa le pasé una lista de proyectos de código abierto en los que colaboro y creo que si quiero contribuir a algún otro lo tengo que notificar, pero nada más.

D

#15 Como dice el artículo, el problema viene cuando le pides que te haga algo y el código que saca es prácticamente el mismo que el de otro proyecto; pero como no te dice de donde lo has sacado tú lo publicas y de pronto te encuentras con que la licencia original es incompatible con la tuya.

Y obviamente no hablamos de una función de dos líneas, sino de trozos grandes de código.

Por ejemplo.

D

Bueno, pues parece que Microsoft esta vez sí ha encontrado y aprovechado un resquicio para atacar, dañar (y quien sabe si destruir) muchas comunidades Open Source. cry

Lo que más me flipa es esta parte:
“Dude, it’s cool. I took SFC’s advice and moved my code off GitHub.” So did I. Guess what? It doesn’t matter. By claiming that AI training is fair use, Microsoft is constructing a justification for training on public code anywhere on the internet, not just GitHub.
O sea, Microsoft puede entrenar Copilot con cualquier repositorio de código Open Source alojado en cualquier sitio de Internet al que tenga acceso (GitLab por ejemplo).

Yo estoy de acuerdo con el artículo: ni es "fair use", ni es ético, ni vale el truco de "tú insertas este código y tú te responsabilizas de cumplir su licencia", porque no tienes ni idea de dónde viene ese código ni cuál es su licencia!!!

D

#18 Y con una GPL no tendria que licenciarlo todo con GPL por ser una obra derivada? Pues ya va siendo hora de sacar la espada del SL. 

D

#29 Los de Microsoft no son tontos y tienen dos defensas ante esas amenazas:
1. Durante el entrenamiento, usar código bajo cualquier licencia es "fair use" (sería algo así como el derecho a copia privada del copyright).
2. Durante la ejecución de Copilot, el código insertado es responsabilidad de quien lo incluye en su proyecto, así que quien use Copilot en su proyecto debe buscarse la vida para averiguar las licencias del código insertado (lo cual es absurdo y elimina el sentido de Copilot).

fanchulitopico

Lo llevo utilizando desde hace unos meses. Sus sugerencias progresan basadas en mi código y correciones, hasta llegar a escribir una función entera. Lo que me parece espectacular es escribir un comentario pidiendo lo que tú quieres y obtener la funcionalidad.

“Any sufficiently advanced technology is indistinguishable from magic.” Arthur C. Clarke

R

No lo veo claro.

Lo veo más como si yo aprendo leyendo código de otras personas. Cuando escriba mi propio código no tengo que mencionar a los que programaron el código que yo he leído.

Esta IA ha aprendido a programar viendo código de otros, pero no se dedica a copiar y pegar código de otros, crea su propio código

D

#19 El problema, como dice el artículo, es cuando esa AI genera un trozo de código no obvio (o sea, que es razonablemente largo y tiene su miga) que es virtualmente idéntico al de otro proyecto, sólo cambiando el nombre de algunas variables.

D

#19 Atribuir a una IA la capacidad de "creación" es muy atrevido a día de hoy.
La magia de las IA actuales (DALL-E, GPT-3, etc.) es entrenar con un corpus gigantesco que posteriormente saben combinar para producir resultados que pueden ser sorprendentes y dan la sensación de creatividad, pero que no es más que combinación de muchas cosas.
Así que no puedes atribuir esas capacidades humanas y mucho menos los derechos humanos a un proceso sistemático, por muy complejo que sea.

Y que conste que soy pro-IA (supervisada y controlada) y sé que algún día llegaremos a la singularidad, pero aún falta bastante para eso.

alexwing

No entiendo que problema hay, y si lo hay, es el mismo que el de usar miles de imágenes para entrenar una IA de texto a imagen, los resultados no son el código que se entreno, sino interpretaciones de este.

por ejemplo, si mi variable se llama lechuga, y de donde aprendió se llamaba cebolla, el código propuesto usará mi variable y todas diferencias y propiedades de mi código, generando un código que es totalmente nuevo, por lo que no hay atribuciones que dar.

M

#2 Sucede que eso sería una transformación, y por lo tanto tu obra sería una obra derivada de la anterior. Es lo mismo que si tomas la canción "all you need is love" de los Beatles y cambias la letra, la instrumentación y un par de acordes. Sería una obra derivada de la anterior, por lo que tendrías que obtener una licencia del autor para publicarla.

ccguy

#5 ¿link?

pkreuzt

#7 #12 #14 #20 Contesto aunque no he encontrado el caso. Apenas recuerdo los detalles. Iba de un desarrollador que trabajaba en una empresa de software grande y en sus ratos libres llevaba un proyecto de soft libre. Pues cuando la empresa de marras vió que era interesante, le puso un pleito argumentando que todo lo que hiciera mientras trabajaba para ellos era de la empresa, aunque lo hiciera en sus ratos libres y en su casa. Y ganó. A continuación quisieron pedirle un pastizal por devolverle el control del proyecto.

Vamos, eso es lo que recuerdo. No se si será todo correcto.

snowdenknows

#22 creo que lo vi en algún lado también, en una peli o así, pero no es exactamente lo mismo que se daba a entender al inicio de este debate

pkreuzt

#24 No, yo creo que lo vi por aquí. O quizá en Barrapunto

D

#7 Hay una serie en la que se da el caso de que el protagonista es demandado por la empresa en la que trabajaba por haber desarrollado un software que en alguna vez fue desarrollado en equipos de la empresa. 
Sillicon Valley. Buena serie. Y mucho asco qu dan la gente de SV…

ccguy

#30 hay que ser tonto para usar el ordenador del trabajo para cosas personales

D

#31 Bueno, es una serie de televisión,  aunque la realidad a veces supera la ficción

Cuñado

#5 Si es que estaba visto...

¿Tienes algún enlace sobre esto?

rojo_separatista

#5, eso es ilegal y si pasa, puede pasar tanto con modelos generadores de código con IA, como con código picado a mano.

snowdenknows

#5 es ilegal, el código libre o abierto también está registrado y como lo está con anteriuoridad ganan el juicio fácil

a

#8 nunca entenderé que exista un concepto "etereo" como es la propiedad intelectual.

La propiedad privada de cosas tangibles (un coche, una casa...) tiene sentido porque solo una persona puede disfrutar de ese objeto al mismo tiempo. No tiene sentido usar este concepto en ideas o conceptos, que se puedan usar de forma masiva sin exclusión alguna.

Y no, la excusa de: "Esque tienen que ganar dinero..." siempre me ha parecido un poco floja. El mercado siempre encuentra una forma de rentabilizar los trabajos. No fue el sistema legal quien acabó con la piratería, sino Netflix y Steam.

D

#10 Deberia haber propiedad de reconocimiento de autoria pero no restricciones de comparticion.

http://harmful.cat-v.org/economics/intellectual_property/

BodyOfCrime

#8 En Europa? Las ideas no pueden ser registradas y un algoritmo es una idea

m

#11: Si tiene CopyLeft no te puedes llevar el código sin más, cuando lo uses en otro proyecto, este tendrá que tener una licencia similar par que ese uso sea posible.

chemari

#3 Si cambias los suficientes acordes ya no necesitarías ninguna licencia. Lo mismo con las IA. No cogen una obra y la transforman, mas bien es como si cogieran cientos de ellas y las mezclan. No hay nada reconocible de las originales, salvo algo tan vago como "el estilo". Lo mires como lo mires no hay donde rascar.

snowdenknows

#3 creo que estás confundido, se permiten las derivaciones como obras nuevas, por eso altozano y compañia reinterpretan canciuones con su piano y youtube les deja publicarlas

pawer13

#3 mi duda con todo esto es: ¿qué diferencia hay entre que yo, un desarrollador de software, me baje de repositorios públicos código para simplemente estudiarlo y aprender y luego aplique esos patrones y buenas prácticas y que lo haga una IA.
Mis implementaciones se acabarán pareciendo a las que he estudiado. Y todos conocemos casos donde la gente hace C&P de otro repositorio o de una respuesta de Stackoverflow y por tanto el código no sólo se parece, es que es idéntico

S

#2 Hay que tener en cuenta que en cierta medida eso es lo que hace nuestro cerebro. Alguien puede entrenarse para pintar a Picaso y hacer obras parecidas, pero no lo consideraríamos una obra "derivada", aunque en el tema literario quizás sí, y en el tema de código hay ingenieros que no pueden estar "manchados" por conocer como "otro" soluciona su problema para que incluso si llega a la misma solución no se pueda decir que le copió...

Esto último ocurre mucho en los proyectos de ingeniería inversa. Lo desaeble es que los haga alguien que no conozca nada del código del sistema que quiere emular.

D

El problema parte del por qué Microsoft ha entrenado su herramienta con el código de otros y no con el de ellos, no dan acceso al código con que la han entrenado, no han notificado a los propietarios del código de entrenamiento que su código ha sido sugerido a un tercero y mucho menos aún se han preocupado de garantizar que se informen las condiciones de la licencia original del código o del autor a los usuarios de la herramienta. Como bien lo describe la nota, la herramienta es un parásito de código que absorbe sin retribución alguna.

u

Eso pasa por no leerse los acuerdo de usuario