Eventos

Demanda de GitHub Copilot: GitHub gana el caso

mm

Lanzado en 2021, GitHub Copilot se ha convertido en una herramienta útil para los desarrolladores. Es un generador de código de inteligencia artificial que sugiere fragmentos de código y autocompleta líneas. Desde su lanzamiento, Copilot ha mejorado dramáticamente la productividad y calidad del código de los desarrolladores.

GitHub Copilot ha estado involucrado en un caso legal desde 2022. Un grupo de desarrolladores presentó la demanda porque creían que Copilot reutilizaba código de código abierto existente sin la debida atribución a los codificadores originales.

¿Cómo comenzó la demanda de GitHub Copilot, qué significa la sentencia actual y cuáles son las implicaciones más amplias de este caso? Explorémoslo.

Resumen de las reclamaciones iniciales y desestimaciones

En noviembre de 2022, un grupo de desarrolladores presentó una demanda colectiva contra GitHub, Microsoft y OpenAI. La demanda inicial comprendía 22 reclamaciones. Se centró principalmente en GitHub Copilot. GitHub entrenó a Copilot con datos de código abierto existentes para proporcionar fragmentos a los usuarios mientras codificaban.

Los demandantes dijeron que estaba copiando fragmentos de código sin acreditar a los desarrolladores originales. Los desarrolladores también invocaron la Ley de Derechos de Autor Digital de Milenio. La sección 1202(b)(2) de la DMCA y sus subsecciones abordan la infracción de la información de gestión de derechos de autor. Acusaron a GitHub de infracción de derechos de autor de la DMCA al eliminar información importante de los fragmentos de código, como la fuente del código.

El tribunal desestimó muchas de estas reclamaciones a lo largo de la demanda. El 9 de julio, desestimaron tres reclamaciones adicionales en una gran victoria para los demandados.

Según el tribunal, no hay suficientes pruebas de similitud de código entre la salida producida por GitHub y el código de código abierto en el que se entrenó el software. Por lo tanto, el juez también dictaminó en contra de cualquier violación de la DMCA.

Las modificaciones recientes de GitHub a Copilot influyeron significativamente en la decisión del tribunal. Los cambios en el asistente de programación aseguraron que la herramienta mostrara variaciones de fragmentos de código en lugar de copias exactas.

Además, las quejas incluyeron un estudio de IA para enfatizar aún más la inevitabilidad de que GitHub reutilice el código. El tribunal también rechazó este argumento, citando la falta de pruebas de plagio.

Sin embargo, el tribunal señaló un posible problema con el filtro de detección de duplicados de GitHub Copilot. Los usuarios pueden desactivar este filtro, que da advertencias de similitud de código. La desaprobación del tribunal sugiere que este aspecto requiere un escrutinio más cercano. Esto es una oportunidad para que los desarrolladores modifiquen y vuelvan a presentar sus quejas, centrándose más en este aspecto específico.

Las alegaciones restantes contra GitHub Copilot

Aunque el tribunal ha desestimado la mayoría de las reclamaciones, el caso no ha terminado. Dos alegaciones clave siguen en juego en la demanda colectiva de GitHub Copilot:

  • Una violación de la licencia de código abierto.
  • Una violación de la confianza entre GitHub y los proveedores de código abierto.

Estas reclamaciones critican a GitHub por utilizar código abierto de manera poco ética. Incluyen no reconocer el uso de datos públicos disponibles para entrenar a Copilot y no dar crédito a los codificadores originales. Como resultado, GitHub ha roto su acuerdo con sus socios.

Ambas partes también han discutido sobre la conducta de cada una durante el proceso de descubrimiento. Según los desarrolladores, los demandados no proporcionaron la información necesaria durante los procedimientos, como correos electrónicos relevantes. Esta acusación podría ser importante durante las etapas finales del caso.

¿Cuáles son las implicaciones más amplias de la demanda de GitHub Copilot?

Esta demanda en curso plantea preguntas sobre su impacto en el ecosistema de inteligencia artificial más amplio. Los resultados de estas alegaciones restantes probablemente sentarán precedentes para el uso de código abierto en el entrenamiento de IA.

El éxito de GitHub al desestimar muchas de las reclamaciones de la demanda probablemente animará a otras empresas a seguir utilizando la inteligencia artificial en el desarrollo de software. Según GitHub, las tecnologías de inteligencia artificial como Copilot ayudan a los usuarios a codificar de manera más eficiente, aumentando la productividad. Más y más empresas y desarrolladores buscarán lograr beneficios similares.

Este caso también ha aumentado la conciencia sobre las leyes de derechos de autor. Ha empoderado a los desarrolladores para que comprendan mejor sus derechos. Las empresas pueden utilizar nuevas políticas para asegurarse de que no violen las licencias de código abierto.

Por otro lado, esta mayor conciencia también puede aumentar la desconfianza de las herramientas de codificación de IA. Esta falta de confianza puede llevar a que los repositorios de código abierto sean menos extensos, ya que los desarrolladores retiren sus contribuciones. La falta de datos suficientes obstaculizará el aprendizaje efectivo del software de inteligencia artificial.

Los proyectos de código abierto también pueden revisar los términos de sus licencias para proporcionar directrices más explícitas sobre el uso de su código en el entrenamiento de IA. Pueden adoptar licencias más restrictivas para proteger sus contribuciones.

La sentencia tampoco exoneró completamente a GitHub Copilot, subrayando la necesidad de marcos regulatorios más comprehensivos. La reducción de las posibles reclamaciones de infracción de derechos de autor puede animar a las empresas de inteligencia artificial. Estas empresas pueden seguir utilizando código público disponible para fines de entrenamiento. Sin embargo, este caso también exige directrices más claras para prevenir el mal uso de los datos de código abierto.

La necesidad de leyes actualizadas

La demanda de Copilot ha puesto de relieve la cuestión de los derechos de autor del código generado por IA. Ha enfatizado la necesidad de leyes actualizadas para proteger los derechos de los desarrolladores originales.

Los marcos legales actuales no pueden manejar las complejidades introducidas por el contenido generado por IA. Como resultado, las autoridades deben actualizar las leyes para garantizar el cumplimiento.

Por ejemplo, establecer un umbral en el que la similitud de código más allá de un número determinado no sea permitida podría ayudar a proteger los derechos de los desarrolladores originales. Las autoridades también pueden hacer que la visualización de la fuente de los datos de entrenamiento sea obligatoria.

Además, las autoridades deben regular el código público para prevenir su uso no licenciado. Exigir auditorías regulares de las herramientas de IA y su salida es otra iniciativa viable.

Esta demanda aumentará el escrutinio del uso de código público en el entrenamiento de IA. A medida que las herramientas de codificación de IA evolucionen, también deben evolucionar las leyes para su uso. Esta práctica garantizará que la innovación no entre en conflicto con las normas éticas y legales.

Explora Unite.ai para obtener más recursos sobre GitHub y herramientas de codificación de IA.

Haziqa es una científica de datos con amplia experiencia en la escritura de contenido técnico para empresas de inteligencia artificial y SaaS.