Pemimpin pemikiran
Template Baru GPAI Komisi Eropa – Apa yang Dimaksud dengan Ini untuk Pelatihan AI?

Pada bulan Juli, Komisi Eropa (EC) merilis template baru general-purpose artificial intelligence (GPAI) . Ini berarti bahwa penyedia AI harus mengungkapkan konten yang dimasukkan ke dalam model untuk melatih mereka. Ini datang setelah berbulan-bulan dan berbulan-bulan headline tentang kreator yang mengklaim konten digunakan tanpa persetujuan untuk melatih AI.
Dengan template baru ini, Uni Eropa telah menjelaskan posisinya: transparansi sekarang tidak dapat dinegosiasikan. Pelatihan black box, di mana sesuatu dibuat tanpa mengungkapkan cara kerjanya, tidak akan menjadi pilihan bagi pengembang AI. Ini menandai perubahan signifikan karena operasi di Eropa sekarang akan memerlukan visibilitas penuh ke dalam input model dan provenance data pelatihan, memaksa re-evaluasi pengumpulan dan penggunaan data.
Banyak yang telah menunjukkan perbedaan yang mencolok antara ini dan rencana aksi AI AS yang baru dirilis , yang fokus berat pada deregulasi. Seperti dengan setiap hukum atau peraturan baru, bisnis sekarang harus mengambil stok dan menilai secara tepat bagaimana template GPAI akan mempengaruhi operasi.
Jika mereka beroperasi di seluruh wilayah, mereka akan melakukan hal yang sama dengan rencana aksi AI AS, yang lebih membingungkan. Karena sifat kompleks dari ini dan fakta bahwa mengatur pengembangan AI dengan cara ini adalah wilayah yang belum dipetakan, output oleh pengembang kemungkinan akan sangat berbeda.
Menganalisis Template Model AI Umum
Pada bulan Juli tahun ini, Komisi Eropa menerbitkan template wajib untuk penyedia GPAI sehingga mereka dapat menerbitkan ringkasan publik dari data yang digunakan untuk melatih model mereka. Sebagai bagian dari Undang-Undang AI UE, penyedia harus mengungkapkan kategori data seperti dataset yang tersedia secara publik, data lisensi pribadi, konten web yang diambil, data pengguna, dan data sintetis. Tujuannya adalah untuk memungkinkan pemegang hak cipta, pengguna, dan pengembang hilir untuk melaksanakan hak hukum mereka di bawah hukum UE.
GPT dilatih dengan jumlah data yang besar; namun, di pasar saat ini, terdapat informasi yang terbatas tentang asal data tersebut. Ringkasan publik yang ditetapkan oleh template ini akan memberikan gambaran komprehensif tentang data yang digunakan untuk melatih model, daftar koleksi data utama, dan menjelaskan sumber lain yang digunakan.
Bandikan dan Kontraskan, Rencana Aksi AI AS
Dalam perbandingan, AS sangat yakin bahwa mereka akan memenangkan perlombaan AI dan mempertahankan keunggulan kompetitif mereka atas Cina, karena administrasi Trump mengumumkan Rencana Aksi AI mereka lebih awal musim panas ini. Kerangka AI baru ini bertujuan untuk mempercepat pembangunan pusat data yang intensif energi yang memuat sistem AI dengan mempermudah peraturan lingkungan. Pada saat yang sama, mereka berusaha untuk meningkatkan ekspor global teknologi AI Amerika.
Rencana ini dibangun di sekitar tiga pilar inti – mempercepat inovasi, membangun infrastruktur AI Amerika, dan mempromosikan kepemimpinan dalam diplomasi dan keamanan AI internasional.
Sebagai bagian dari ini, poin kunci dari rencana yang disoroti adalah dorongan ‘sumber terbuka’ Amerika untuk memicu inovasi dan aksesibilitas. Serupa, rencana ini menyoroti bagaimana pemerintah AS akan ‘memimpin dengan contoh‘ ketika datang ke pertumbuhan AI – melalui pelatihan, pertukaran talenta, dan memperluas adopsi di seluruh industri.
Dengan rencana ini, AS bertujuan untuk menyederhanakan semua peraturan teknologi saat ini, terutama peraturan lingkungan, untuk memastikan legislasi tidak memperlambat pertumbuhan, sambil mendorong distribusi internasional yang lebih luas dari perangkat lunak dan perangkat keras AI AS. Pendekatan ‘anti-regulasi’ ini menandai perubahan yang jelas dari kerangka sebelumnya yang berfokus pada etika, transparansi, dan inovasi yang bertanggung jawab – alih-alih bergerak menuju rencana aksi ‘inovasi pertama’ yang lebih agresif.
Potongan yang Hilang
Sangatlah berharga untuk mengambil langkah mundur pada tahap ini dan mempertimbangkan apakah tindakan ini, meskipun berbeda, dapat menderita dari kelemahan yang sama yang akan menyebabkan pengembang melihat kurangnya nilai dalam mematuhinya. Pendekatan UE dan AS meninggalkan celah kritis sekitar properti intelektual dalam dataset pelatihan AI. Undang-Undang AI UE mengharuskan ringkasan data pelatihan dan kebijakan kepatuhan hak cipta, tetapi tidak menetapkan kerangka yang dapat diskalakan untuk mengidentifikasi atau melisensikan karya berhak cipta.
Di AS, tidak ada aturan khusus – meninggalkan perusahaan AI untuk menavigasi kerangka hukum yang berkembang yang dibentuk oleh putusan pengadilan dan sengketa yang sedang berlangsung dengan pemegang hak. Di luar teks hukum, apa yang hilang adalah sisi praktis; tidak satu pun dari pendekatan ini menetapkan metode yang dapat digunakan secara luas di industri untuk mendeteksi konten yang dilindungi, memverifikasi penggunaan yang sah, atau menyederhanakan lisensi. Sampai solusi tersebut didefinisikan, ketidakpastian sekitar hak cipta dalam pelatihan AI akan tetap menjadi tantangan signifikan bagi industri.
Biaya Tersembunyi dari Bisnis yang Mengabaikan Pelacakan AI
Meskipun beberapa kelemahan dalam peraturan ini, akan diasumsikan bahwa mereka akan menyebabkan pengembang AI menjadi sangat fokus pada bagaimana cara tetap mengapung dari perspektif hukum – tetapi ini tidak selalu terjadi. Faktanya, perbedaan nyata dalam AI saat ini bukanlah antara peraturan UE dan AS, tetapi antara perusahaan yang berinvestasi dalam pelacakan hari ini dan mereka yang berjudi bahwa mereka tidak perlu. Ini adalah pengulangan dari apa yang kita lihat beberapa tahun yang lalu dengan implementasi Peraturan Perlindungan Data Umum (GDPR) – perusahaan yang membangun privasi-by-design awal tidak hanya menghindari denda tetapi juga mendapatkan kepercayaan konsumen dan akses yang lebih lancar ke pasar lain yang kemudian meniru standar GDPR.
Polanya yang sama mungkin muncul dengan AI. Pelacakan data pelatihan dan keputusan model akan kemungkinan besar menjadi baseline global, dan perusahaan yang menunda akan harus merancang ulang sistem mereka di masa depan. Kembali untuk menambahkan dokumentasi, pelacakan provenance, dan fitur audit ke sistem yang ada jauh lebih mahal dan kompleks daripada membangunnya dari awal, mengalihkan fokus dari pembangunan yang lebih fokus pada ROI yang diinginkan perusahaan.
Dengan kata lain, pelacakan dan transparansi bukanlah tambahan opsional; mereka harus disematkan ke dalam sistem AI dari hari pertama. Bisnis yang memperlakukan mereka sebagai hal yang tidak penting berisiko menghambat inovasi, menghadapi reaksi regulasi, dan kehilangan perlombaan secara permanen.
AI Etis Membutuhkan Kesatuan Global
Dari perspektif makro, pendekatan yang berbeda ini menciptakan masalah nyata bagi bisnis global. Perusahaan di pasar yang lebih longgar seperti AS dapat berkembang lebih cepat dalam jangka pendek, tetapi ketika mereka memutuskan untuk memasuki UE, mereka menghadapi tembok kepatuhan: aturan jejak dan dokumentasi Undang-Undang AI mengharuskan kemampuan yang tidak pernah mereka bangun.
Merancang ulang pelacakan provenance, dokumentasi, dan fitur audit ke dalam sistem yang ada sangat mahal, lambat, dan mengganggu, terutama karena pelacakan adalah salah satu bagian paling intensif sumber daya dari kepatuhan. Ini adalah pola yang sama yang kita lihat dengan GDPR, di mana mereka yang terlambat dalam desain privasi-by-design berjuang dengan perbaikan yang mahal dan akses pasar yang tertunda, sementara pelopor awal mendapatkan keunggulan yang langgeng.












