AGI
Apakah GPT-4 Melompat Maju Menuju Mencapai AGI?

Microsoft baru-baru ini merilis sebuah makalah penelitian berjudul: Sparks of Artificial General Intelligence: Early experiments with GPT-4. Seperti yang dijelaskan oleh Microsoft:
Makalah ini menginvestigasi versi awal GPT-4, ketika itu masih dalam pengembangan aktif oleh OpenAI. Kami berpendapat bahwa (versi awal ini) GPT-4 adalah bagian dari kohort baru LLM (bersama dengan ChatGPT dan Google’s PaLM, misalnya) yang menunjukkan kecerdasan umum lebih besar daripada model AI sebelumnya.
Dalam makalah ini, ada bukti yang konklusif yang menunjukkan bahwa GPT-4 melampaui memorisasi, dan bahwa itu memiliki pemahaman yang dalam dan fleksibel tentang konsep, keterampilan, dan domain. Bahkan, kemampuannya untuk menggeneralisasi melampaui kemampuan manusia hidup hari ini.
Kami sebelumnya telah membahas manfaat AGI, kita harus merangkum konsensus umum tentang apa itu sistem AGI. Pada dasarnya, AGI adalah jenis AI maju yang dapat menggeneralisasi di seluruh domain dan tidak terbatas pada ruang lingkup tertentu. Contoh AI sempit termasuk kendaraan otonom, chatbot, bot catur, atau AI lain yang dirancang untuk tujuan tunggal.
AGI, di sisi lain, dapat dengan fleksibel berganti antara bidang apa pun di atas atau bidang keahlian lainnya. Ini adalah AI yang akan mengambil keuntungan dari algoritma baru seperti transfer learning, dan pembelajaran evolusioner, sambil juga mengeksploitasi algoritma warisan seperti deep reinforcement learning.
Deskripsi AGI di atas sesuai dengan pengalaman pribadi saya menggunakan GPT-4, serta bukti yang dibagikan dalam makalah penelitian yang dirilis oleh Microsoft.
Salah satu prompt yang diuraikan dalam makalah adalah untuk GPT-4 menulis bukti tentang ketakterhinggaan prima dalam bentuk puisi.

Jika kita menganalisis persyaratan untuk membuat puisi seperti itu, kita menyadari bahwa itu memerlukan penalaran matematika, ekspresi puisi, dan generasi bahasa alami. Ini adalah tantangan yang akan melampaui kemampuan rata-rata manusia.
Makalah tersebut ingin memahami apakah GPT-4 hanya menghasilkan konten berdasarkan memorisasi umum atau memahami konteks dan dapat bernalar. Ketika diminta untuk merekreasikan puisi dalam gaya Shakespeare, itu dapat melakukannya. Ini memerlukan tingkat pemahaman yang multifaset yang melampaui kemampuan populasi umum dan termasuk teori pikiran dan kejeniusan matematika.
Bagaimana Menghitung Kecerdasan GPT-4?
Pertanyaan kemudian menjadi bagaimana kita dapat mengukur kecerdasan LLM? Dan apakah GPT-4 menampilkan perilaku pembelajaran sejati atau hanya memorisasi?
Cara saat ini untuk menguji sistem AI adalah dengan mengevaluasi sistem pada serangkaian dataset benchmark standar, dan untuk memastikan bahwa mereka independen dari data pelatihan dan bahwa mereka mencakup berbagai tugas dan domain. Pengujian jenis ini hampir mustahil karena kuantitas data yang hampir tak terbatas yang GPT-4 pelajari.
Makalah tersebut membahas tentang menghasilkan tugas/pertanyaan baru dan sulit yang secara meyakinkan menunjukkan bahwa GPT-4 melampaui memorisasi, dan bahwa itu memiliki pemahaman yang dalam dan fleksibel tentang konsep, keterampilan, dan domain.
Ketika datang ke kecerdasan, GPT-4 dapat menghasilkan cerita pendek, naskah, dan dapat menghitung rumus yang paling rumit.
GPT-4 juga dapat mengkode dengan tingkat yang sangat tinggi, baik dalam hal menulis kode dari instruksi dan memahami kode yang ada. GPT-4 dapat menangani berbagai tugas pengkodean, dari tantangan pengkodean hingga aplikasi dunia nyata, dari perakitan tingkat rendah hingga kerangka kerja tingkat tinggi, dari struktur data sederhana hingga program yang kompleks seperti permainan. GPT-4 juga dapat bernalar tentang eksekusi kode, mensimulasikan efek instruksi, dan menjelaskan hasilnya dalam bahasa alami. GPT-4 bahkan dapat mengeksekusi pseudocode,
GPT-4 dapat menawarkan respons rasional hampir untuk setiap prompt yang diberikan. Bahkan, kecerdasannya hampir tak terkalahkan dalam kompleksitasnya.
Batasan GPT-4
Makalah tersebut kemudian melanjutkan untuk menjelaskan bagaimana mereka menyelidiki respons dan perilaku GPT-4, untuk memverifikasi konsistensi, koherensi, dan kebenarannya, dan untuk mengungkap batasannya dan biasnya.
Batasan yang paling jelas adalah kecenderungannya untuk mengalami halusinasi. Berikut adalah contoh halusinasi yang diberikan dalam makalah di mana GPT-4 yakin dengan jawabannya yang sepenuhnya salah.

Tampaknya bahkan GPT-4 memahami batasan saat ini dengan halusinasi karena ini adalah respons yang diberikan ketika saya bertanya apa itu halusinasi GPT:
Halusinasi GPT mengacu pada fenomena di mana model Generative Pre-trained Transformer (GPT) seperti yang Anda gunakan saat ini, menghasilkan respons yang tidak didasarkan pada informasi faktual atau tidak konsisten dengan konteks yang diberikan. Halusinasi ini terjadi ketika model menghasilkan teks yang mungkin tampak masuk akal tetapi sebenarnya salah, menyesatkan, atau tidak masuk akal.
Dengan kata lain, ketika Anda melatih LLM AI pada data dunia, bagaimana Anda menghindari sistem yang belajar data yang salah? LLM besar yang belajar dan mengeluarkan informasi yang salah, dan teori konspirasi bisa menjadi salah satu bahaya terbesar dan ancaman yang dihadapi oleh kemanusiaan dengan adopsi LLM skala besar. Ini bisa menjadi salah satu ancaman terbesar dari AGI, yang secara mengejutkan terlewatkan ketika membahas bahaya AGI.
Bukti Kecerdasan GPT-4
Makalah tersebut mengilustrasikan bahwa tidak peduli jenis prompt kompleks apa yang diarahkan kepadanya, GPT-4 akan melampaui harapan. Seperti yang dinyatakan dalam makalah:
Kemampuan tak tertandinginya dalam bahasa alami. Ini tidak hanya dapat menghasilkan teks yang lancar dan kohatif, tetapi juga memahami dan memanipulasi teks dengan berbagai cara, seperti meringkas, menerjemahkan, atau menjawab set pertanyaan yang sangat luas. Selain itu, dengan menerjemahkan, kami maksudkan tidak hanya antara bahasa alami yang berbeda tetapi juga terjemahan dalam nada dan gaya, serta di seluruh domain seperti kedokteran, hukum, akuntansi, pemrograman komputer, musik, dan banyak lagi.
Ulasan teknis palsu diberikan kepada GPT-4, itu dengan mudah lulus, yang berarti dalam konteks ini jika ini adalah manusia di ujung lain bahwa mereka akan langsung dipekerjakan sebagai insinyur perangkat lunak. Tes awal serupa dari kompetensi GPT-4 pada Multistate Bar Exam menunjukkan akurasi di atas 70%. Ini berarti bahwa di masa depan kita bisa mengotomatisasi banyak tugas yang saat ini diberikan kepada pengacara. Bahkan, ada beberapa startup yang saat ini bekerja untuk membuat pengacara robot menggunakan GPT-4.
Menghasilkan Pengetahuan Baru
Salah satu argumen dalam makalah adalah bahwa satu-satunya hal yang tersisa untuk GPT-4 untuk membuktikan tingkat pemahaman yang sebenarnya adalah untuk menghasilkan pengetahuan baru, seperti membuktikan teorema matematika baru, yang saat ini masih tidak dapat dilakukan oleh LLM.
Namun, ini adalah tujuan suci dari AGI. Sementara ada bahaya dengan AGI yang dikendalikan oleh tangan yang salah, manfaat dari AGI yang dapat menganalisis semua data sejarah untuk menemukan teorema, obat, dan pengobatan baru hampir tak terbatas.
AGI bisa menjadi kunci yang hilang untuk menemukan obat untuk penyakit genetik langka yang saat ini kekurangan pendanaan industri swasta, untuk menyembuhkan kanker sekali dan untuk all, dan untuk memaksimalkan efisiensi energi terbarukan untuk menghilangkan ketergantungan kita pada energi yang tidak berkelanjutan. Bahkan, itu bisa menyelesaikan setiap masalah konsekuensial yang dimasukkan ke dalam sistem AGI. Ini adalah apa yang dipahami oleh Sam Altman dan tim di OpenAI, AGI adalah penemuan terakhir yang dibutuhkan untuk menyelesaikan sebagian besar masalah dan untuk memberi manfaat kepada kemanusiaan.
Tentu saja, itu tidak menyelesaikan masalah tombol nuklir tentang siapa yang mengendalikan AGI, dan apa niat mereka. Terlepas dari itu, makalah ini melakukan pekerjaan yang luar biasa dalam membuktikan bahwa GPT-4 adalah lompatan maju menuju mencapai impian peneliti AI yang telah ada sejak 1956, ketika proyek penelitian musim panas Dartmouth tentang Kecerdasan Buatan pertama kali diluncurkan.
Sementara itu dapat diperdebatkan apakah GPT-4 adalah AGI, itu dapat dengan mudah diperdebatkan bahwa untuk pertama kalinya dalam sejarah manusia, ini adalah sistem AI yang dapat lulus Tes Turing.












