Rekayasa Cepat

Menjelajahi Penerjemah Kode ChatGPT OpenAI: Menyelam Jauh ke dalam Kemampuannya

Updated on 21 Agustus 2023

Aayush Mittal

Kemajuan OpenAI dalam Pemrosesan Bahasa Alami (NLP) ditandai dengan munculnya Model Bahasa Besar (LLM), yang mendukung produk yang digunakan oleh jutaan orang, termasuk asisten pengkodean GitHub Copilot dan mesin pencari Bing. Model-model ini, melalui kemampuan uniknya dalam menghafal dan menggabungkan informasi, telah menetapkan tolok ukur yang tak tertandingi dalam tugas-tugas seperti pembuatan kode dan teks.

Memahami Penerjemah Kode ChatGPT

Untuk memahami pentingnya Penerjemah Kode ChatGPT, penting untuk terlebih dahulu memahami apa itu dan bagaimana itu dibuat.

Intinya, Penerjemah Kode ChatGPT memanfaatkan kemampuan ChatGPT tetapi memperkenalkan kemahiran yang ditingkatkan dalam memahami, menafsirkan, dan bahkan menghasilkan kode di berbagai bahasa pemrograman. Fitur ini mengubah ChatGPT dari pembuat teks menjadi alat yang sangat berharga bagi pengembang, membantu dalam pemahaman kode, debugging, dan bahkan pembuatan kode.

Melatih GPT untuk Pengkodean: Pendekatan Codex

Kedua Kopilot GitHub dan Penerjemah Kode ChatGPT memanfaatkan Model kodeks dikembangkan oleh Open AI.

Codex, model bahasa GPT khusus, direkayasa untuk memiliki kemampuan penulisan kode Python yang mahir. Dilatih dengan kode yang bersumber secara publik dari GitHub, Codex menunjukkan potensinya dengan memperkuat fitur-fitur di GitHub Copilot. Ketika dinilai kemampuannya untuk mensintesis program dari dokumen, ukuran kebenaran fungsional, Codex mengungguli keduanya GPT-3 dan GPT-J.

Pengamatan yang mencolok adalah bahwa pengambilan sampel berulang meningkatkan kemahiran Codex. Ketika hingga 100 sampel per masalah digunakan, tingkat keberhasilan model meningkat menjadi 70.2%. Efisiensi seperti itu menunjukkan kemungkinan penggunaan peringkat heuristik untuk memilih sampel kode yang akurat, tanpa memerlukan evaluasi penuh untuk masing-masing sampel.

Untuk mengevaluasi kemampuannya, model ditugaskan untuk membuat fungsi Python mandiri hanya berdasarkan docstring. Keakuratan kode yang dihasilkan kemudian diukur menggunakan pengujian unit. Dalam kumpulan data yang terdiri dari 164 masalah pemrograman asli, yang mencakup pemahaman bahasa, algoritme, dan tes matematika dasar, Codex dengan parameter 12B dipecahkan 28.8% dari mereka pada upaya tunggal.

Data Pelatihan untuk Model Codex - penerjemah kode chatgpt

Data Pelatihan untuk Model Codex: https://arxiv.org/abs/2107.03374

Dengan mengasah model lebih lanjut melalui penyempurnaan fungsi mandiri yang diimplementasikan dengan benar, efisiensinya ditingkatkan, menghasilkan penyelesaian Codex-S 37.7% tantangan pada percobaan pertama. Namun, dalam dunia praktis pemrograman, pendekatan trial-and-error adalah hal yang umum. Meniru skenario dunia nyata ini, model Codex-S, ketika diberi 100 peluang, berhasil ditangani 77.5% dari tantangan.

Model generatif seperti ChatGPT yang menghasilkan kode biasanya dinilai dengan membandingkan sampel yang dihasilkan dengan solusi referensi. Perbandingan ini bisa tepat atau menggunakan ukuran kesamaan seperti skor BLEU. Namun, metrik berbasis pencocokan ini sering kali gagal memahami nuansa pengkodean. Kritik utama BLEU adalah ketidakefektifannya dalam menangkap karakteristik semantik kode.

Alih-alih hanya mengandalkan pencocokan, ukuran yang lebih relevan telah diusulkan: kebenaran fungsional. Ini berarti bahwa kode yang dihasilkan oleh model harus lulus serangkaian pengujian unit tertentu. Idenya selaras dengan praktik pengkodean standar, karena pengembang sering menggunakan pengujian unit untuk mengukur kemanjuran dan keakuratan kode mereka.

Metrik ini tidak hanya mengevaluasi keakuratan, tetapi kegunaan fungsional dari kode yang dihasilkan.

lulus@k metrik diperkenalkan sebagai ukuran kebenaran fungsional. Ini pada dasarnya berarti bahwa jika salah satu dari sampel kode “k” yang dihasilkan lulus pengujian unit, masalahnya dianggap terpecahkan. Namun, daripada hanya menggunakan ini dalam bentuk langsungnya, estimator yang tidak bias digunakan untuk menghitung pass@k untuk menghindari varians yang tinggi.

Untuk menilai kemampuan kode ChatGPT, penelitian menggunakan Evaluasi Manusia Himpunan data. Kumpulan data ini terdiri dari masalah Python yang ditulis tangan, masing-masing disertai dengan pengujian unit.

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Mengingat risiko yang terkait dengan menjalankan kode yang tidak dikenal atau tidak tepercaya, lingkungan kotak pasir dirancang untuk menguji kode yang dihasilkan dengan aman. Lingkungan ini digunakan gVisor untuk meniru sumber daya dan membuat penghalang antara sistem host dan kode yang sedang berjalan. Jadi, bahkan jika model tersebut menghasilkan kode berbahaya, itu tetap terkandung dan tidak dapat membahayakan host atau jaringan.

Menggunakan Penerjemah Kode ChatGPT

ChatGPT OpenAI telah mengalami banyak evolusi, dengan Code Interpreter menonjol sebagai fitur revolusioner dalam Model GPT-4. Tidak seperti antarmuka obrolan tradisional, Code Interpreter memungkinkan pengguna menyelam lebih dalam ke tugas komputasi, dengan mulus memadukan garis antara percakapan manusia-AI dan proses komputasi.

Pada intinya, Code Interpreter mirip dengan komputer yang disematkan di dalam chatbot. Fitur dinamis ini menawarkan ruang disk sementara kepada pengguna untuk mengunggah sejumlah besar format file mulai dari jenis umum seperti TXT, PDF, dan JPEG hingga yang lebih khusus seperti CPP, PY, dan SQLite. Luasnya dukungan ini memperkuat keserbagunaannya di berbagai tugas, baik itu pemrosesan dokumen atau manipulasi gambar.

Beroperasi dalam kerangka kerja yang kuat dan aman, Code Interpreter dilengkapi dengan lebih dari 300 pustaka pra-instal. Lingkungan kotak pasir ini memastikan keamanan sambil tetap memberikan daya komputasi yang besar. Menariknya, saat ditugaskan, ia membuat skrip Python secara real-time untuk mengeksekusi permintaan pengguna. Ambil contoh, mengonversi PDF berbasis gambar ke format yang dapat dicari menggunakan OCR; yang perlu dilakukan pengguna hanyalah mengunggah dokumen, dan ChatGPT menangani sisanya.

Hal yang menarik adalah batas ukuran file untuk unggahan. Sementara spesifikasi definitif belum diumumkan, percobaan pengguna menunjukkan sistem dapat secara efektif memproses file yang jauh lebih besar dari 100MB. Terlepas dari ukurannya, penting untuk dicatat bahwa file-file ini bersifat sementara, dibuang setelah sesi obrolan selesai.

Kecemerlangan Code Interpreter bukan hanya kecakapan teknisnya, tetapi juga aksesibilitasnya. OpenAI menawarkan fitur ini kepada pelanggan ChatGPT Plus, yang hadir dengan model GPT-4. Dengan demikian, alat transformatif ini tidak hanya untuk elit teknologi tetapi secara bertahap dapat diakses oleh khalayak yang lebih luas.

Perbedaan antara model ChatGPT standar dan Code Interpreter terletak pada paradigma interaksinya. Sementara yang pertama menghasilkan tanggapan tekstual, yang terakhir memahami dan mengeksekusi kode, menawarkan hasil langsung. Ini tidak hanya menjadikannya aset berharga bagi para profesional teknologi, tetapi juga memberdayakan mereka yang tidak memiliki pengetahuan pengkodean untuk melakukan tugas komputasi yang kompleks.

Kemampuan ChatGPT Code Interpreter dapat merevolusi beberapa aspek Pengembangan Perangkat Lunak dan Ilmu Data:

Pembuatan Kode Otomatis: Untuk aplikasi perangkat lunak dan skrip analitik data, dengan deskripsi tingkat tinggi, sistem dapat menghasilkan struktur boilerplate atau potongan kode yang rumit, mempercepat proses pengembangan dan analisis data.
Tinjauan Kode dan Validasi Data: Alat berbasis AI seperti ChatGPT dapat membantu meningkatkan kualitas dan keamanan basis kode perangkat lunak. Selain itu, di ranah ilmu data, alat tersebut dapat berperan penting dalam meninjau dan memvalidasi skrip pemrosesan dan transformasi data, memastikan akurasi dan efisiensi.
Pendampingan Analisis Data: Untuk ilmuwan data, Penerjemah Kode ChatGPT dapat membantu menghasilkan kode untuk eksplorasi data awal, visualisasi, dan bahkan uji statistik dasar, sehingga memudahkan alur kerja analisis data.

Jika Anda tertarik untuk menemukan lebih banyak tentang seluk-beluk ChatGPT dan rekayasa yang cepat, AI Unite menawarkan perincian komprehensif dalam 'ChatGPT: Rekayasa Cepat Tingkat Lanjut'.

Menyiapkan Penerjemah Kode ChatGPT

Integrasi Code Interpreter memungkinkan platform untuk menginterpretasikan permintaan pengguna, mengeksekusinya sebagai kode Python, dan menampilkan hasil dalam format obrolan interaktif. Untuk mengakses fitur ini, pengguna dapat menavigasi ke ChatGPT pengaturan, jelajahi bagian fitur Beta, dan aktifkan Code Interpreter.

Yang membedakannya adalah mekanismenya yang transparan. Saat pengguna meminta tugas, platform membuka setiap langkah perjalanan pemrosesan, menawarkan kejelasan tentang bagaimana perintah ditafsirkan dan dijalankan. Yang penting, untuk alasan privasi dan keamanan, Penerjemah Kode beroperasi tanpa konektivitas internet apa pun.

Menjelajahi Manfaat Penerjemah Kode ChatGPT

Visualisasi data & Sampel

ChatGPT melampaui cakupan bagan tradisional, menawarkan representasi grafis konvensional dan inovatif. Ini memastikan pengguna dapat melihat data mereka dalam format yang memberikan wawasan paling bermakna.

Namun, ini bukan hanya tentang memvisualisasikan data mentah. Model ChatGPT mahir dalam memproses dan menyempurnakan data. Meskipun kuat, pengguna harus berhati-hati.

Analis keuangan akan menemukan kemampuan Code Interpreter untuk menganalisis dan memvisualisasikan harga saham sangat berguna. Melalui integrasi tanpa batas, pengguna dapat mengunggah kumpulan data dan memvisualisasikannya dalam berbagai format. Signifikansi fungsi ini terbukti ketika individu dapat melakukan analisis data yang kompleks.

Video di bawah ini menunjukkan bagaimana penerjemah kode ChatGPT membuat komprehensif TSLA analisis saham.

Pengambilan Kunci:

Saham Tesla menghadapi volatilitas tetapi juga menunjukkan ketahanan dengan periode pertumbuhan.
Volume perdagangan yang tinggi pada hari-hari tertentu menunjukkan minat pasar yang signifikan atau reaksi terhadap peristiwa penting.
Pengembalian Year-to-Date (YTD) ke bawah menunjukkan bahwa investor harus menganalisis faktor internal perusahaan dan kondisi pasar eksternal ketika mempertimbangkan investasi masa depan.

Menerapkan Computer Vision dan OCR

Deteksi wajah, fungsi penting dalam visi komputer, didekati dengan teknik klasik: the pengklasifikasi Haar Cascade dari OpenCV.

Gambar di bawah menampilkan penggunaan classifier Haar Cascade klasik.

Proses mengekstraksi teks dari gambar, yang dikenal sebagai optical character recognition (OCR), dicapai dengan mulus menggunakan Tesseract, dengan teks yang selanjutnya disusun oleh GPT-4, meningkatkan pemahaman.

Dalam video berikut, lihat bagaimana Tesseract (OCR) mengekstrak teks dari gambar sertifikat.

Code Interpreter unggul dalam bidang manipulasi video, audio, dan gambar. Dengan perintah langsung, pengguna dapat melakukan pengeditan mendetail, seperti mengonversi GIF menjadi MP4 dengan peningkatan khusus. Cukup unggah file Anda, masukkan modifikasi yang Anda inginkan, dan saksikan keajaiban terjadi.

Perpustakaan Eksternal Python di dalam Penerjemah Kode ChatGPT Anda

Penerjemah Kode ChatGPT adalah platform pemrograman dinamis yang dilengkapi dengan serangkaian pustaka Python yang ekstensif. Ini mencakup semuanya, mulai dari visualisasi data dengan Seaborn hingga pembelajaran mesin tingkat lanjut melalui Torch. Tapi ini lebih dari sekedar perangkat statis.

Terinspirasi oleh ini halaman chatgpt dari Korakot Chaovavanich.

Mulai dari yang terbaru rilis nltk, kami mengunggah file .whl ke Interpreter. Kami kemudian menginstruksikan ChatGPT untuk menemukan direktori paket situs yang sesuai dengan menganalisis lokasi paket yang ada. Langkah selanjutnya melibatkan membongkar file roda ke tempat sementara dan memindahkan file ke direktori paket situs yang diidentifikasi. Namun, ini menemui hambatan.

Mencari solusi, kami meminta: "Mohon pastikan NLTK terinstal di lingkungan Python dan dapat diakses setelah instalasi."

ChatGPT merespons, memberikan solusi. Disarankan untuk menambahkan direktori sementara ke sys.path, memungkinkan Python untuk mengidentifikasi dan menarik modul dari paket nltk yang telah dibongkar di dalam lokasi tersebut. Taktik ini bekerja dengan sangat baik, yang mengarah pada keberhasilan pemasangan NLTK.

Melalui penggunaan file .whl, penginstalan menampilkan perpaduan antara kecerdikan dan kemampuan beradaptasi. Penerjemah Kode ChatGPT, terlepas dari tantangan awal, mewujudkan keserbagunaan dan komitmennya untuk mengakomodasi kebutuhan pembuat kode, memastikan baik pemula maupun veteran akan pengalaman pengkodean yang disempurnakan.

Dalam pameran menarik tentang kemampuan juru bahasa, tweet baru-baru ini oleh @DominikPeters menyoroti demonstrasi unik. Peters meminta GPT-4 untuk membuat kuis di arondisemen Paris, dan model tersebut menghasilkan situs web yang berfungsi dengan baik. Kuis yang berfungsi tersedia untuk pengalaman langsung di dominik-peters.de/gpt-arrondissement-quiz/.

Meminta GPT-4 untuk memberi saya kode kuis arondisemen Paris, itu berhasil di luar kotak. https://t.co/Uhv7tPLspq pic.twitter.com/3agFZllEEQ

— Dominik Peters (@DominikPeters) 30 April, 2023

Wrapping Up

Terobosan OpenAI dengan ChatGPT Code Interpreter tidak lain adalah transformasional bagi pembuat kode dan non-pembuat kode. Keserbagunaannya dalam menangani berbagai tugas—mulai dari membantu pengembang dalam proses debug hingga membuat kuis Paris dengan mudah—merupakan bukti potensi AI yang tak terbatas dalam meningkatkan pengalaman digital kami. Inilah esensi suling dari penyelaman mendalam kami:

Pahami Alat Anda: Sama seperti Anda akan berteman dengan kolega, berkenalanlah dengan Code Interpreter. Ini dirancang di atas Codex, yang disempurnakan dari GPT-4. Kemahirannya mencakup berbagai bahasa pemrograman, menjadikannya pendamping yang ideal untuk semua petualangan pengkodean Anda.

Rangkullah Revolusi AI: Praktik pengkodean tradisional akan mengalami pergeseran seismik. Dengan alat berbasis AI seperti Penerjemah Kode ChatGPT, tugas seperti identifikasi bug, pembuatan kode, dan bahkan tinjauan kode dapat dipercepat.

Di luar Hanya Kode: Serangan Interpreter tidak terbatas pada teks atau kode. Kemampuannya untuk menangani berbagai format file, dari file TXT sederhana hingga skrip PY yang rumit, menggarisbawahi kegunaannya di berbagai domain.

Jangan Pernah Berhenti Bereksperimen: Eksplorasi kami dengan instalasi perpustakaan NLTK mencerminkan pentingnya kegigihan dan kemampuan beradaptasi, nilai-nilai yang diwujudkan oleh Code Interpreter. Jika ada hambatan, sering kali ada jalan keluarnya.

Bergabunglah dengan Percakapan AI: Aplikasi dunia nyata, seperti yang dipamerkan oleh kuis arondisemen Paris, menggarisbawahi utilitas dunia nyata yang sangat besar dari alat tersebut. Rangkullah, jelajahi, dan biarkan itu memperkuat proyek Anda.

Video di atas dibuat menggunakan Jan-2 dan tengah perjalanan.

Singkatnya, Penerjemah Kode ChatGPT lebih dari sekadar alat; itu mengubah cara kita terhubung dengan teknologi. Untuk inovator dan penggemar, ini menjanjikan dunia yang penuh dengan potensi pengkodean.

Berikutnya

20 Perintah ChatGPT Terbaik untuk Media Sosial (Juli 2025)

Jangan Miss

Zero to Advanced Prompt Engineering dengan Langchain di Python