stub OpenAI-ийн ChatGPT кодын орчуулагчийг судлах нь: түүний чадавхыг гүнзгий судлах - Unite.AI
бидэнтэй хамт холбоно

Шуурхай инженерчлэл

OpenAI-ийн ChatGPT кодын орчуулагчийг судлах нь: Түүний чадавхид гүнзгий шумбах

mm
шинэчлэгдсэн on

Natural Language Processing (NLP) дэх OpenAI дэвшлүүд нь GitHub Copilot кодчиллын туслах болон Bing хайлтын систем зэрэг сая сая хүмүүсийн ашигладаг бүтээгдэхүүнүүдийн үндэс суурь болох Том хэлний загварууд (LLMs) нэмэгдэж байгаагаар тэмдэглэгдсэн. Эдгээр загварууд нь мэдээллийг цээжлэх, нэгтгэх өвөрмөц чадвараараа код, текст үүсгэх зэрэг даалгавруудад хосгүй жишиг тогтоосон.

ChatGPT-ийн Кодын орчуулагчийг ойлгох

ChatGPT кодын орчуулагчийн ач холбогдлыг ойлгохын тулд эхлээд энэ нь юу болох, хэрхэн бүтээгдсэнийг ойлгох нь чухал юм.

Нэг ёсондоо ChatGPT кодын орчуулагч нь ChatGPT-ийн чадавхийг ашигладаг боловч олон тооны програмчлалын хэлээр кодыг ойлгох, тайлбарлах, бүр код үүсгэх чадварыг дээшлүүлдэг. Энэ функц нь ChatGPT-ийг текст үүсгэгчээс хөгжүүлэгчдэд үнэлж баршгүй хэрэгсэл болгон хувиргаж, кодыг ойлгох, дибаг хийх, тэр ч байтугай код үүсгэхэд тусалдаг.

Кодчлоход зориулсан GPT сургалт: Codex Approach

аль аль нь GitHub туслах нисгэгч болон ChatGPT-ийн код орчуулагч -г ашиглах Codex загвар OpenAI боловсруулсан.

Codex, тусгай GPT хэлний загвар нь Python код бичих чадвартай байхаар бүтээгдсэн. GitHub-аас олон нийтэд нээлттэй кодоор бэлтгэгдсэн Codex нь GitHub Copilot дахь функцуудыг идэвхжүүлснээр боломжоо харуулдаг. Үйл ажиллагааны зөв байдлын хэмжүүр болох docstrings программыг нэгтгэх чадварыг үнэлвэл Codex нь хоёуланг нь давж гардаг. GPT-3 болон GPT-J.

Давтан түүвэрлэх нь Codex-ийн ур чадварыг дээшлүүлдэг нь гайхалтай ажиглалт юм. Нэг асуудалд 100 хүртэлх дээж ашиглахад загварын амжилтын түвшин хүртэл нэмэгддэг 70.2%. Ийм үр ашиг нь эвристик зэрэглэлийг ашиглан кодын үнэн зөв түүврийг сонгох боломжтой бөгөөд тус бүрт бүрэн үнэлгээ хийх шаардлагагүй болно.

Өөрийн чадавхийг үнэлэхийн тулд загвар нь зөвхөн docstrings дээр суурилсан бие даасан Python функцийг үүсгэх даалгавар авсан. Дараа нь үүсгэсэн кодын нарийвчлалыг нэгжийн туршилтыг ашиглан хэмжсэн. Хэлний ойлголт, алгоритм, математикийн үндсэн тестүүдийг багтаасан 164 програмчлалын анхны бодлого бүхий өгөгдлийн багцад 12B параметр бүхий Codex-ийг шийдсэн. 28.8% Тэдний нэг оролдлого.

Codex загварт зориулсан сургалтын өгөгдөл - chatgpt код тайлбарлагч

Codex загварт зориулсан сургалтын өгөгдөл: https://arxiv.org/abs/2107.03374

Зөв хэрэгжсэн бие даасан функцуудыг нарийн тохируулах замаар загварыг улам боловсронгуй болгосноор түүний үр ашгийг дээшлүүлж, Codex-S шийдлийг бий болгосон. 37.7% Эхний оролдлогын сорилтууд. Гэсэн хэдий ч програмчлалын практик салбарт туршилт, алдааны арга түгээмэл байдаг. Энэхүү бодит хувилбарыг дуурайсан Codex-S загварт 100 боломж олгосноор амжилттай шийдэгдсэн. 77.5% сорилтуудын талаар.

Chatgpt нарийн тааруулсан архитектур

Код гаргадаг ChatGPT зэрэг үүсгэгч загваруудыг ихэвчлэн үүсгэсэн дээжийг лавлагаа шийдэлтэй харьцуулах замаар үнэлдэг. Энэ харьцуулалт нь яг нарийн байж болно, эсвэл BLEU оноо гэх мэт ижил төстэй байдлын хэмжүүрийг ашиглаж болно. Гэсэн хэдий ч эдгээр тохиролд суурилсан хэмжигдэхүүнүүд нь ихэвчлэн кодчиллын нарийн ширийн зүйлийг ойлгодоггүй. BLEU-ийн гол шүүмжлэл бол кодын семантик шинж чанарыг олж авах чадваргүй байдал юм.

Зөвхөн тохироход найдахын оронд илүү хамааралтай хэмжүүрийг санал болгосон: үйл ажиллагааны зөв байдал. Энэ нь загвараас гаргаж авсан код нь тухайн нэгжийн туршилтыг давах ёстой гэсэн үг юм. Хөгжүүлэгчид кодын үр ашиг, нарийвчлалыг хэмжихийн тулд нэгж тестийг ихэвчлэн ашигладаг тул энэ санаа нь стандарт кодчилолтой нийцдэг.

Энэ хэмжигдэхүүн нь зөвхөн нарийвчлалыг бус, харин үүсгэсэн кодын функциональ байдлыг үнэлдэг.

The pass@k хэмжигдэхүүнийг функциональ зөв байдлын хэмжүүр болгон нэвтрүүлсэн. Энэ нь үндсэндээ "k" үүсгэсэн кодын дээжийн аль нэг нь нэгжийн туршилтыг давсан тохиолдолд асуудал шийдэгдсэн гэж үзнэ. Гэсэн хэдий ч, үүнийг шууд хэлбэрээр ашиглахын оронд өндөр хэлбэлзлээс зайлсхийхийн тулд pass@k-ийг тооцоолоход шударга бус үнэлгээчийг ашигладаг.

ChatGPT-ийн кодын чадварыг үнэлэхийн тулд судалгаанд ашигласан HumanEval өгөгдлийн багц. Энэхүү өгөгдлийн багц нь Python-ийн гараар бичсэн асуудлуудаас бүрдэх бөгөөд тус бүр нь нэгжийн тест дагалддаг.

Chatgpt нээлттэй ai сургалтын мэдээллийн багцын жишээ

https://github.com/openai/code-align-evals-data/blob/main/human_eval

Үл мэдэгдэх эсвэл найдваргүй кодыг ажиллуулахтай холбоотой эрсдэлийг харгалзан, үүсгэсэн кодыг аюулгүйгээр шалгахын тулд хамгаалагдсан хязгаарлагдмал орчинг зохион бүтээсэн. Энэ орчинг ашигласан gVisor нөөцийг дуурайж, хост систем болон ажиллаж байгаа кодын хооронд саад тотгор үүсгэх. Тиймээс, загвар нь хортой код үйлдвэрлэсэн ч гэсэн агуулагдсан хэвээр байх бөгөөд хост эсвэл сүлжээнд хор хөнөөл учруулахгүй.

ChatGPT кодын орчуулагчийг ашиглах

OpenAI-ийн ChatGPT нь олон тооны хувьслыг туулсан бөгөөд Код Тайлбарлагч нь дэлхий дахинд хувьсгалт шинж чанартай болсон. GPT-4 загвар. Уламжлалт чатын интерфэйсээс ялгаатай нь Code Interpreter нь хэрэглэгчдэд тооцооллын даалгавруудыг гүнзгийрүүлэх боломжийг олгодог бөгөөд энэ нь хүний ​​болон хиймэл оюун ухааны харилцан яриа болон тооцоолох үйл явцын хоорондох шугамыг жигд хольж өгдөг.

Үндсэндээ Code Interpreter нь чатбот дотор компьютер суулгасантай адил юм. Энэхүү динамик функц нь хэрэглэгчдэд TXT, PDF, JPEG гэх мэт нийтлэг төрлөөс эхлээд CPP, PY, SQLite зэрэг илүү нарийн мэргэжлийн формат хүртэл олон тооны файлын форматыг байршуулах түр зуурын дискний зайг санал болгодог. Энэхүү өргөн хүрээний дэмжлэг нь баримт бичиг боловсруулах эсвэл зураг боловсруулах гэх мэт янз бүрийн ажлуудад олон талт байдлыг нэмэгдүүлдэг.

Бат бөх, аюулгүй байдлын хүрээнд ажилладаг Code Interpreter нь урьдчилан суулгасан 300 гаруй номын сангаар тоноглогдсон. Энэхүү хамгаалагдсан хязгаарлагдмал орчин нь аюулгүй байдлыг хангахын зэрэгцээ тооцоолох хүчин чадлыг хангасан хэвээр байна. Сонирхолтой нь, даалгавар өгвөл хэрэглэгчийн хүсэлтийг биелүүлэхийн тулд Python скриптийг бодит цаг хугацаанд урладаг. Жишээлбэл, OCR ашиглан зураг дээр суурилсан PDF файлыг хайх боломжтой формат руу хөрвүүлэх; Хэрэглэгчийн хийх ёстой зүйл бол баримт бичгийг байршуулах бөгөөд үлдсэнийг нь ChatGPT гүйцэтгэдэг.

Сонирхолтой зүйл бол байршуулах файлын хэмжээг хязгаарлах явдал юм. Тодорхой үзүүлэлтүүдийг хараахан зарлаагүй байгаа ч хэрэглэгчийн туршилтууд нь систем нь 100МБ-аас их хэмжээтэй файлуудыг үр дүнтэй боловсруулж чаддаг болохыг харуулж байна. Хэмжээнээс үл хамааран эдгээр файлууд түр зуурынх бөгөөд чат дууссаны дараа устгагдах болно.

Code Interpreter-ийн гайхалтай чанар нь түүний техникийн ур чадвар төдийгүй хүртээмжтэй байдал юм. OpenAI нь GPT-4 загвартай хамт ирдэг ChatGPT Plus-ийн захиалагчдад энэ боломжийг санал болгодог. Тиймээс энэхүү хувиргах хэрэгсэл нь зөвхөн технологийн элитэд зориулагдсан биш, харин аажмаар илүү өргөн хүрээний үзэгчдэд хүртээмжтэй болж байна.

Стандарт ChatGPT загвар ба Кодын орчуулагч хоёрын ялгаа нь тэдний харилцан үйлчлэлийн парадигмд оршдог. Эхнийх нь үндсэндээ текстийн хариуг үүсгэдэг бол хоёр дахь нь кодыг ойлгож, шууд үр дүнг санал болгодог. Энэ нь түүнийг технологийн мэргэжилтнүүдэд үнэ цэнэтэй хөрөнгө болгоод зогсохгүй код бичих мэдлэггүй хүмүүст нарийн төвөгтэй тооцооллын ажлыг гүйцэтгэх боломжийг олгодог.

ChatGPT кодын орчуулагчийн чадавхи нь Програм хангамж хөгжүүлэлт болон өгөгдлийн шинжлэх ухааны хэд хэдэн тал дээр хувьсгал хийж чадна.

  • Автомат код үүсгэх: Програм хангамжийн хэрэглээ болон өгөгдлийн аналитик скриптүүдийн аль алиных нь хувьд өндөр түвшний тайлбарыг өгвөл систем нь өгөгдлийн боловсруулалт, дүн шинжилгээ хийх процессыг хурдасгаж, загварлаг бүтэц эсвэл нарийн төвөгтэй кодын хэсгүүдийг гаргаж чаддаг.
  • Кодын шалгалт, өгөгдөл баталгаажуулалт: ChatGPT зэрэг хиймэл оюун ухаанд суурилсан хэрэгслүүд нь програм хангамжийн кодын баазын чанар, аюулгүй байдлыг сайжруулахад тусална. Нэмж дурдахад, өгөгдлийн шинжлэх ухааны салбарт ийм хэрэгслүүд нь өгөгдөл боловсруулах, хувиргах скриптүүдийг шалгаж, баталгаажуулах, үнэн зөв, үр ашигтай байдлыг хангахад чухал үүрэг гүйцэтгэдэг.
  • Өгөгдлийн шинжилгээний тусламж: Мэдээллийн эрдэмтдийн хувьд ChatGPT Кодын Тайлбарлагч нь өгөгдлийг урьдчилсан байдлаар судлах, дүрслэх, тэр ч байтугай статистикийн үндсэн тестүүдэд зориулсан код үүсгэхэд тусалж, мэдээллийн шинжилгээний ажлын явцыг хөнгөвчлөх болно.

Хэрэв та ChatGPT-ийн нарийн ширийн зүйлс болон шуурхай инженерчлэлийн талаар илүү ихийг олж мэдэхийг хүсч байвал Unite AI нь 'ChatGPT: Нарийвчилсан шуурхай инженерчлэл'.

ChatGPT кодын орчуулагчийг тохируулж байна

Код орчуулагчийн интеграци нь платформд хэрэглэгчийн хүсэлтийг тайлбарлах, Python код болгон ажиллуулах, үр дүнг интерактив чатын форматаар харуулах боломжийг олгодог. Энэ функцэд хандахын тулд хэрэглэгчид дараах руу шилжих боломжтой GPT чат тохиргоонууд руу орж, Бета функцуудын хэсгийг судалж, Код орчуулагчийг идэвхжүүлнэ үү.

Үүнийг ялгаж буй зүйл нь түүний ил тод механизм юм. Хэрэглэгчид даалгавар өгөх үед платформ нь боловсруулалтын алхам бүрийг танилцуулж, тушаалуудыг хэрхэн тайлбарлаж, гүйцэтгэх талаар тодорхой харуулдаг. Хамгийн чухал нь нууцлал, аюулгүй байдлын үүднээс Код орчуулагч нь интернет холболтгүйгээр ажилладаг.

ChatGPT кодын орчуулагчийн ашиг тусыг судлах

Өгөгдлийн дүрслэл & дүн шинжилгээ

ChatGPT нь уламжлалт графикуудын хүрээнээс давж, ердийн болон шинэлэг график дүрслэлүүдийг санал болгодог. Энэ нь хэрэглэгчид өөрсдийн өгөгдлийг хамгийн утга учиртай ойлголт өгөх форматаар харах боломжтой болгодог.

Гэсэн хэдий ч энэ нь зөвхөн түүхий өгөгдлийг дүрслэн харуулах тухай биш юм. ChatGPT загвар нь өгөгдлийг боловсруулах, сайжруулах чадвартай. Хэдийгээр хүчирхэг ч хэрэглэгчид болгоомжтой байх хэрэгтэй.

Санхүүгийн шинжээчдэд Код Тайлбарлагчийн хувьцааны ханшид дүн шинжилгээ хийх, дүрслэх чадвар нь ялангуяа ашигтай байх болно. Тохиромжтой интеграцийн тусламжтайгаар хэрэглэгчид өгөгдлийн багцыг байршуулж, тэдгээрийг янз бүрийн форматаар дүрслэн харуулах боломжтой. Хувь хүмүүс нарийн төвөгтэй өгөгдлийн шинжилгээ хийх боломжтой үед энэ функцын ач холбогдол илт харагдаж байна.

Доорх видео нь ChatGPT-ийн код тайлбарлагч хэрхэн иж бүрэн кодыг бүтээснийг харуулж байна TSLA хувьцааны шинжилгээ.

Түлхүүр Takeaways:

  • Теслагийн хувьцаа хэлбэлзэлтэй тулгарсан ч өсөлтийн үеийг даван туулах чадвараа харуулсан.
  • Тодорхой өдрүүдэд арилжааны хэмжээ өндөр байгаа нь зах зээлийн ихээхэн сонирхол эсвэл гол үйл явдлуудад үзүүлэх хариу үйлдлийг илтгэнэ.
  • Жилээс өнөөдрийг хүртэл (YTD) өгөөж буурч байгаа нь хөрөнгө оруулагчид ирээдүйн хөрөнгө оруулалтыг авч үзэхдээ компанийн дотоод хүчин зүйл болон гадаад зах зээлийн нөхцөл байдалд дүн шинжилгээ хийх ёстойг харуулж байна.

Компьютерийн хараа ба OCR-ийг хэрэгжүүлэх

Компьютерийн харааны чухал функц болох царай илрүүлэхэд сонгодог техникээр хандсан: the Haar Cascade ангилагч OpenCV-ээс.

Доорх зураг нь сонгодог Haar Cascade ангилагчийн ашиглалтыг харуулж байна.

Оптик тэмдэгт таних (OCR) гэж нэрлэгддэг зургаас текст гаргаж авах үйл явцыг Tesseract ашиглан саадгүй хийж, дараа нь текстийг GPT-4-ээр зохион байгуулж, ойлгомжтой байдлыг сайжруулсан.

Дараах видеоноос Tesseract (OCR) гэрчилгээний зургаас текстийг хэрхэн задлахыг үзнэ үү.

Code Interpreter нь видео, аудио, дүрсийг боловсруулах чиглэлээр маш сайн ажилладаг. Шууд командын тусламжтайгаар хэрэглэгчид GIF-г тусгай сайжруулалтаар MP4 болгон хөрвүүлэх гэх мэт нарийвчилсан засваруудыг хийх боломжтой. Зүгээр л файлаа байршуулж, хүссэн өөрчлөлтөө оруулаад ид шидийн үйлдлийг хараарай.

Таны ChatGPT кодын орчуулагч доторх Python гадаад номын сан

ChatGPT Code Interpreter нь Python-ийн өргөн хүрээний сангуудаар тоноглогдсон динамик програмчлалын платформ юм. Эдгээр нь Seaborn-тай өгөгдлийг дүрслэхээс эхлээд Torch-ээр дамжуулан дэвшилтэт машин сурах хүртэл бүх зүйлийг хамардаг. Гэхдээ энэ нь статик хэрэгслийн багцаас илүү юм.

Үүнээс урам зориг авсан Chatgpt хуудас Коракот Чаоваваничаас.

Хамгийн сүүлийн үеийнхээс эхэлнэ nltk хувилбар, бид .whl файлыг орчуулагч руу байршуулсан. Дараа нь бид ChatGPT-д одоо байгаа багцын байршилд дүн шинжилгээ хийх замаар тохирох сайтын багцын лавлахыг олохыг зааварласан. Дараагийн алхам нь дугуйны файлыг түр зуурын цэг рүү задалж, файлуудыг тодорхойлсон сайтын багцын лавлах руу шилжүүлэх явдал байв. Гэсэн хэдий ч энэ нь саад тотгор учруулсан.

Үүнийг шийдвэрлэх арга замыг хайж бид "NLTK-г Python орчинд суулгаж, суулгасны дараа ашиглах боломжтой эсэхийг шалгаарай."

ChatGPT хариу өгч, шийдлийг өгсөн. Энэ нь түр зуурын лавлахыг sys.path-д нэмэхийг санал болгосноор Python-д тухайн байршлын дотор задлагдаагүй nltk багцаас модулиудыг таньж, татах боломжийг олгосон. Энэхүү тактик нь NLTK-г амжилттай суулгахад хүргэсэн гайхамшгуудыг үзүүлсэн.

.whl файлуудыг ашигласнаар уг суулгац нь ур чадвар, дасан зохицох чадварыг хослуулсан. ChatGPT кодын орчуулагч нь анхны сорилт бэрхшээлийг үл харгалзан олон талт байдал, кодлогчдын хэрэгцээг хангах үүрэг амлалтаа харуулж, шинэхэн болон ахмад хүмүүст кодчилолын боловсронгуй туршлагыг баталгаажуулсан.

chatgpt кодын орчуулагч дээр захиалгат номын санг суулгаж байна

Орчуулагчийн чадварыг харуулсан гайхалтай үзүүлбэрийн хувьд @DominikPeters-ийн саяхан жиргэсэн нэгэн өвөрмөц үзүүлбэрийг онцолжээ. Питерс GPT-4-ээс Парисын тойргийн талаар асуулт асууж асуухад загвар нь сайн ажилладаг вэб сайтыг хүргэж байна. Ажлын асуулт хариултыг dominik-peters.de/gpt-arrondissement-quiz/ хаягаар дамжуулан практик туршлагаас авах боломжтой.

Дуусгах

OpenAI-ийн ChatGPT Code Interpreter-тэй хийсэн нээлт нь кодлогч болон кодлогч бус хүмүүст адилхан өөрчлөлт хийхээс өөр зүйл биш юм. Дибаг хийхэд нь хөгжүүлэгчдэд туслахаас эхлээд Парисын сорилтуудыг хялбархан гаргах хүртэлх өргөн хүрээний даалгавруудыг шийдвэрлэхэд түүний олон талт байдал нь бидний дижитал туршлагыг сайжруулахад хиймэл оюун ухааны хязгааргүй боломжийн нотолгоо юм. Энд бидний гүн шумбалтын нэрмэл мөн чанар байна:

Хэрэгсэлээ ойлгоорой: Та хамтран ажиллагсадтайгаа нөхөрлөдөг шигээ Code Interpreter-тэй танилцаарай. Энэ нь GPT-4-ээс нарийн тохируулагдсан Codex дээр бүтээгдсэн. Түүний ур чадвар нь олон програмчлалын хэлийг хамардаг бөгөөд энэ нь таны бүх кодчиллын адал явдалд хамгийн тохиромжтой хамтрагч болгодог.

AI хувьсгалыг хүлээн ав: Уламжлалт кодчилол нь газар хөдлөлтийн өөрчлөлтийг харах гэж байна. ChatGPT Code Interpreter гэх мэт хиймэл оюун ухаанд суурилсан хэрэгслүүдийн тусламжтайгаар алдааг тодорхойлох, код үүсгэх, тэр ч байтугай кодыг шалгах зэрэг ажлыг хурдасгах боломжтой.

Зүгээр л кодоос гадна: Орчуулагчийн оролдлого нь текст эсвэл кодоор хязгаарлагдахгүй. Энгийн TXT файлуудаас эхлээд нарийн төвөгтэй PY скрипт хүртэл олон файлын форматтай ажиллах чадвар нь янз бүрийн домэйн дээр ашиг тустай гэдгийг онцолж байна.

Туршилтаа хэзээ ч бүү зогсоо: NLTK номын сангийн суулгацтай хийсэн бидний судалгаа нь тууштай байдал, дасан зохицох чадварын ач холбогдлыг илэрхийлдэг бөгөөд энэ нь Код орчуулагчийн агуулагддаг үнэт зүйлс юм. Хэрэв ямар нэг асуудал гарвал түүнийг тойрч гарах арга зам байдаг.

AI ярианд нэгдээрэй: Парисын тойргийн асуулт асуулгаар харуулсан бодит хэрэглүүрүүд нь уг хэрэглүүрийн асар их ашиг тусыг онцолж өгдөг. Үүнийг хүлээн авч, судалж, төслүүдээ өргөжүүлэх боломжийг олго.

Дээрх видеог ашиглан хийсэн болно ген-2 болон Замын дунд.

Дүгнэж хэлэхэд, ChatGPT кодын орчуулагч нь зүгээр л нэг хэрэгсэл биш юм; Энэ нь бидний технологитой холбогдох арга замыг өөрчилж байна. Шинийг санаачлагчид болон сонирхогчдын хувьд энэ нь кодчиллын боломжоор дүүрэн ертөнцийг амлаж байна.

Би сүүлийн таван жилийг Machine Learning болон Deep Learning хэмээх гайхалтай ертөнцөд шимтэн өнгөрүүлэхэд зарцуулсан. Миний хүсэл тэмүүлэл, туршлага намайг AI/ML-д онцгойлон анхаарч, 50 гаруй төрлийн програм хангамжийн инженерийн төсөлд хувь нэмрээ оруулахад хүргэсэн. Миний байнгын сониуч зан намайг цаашид судлахыг хүсч буй Байгалийн хэлний боловсруулалт руу татсан.