Kacerdasan buatan

Ulang Taun Pertama ChatGPT: Ngarobih Masa Depan Interaksi AI

dimuat

bulan 6 ago

Désémber 6, 2023

Ngeunteung dina taun munggaran ChatGPT, jelas yén alat ieu parantos robih sacara signifikan pamandangan AI. Diluncurkeun dina ahir taun 2022, ChatGPT kasohor kusabab gaya paguneman anu ramah-pamaké anu ngajantenkeun interaksi sareng AI langkung sapertos ngobrol sareng jalma tibatan mesin. Pendekatan anyar ieu gancang narik perhatian masarakat. Dina ngan lima dinten saatos dileupaskeun, ChatGPT parantos narik sajuta pangguna. Nepi ka awal taun 2023, jumlah ieu balon ka sakitar 100 juta pangguna bulanan, sareng dina Oktober, platform éta ngagambar sakitar 1.7 milyar kunjungan sadunya. Jumlah ieu nyarioskeun jilid ngeunaan popularitas sareng mangpaatna.

Sapanjang taun katukang, pangguna parantos mendakan sagala rupa cara kreatif pikeun ngagunakeun ChatGPT, tina tugas saderhana sapertos nyerat email sareng ngapdet resume dugi ka ngamimitian usaha anu suksés. Tapi éta henteu ngan ngeunaan kumaha jalma anu ngagunakeun éta; téhnologi sorangan geus tumuwuh sarta ningkat. Mimitina, ChatGPT mangrupikeun jasa gratis anu nawiskeun réspon téks anu lengkep. Ayeuna, aya ChatGPT Plus, anu kalebet ChatGPT-4. Vérsi anu diropéa ieu dilatih dina langkung seueur data, masihan langkung sakedik jawaban anu salah, sareng langkung ngartos petunjuk anu kompleks.

Salah sahiji apdet pangbadagna nyaéta yén ChatGPT ayeuna tiasa berinteraksi dina sababaraha cara - éta tiasa ngadangukeun, nyarios, sareng ngolah gambar. Ieu ngandung harti yén anjeun tiasa ngobrol sareng éta ngalangkungan aplikasi sélulérna sareng nunjukkeun gambar pikeun nampi réspon. Parobihan ieu parantos muka kamungkinan anyar pikeun AI sareng parantos ngarobih cara jalma ningali sareng mikir ngeunaan peran AI dina kahirupan urang.

Ti mimiti salaku demo téknologi nepi ka statusna ayeuna salaku pamaén utama dina dunya téknologi, perjalanan ChatGPT cukup narik. Mimitina, éta katingali salaku cara pikeun nguji sareng ningkatkeun téknologi ku kéngingkeun tanggapan ti masarakat. Tapi éta gancang janten bagian penting tina bentang AI. Kasuksésan ieu nunjukkeun kumaha efektifna pikeun nyaluyukeun modél basa ageung (LLM) kalayan diajar anu diawaskeun sareng tanggapan ti manusa. Hasilna, ChatGPT tiasa ngadamel rupa-rupa patarosan sareng tugas.

Perlombaan pikeun ngembangkeun sistem AI anu paling sanggup sareng serbaguna parantos nyababkeun proliferasi modél open-source sareng proprietary sapertos ChatGPT. Ngartos kamampuan umumna ngabutuhkeun tolok ukur komprehensif dina spéktrum tugas anu lega. bagian ieu explores tolok ukur ieu, shedding lampu on kumaha model béda, kaasup ChatGPT, tumpukan up ngalawan silih.

Evaluating LLMs: The Patokan

MT-bangku: Patokan ieu nguji kamampuhan paguneman multi-turn jeung instruksi-handap dina dalapan domain: nulis, roleplay, ékstraksi informasi, penalaran, math, coding, pangaweruh STEM, jeung humaniora / élmu sosial. LLM anu langkung kuat sapertos GPT-4 dianggo salaku evaluator.
AlpacaEval: Dumasar kana set evaluasi AlpacaFarm, evaluator otomatis basis LLM ieu patokan model ngalawan réspon ti LLMs canggih kawas GPT-4 jeung Claude, ngitung laju win model calon.
Buka LLM Leaderboard: Ngamangpaatkeun Abah Evaluasi Modél Basa, leaderboard ieu ngaevaluasi LLMs on tujuh tolok ukur konci, kaasup tantangan nalar jeung tés pangaweruh umum, duanana dina setélan enol-shot jeung sababaraha-shot.
BIG-bangku: Tolok ukur kolaborasi ieu nyertakeun langkung ti 200 tugas basa novel, ngalangkungan rupa-rupa jejer sareng basa. Tujuanana pikeun usik LLM sareng ngaduga kamampuan kahareupna.
ChatEval: Kerangka debat multi-agén anu ngamungkinkeun tim sacara otonom ngabahas sareng ngira-ngira kualitas réspon tina modél anu béda dina patarosan anu kabuka sareng tugas generasi basa alami tradisional.

Performance Komparatif

Dina watesan tolok ukur umum, LLM open-source parantos nunjukkeun kamajuan anu luar biasa. Llama-2-70B, upamana, ngahontal hasil anu luar biasa, khususna saatos disaluyukeun sareng data instruksi. varian na, Llama-2-chat-70B, excelled di AlpacaEval kalawan 92.66% laju win, surpassing GPT-3.5-turbo. Sanajan kitu, GPT-4 tetep frontrunner kalawan laju win 95.28%.

Zephyr-7B, model leutik, nunjukkeun kamampuhan comparable 70B LLMs gedé, utamana dina AlpacaEval na MT-Bench. Samentara éta, WizardLM-70B, fine-tuned kalawan rupa-rupa data instruksi, ngoleksi pangluhurna diantara LLMs open-source on MT-Bench. Sanajan kitu, eta masih lagged balik GPT-3.5-turbo na GPT-4.

Éntri anu pikaresepeun, GodziLLa2-70B, ngahontal skor kompetitif dina Open LLM Leaderboard, nunjukkeun poténsi modél ékspérimén anu ngagabungkeun set data anu rupa-rupa. Nya kitu, Yi-34B, dimekarkeun ti scratch, nangtung kaluar kalawan skor comparable GPT-3.5-turbo na ngan rada balik GPT-4.

UltraLlama, kalawan fine-tuning na on data rupa-rupa sarta kualitas luhur, cocog GPT-3.5-turbo dina tolok ukur diusulkeun na malah surpassed eta di wewengkon dunya sarta pangaweruh profésional.

Scaling Up: Kebangkitan LLMs Giant

Model LLM pangsaéna saprak 2020

Tren anu kasohor dina pamekaran LLM nyaéta paningkatan parameter modél. Model sapertos Gopher, GLaM, LaMDA, MT-NLG, sareng PaLM parantos nyorong watesna, puncakna dina model anu dugi ka 540 milyar parameter. Model-model ieu nunjukkeun kamampuan anu luar biasa, tapi sipat sumber-tutupna parantos ngabatesan aplikasi anu langkung lega. Watesan ieu nyababkeun minat pikeun ngembangkeun LLM open-source, tren anu kéngingkeun moméntum.

Sajajar jeung skala up ukuran model, peneliti geus digali strategi alternatif. Gantina ngan nyieun model badag, aranjeunna geus fokus kana ngaronjatkeun pra-latihan model leutik. Conto kalebet Chinchilla sareng UL2, anu nunjukkeun yén langkung seueur henteu langkung saé; strategi smarter bisa ngahasilkeun hasil efisien teuing. Saterusna, aya geus perhatian considerable on instruksi tuning model basa, jeung proyék kawas FLAN, T0, jeung Flan-T5 nyieun kontribusi signifikan pikeun wewengkon ieu.

Katalis ChatGPT

Bubuka OpenAI urang Ngobrol GPT ditandaan titik balik dina panalungtikan NLP. Pikeun bersaing sareng OpenAI, perusahaan sapertos Google sareng Anthropic ngaluncurkeun modél sorangan, Bard sareng Claude, masing-masing. Bari model ieu némbongkeun kinerja comparable mun ChatGPT dina loba tugas, aranjeunna masih katinggaleun model panganyarna tina OpenAI, GPT-4. Kasuksésan modél ieu utamina dikaitkeun kana diajar penguatan tina umpan balik manusa (RLHF), téknik anu nampi paningkatan fokus panalungtikan pikeun perbaikan salajengna.

Gosip sareng Spekulasi Ngeunaan OpenAI's Q* (Q-Star)

Laporan panganyarna nunjukkeun yén panalungtik di OpenAI mungkin geus ngahontal kamajuan signifikan dina AI jeung ngembangkeun model anyar disebut Q* (diucapkeun béntang Q). Disangka, Q* boga kamampuhan pikeun ngalakukeun math tingkat-sakola, hiji prestasi anu geus sparked diskusi diantara para ahli ngeunaan poténsi na salaku milestone nuju artificial general intelligence (AGI). Nalika OpenAI teu acan masihan koméntar kana laporan ieu, kamampuan anu dikabarkan tina Q * parantos ngahasilkeun pikagumbiraeun sareng spekulasi dina média sosial sareng diantara para peminat AI.

Pangembangan Q* penting pisan sabab modél basa anu aya sapertos ChatGPT sareng GPT-4, sanaos mampuh sababaraha tugas matematika, henteu langkung mahir dina nangananana sacara dipercaya. Tangtanganna aya dina kabutuhan modél AI pikeun henteu ngan ukur mikawanoh pola, sakumaha anu ayeuna dilakukeun ku diajar jero sareng trafo, tapi ogé pikeun nalar sareng ngartos konsép abstrak. Matematika, janten patokan pikeun nalar, ngabutuhkeun AI pikeun ngarencanakeun sareng ngalaksanakeun sababaraha léngkah, nunjukkeun pamahaman anu jero ngeunaan konsép abstrak. Kamampuhan ieu bakal nandaan kabisat anu signifikan dina kamampuan AI, berpotensi ngalegaan saluareun matematika ka tugas rumit anu sanés.

Nanging, para ahli ati-ati pikeun nyegah overhyping pamekaran ieu. Sanaos sistem AI anu tiasa ngarengsekeun masalah matematika bakal janten prestasi anu luar biasa, éta henteu merta nunjukkeun ayana AI superintelligent atanapi AGI. Panaliti AI ayeuna, kalebet usaha OpenAI, fokus kana masalah dasar, kalayan tingkat kasuksésan anu béda dina tugas anu langkung kompleks.

Kamajuan aplikasi poténsial sapertos Q * ageung, mimitian ti bimbingan pribadi pikeun ngabantosan dina panalungtikan ilmiah sareng rékayasa. Nanging, éta ogé penting pikeun ngatur ekspektasi sareng ngakuan watesan sareng masalah kaamanan anu aya hubunganana sareng kamajuan sapertos kitu. Kahariwang ngeunaan AI anu nyababkeun résiko eksistensi, hariwang dasar tina OpenAI, tetep relevan, khususna nalika sistem AI mimiti ngahubungkeun langkung seueur sareng dunya nyata.

Gerakan LLM Sumber Terbuka

Pikeun naekeun panalungtikan LLM open-source, Meta ngarilis model séri Llama, memicu gelombang kamajuan anyar dumasar kana Llama. Ieu kalebet modél anu disaluyukeun sareng data instruksi, sapertos Alpaca, Vicuna, Lima, sareng WizardLM. Panalungtikan ogé cabang kana ningkatkeun kamampuan agén, penalaran logis, sareng modél kontéks panjang dina kerangka basis Llama.

Salajengna, aya tren ngembang ngembangkeun LLM anu kuat ti mimiti, kalayan proyék sapertos MPT, Falcon, XGen, Phi, Baichuan, Jeng, grok, jeung Yi. Usaha ieu ngagambarkeun komitmen pikeun ngadémokrasikeun kamampuan LLM sumber tertutup, ngajantenkeun alat AI canggih langkung diaksés sareng éfisién.

Dampak Modél ChatGPT sareng Open Source dina Podomoro

Kami ningali masa depan dimana LLM ngabantosan catetan klinis, ngeusian formulir pikeun reimbursements, sareng ngadukung dokter dina diagnosis sareng perencanaan perawatan. Ieu parantos narik perhatian boh raksasa téknologi sareng lembaga kasehatan.

Microsoft sacara diskusi jeung Epic, panyadia software rékaman kaséhatan éléktronik ngarah, sinyal integrasi LLMs kana kasehatan. Inisiatif parantos aya di UC San Diego Health sareng Stanford University Medical Center. Nya kitu, Google partnerships kalawan Mayo klinik sarta Amazon Web Services' peluncuran HealthScribe, layanan dokuméntasi klinis AI, nandaan léngkah anu penting dina arah ieu.

Nanging, panyebaran gancang ieu nyababkeun kasalempang ngémutan kontrol ubar pikeun kapentingan perusahaan. Sifat proprietary of LLMs ieu ngajadikeun eta hésé evaluate. Mungkin modifikasi atanapi discontinuation maranéhna pikeun alesan Profitability bisa kompromi perawatan sabar, privasi, sarta kaamanan.

Kabutuhan anu penting nyaéta pendekatan kabuka sareng inklusif pikeun pangwangunan LLM dina kasehatan. Institusi kasehatan, peneliti, dokter, sareng pasien kedah kolaborasi sacara global pikeun ngawangun LLM open-source pikeun kasehatan. Pendekatan ieu, sami sareng Trillion Parameter Consortium, bakal ngamungkinkeun ngumpulkeun komputasi, sumber kauangan, sareng kaahlian.

Topik nu patali:GPT llama 2 LLM

nepi salajengna

UltraFastBERT: Modeling Basa Éksponénsial Gancang

Ulah Cik

Elon Musk urang xAI Nyiar Milyar-Dollar naekeun Dana

Aayush Mittal

Kuring parantos nyéépkeun lima taun ka pengker dina dunya Mesin Pembelajaran sareng Pembelajaran Jero anu pikaresepeun. Gairah sareng kaahlian kuring nyababkeun kuring nyumbang kana langkung ti 50 rupa-rupa proyék rékayasa software, kalayan fokus khusus dina AI / ML. Rasa panasaran kuring anu terus-terusan ogé parantos narik kuring kana Pangolahan Basa Alam, hiji widang anu kuring hoyong pisan pikeun ngajajah salajengna.