Îstîxbaratê ya sûnî

Lêgerîna Gemini-ya Nû ya Google DeepMind: Hemî Buzz çi ye?

Demê on December 21, 2023

Di cîhana îstîxbarata hunerî (AI), afirîneriya dawî ya Google DeepMind, Gemini, dengbêjiyê çêdike. Vê pêşkeftina nûjen armanc dike ku pirsgirêka tevlihev a dubarekirina têgihîştina mirovî, nemaze şiyana wê ya yekkirina têgehên cûrbecûr yên hestî çareser bike. Têgihîştina mirovî, bi xwezayî pirmodal, gelek kanalan bi hevdemî bikar tîne da ku jîngehê fam bike. Multimodal AI, îlhama xwe ji vê tevliheviyê digire, hewil dide ku agahdariya ji çavkaniyên cihêreng tevde bike, fam bike, û sedem bike, kapasîteyên têgihîştina mîna mirovan neynik dike.

Tevliheviya Multimodal AI

Digel ku AI-ê di rêvebirina modên hestiyariyê yên takekesî de gav avêtiye, gihandina AI-ya multimodal a rastîn pirsgirêkek dijwar dimîne. Rêbazên heyî perwerdekirina pêkhateyên cihêreng ên ji bo modalîteyên cihêreng û berhevkirina wan bi hev re vedihewîne, lê ew bi gelemperî di karên ku hewcedariya ramana tevlihev û têgehî de ne kêm dibin.

Derketina Gemini

Di lêgerîna dubarekirina têgihîştina multimodal a mirovan de, Google Gemini wekî pêşkeftinek hêvîdar derketiye holê. Ev afirandin di potansiyela AI-ê de perspektîfek bêhempa pêşkêşî dike ku tevliheviyên têgihîştina mirovî deşîfre bike. Gemini nêzîkatiyek cihêreng digire, bi xwezayî pirmodal e û li ser awayên cihêreng perwerdehiya pêşwext derbas dike. Bi hûrgulîkirina bêtir bi daneyên pirmodal ên zêde, Gemini bandora xwe safî dike, di têgihiştin û ramana der barê têketinên cihêreng de soz nîşan dide.

Gemini çi ye?

Google Gemini, ku di 6ê Kanûna Pêşîn, 2023-an de hatî destnîşan kirin, malbatek modelên AI-ê yên pirmodal e ku ji hêla yekîneya Google DeepMind ya Alphabet ve bi hevkariya Google Research ve hatî pêşve xistin. Gemini 1.0 ji bo têgihiştin û hilberandina naverokê li seranserê cûrbecûr cûreyên daneyê, tevî nivîs, deng, wêne, û vîdyoyê hatî çêkirin.

Taybetmendiyek berbiçav a Gemini multîmodaliya wê ya xwecî ye, ku wê ji modelên AI-ê yên pirmodal ên kevneşopî veqetîne. Vê kapasîteya bêhempa dihêle ku Gemini bi rengek bêkêmasî li ser cûrbecûr daneyên cûrbecûr wekî deng, wêne, û nivîsê bişopîne û bifikire. Bi girîngî, Gemini xwedan ramana cross-modal e, ku dihêle ku ew ji bo çareserkirina pirsgirêkên tevlihev notên destnivîs, grafîk û diagraman şîrove bike. Mîmariya wê girtina rasterast a nivîs, wêne, pêlên dengî, û çarçoveyên vîdyoyê wekî rêzikên hevgirtî piştgirî dike.

Malbata Gemini

Gemini xwedan cûrbecûr modelan e ku li gorî dozên karanîna taybetî û senaryoyên bicîhkirinê hatine çêkirin. Modela Ultra, ku ji bo karên pir tevlihev hatî sêwirandin, tê pêşbînîkirin ku di destpêka sala 2024-an de were gihîştin. Modela Pro pêşanî dide performans û mezinbûnê, ji bo platformên bihêz ên mîna Google Bard. Berevajî vê, modela Nano ji bo karanîna li ser cîhazê xweşbîn e û di du guhertoyan de tê - Nano-1 bi 1.8 mîlyar parametre û Nano-2 bi 3.25 mîlyar parametre. Van modelên Nano bi rengek bêkêmasî di cîhazan de, tevî smartphone Google Pixel 8 Pro, tevdigerin.

Gemini Vs ChatGPT

Li gorî çavkaniyên pargîdaniyê, lêkolîneran bi berfirehî Gemini bi guhertoyên ChatGPT re berhev kirine ku li wir di ceribandina berbelav de ChatGPT 3.5 derketiye. Gemini Ultra di lêkolîna modela zimanên mezin de li ser 30 ji 32 pîvanên ku bi berfirehî têne bikar anîn pêş dikeve. Bi 90.0% li ser MMLU (têgihiştina zimanê pirzimanî ya girseyî), Gemini Ultra ji pisporên mirovî derbas dibe, di têgihîştina zimanê pir-peywiran de hêza xwe nîşan dide. MMLU ji berhevkirina 57 babetan pêk tê, wekî matematîkê, fîzîk, dîrok, qanûn, derman û etîk ji bo ceribandina zanîna cîhanê û jêhatîbûna pirsgirêkan. Gemini ku ji bo multîmodalbûnê hatî perwerde kirin, dikare cûrbecûr cûrbecûr medyayê pêvajoyê bike, û wê di perestgeha pêşbaziya AI-ê de ji hev veqetîne.

Karanîna Bikaranîna

Derketina Gemini rê li ber cûrbecûr rewşên karanînê daye ku hin ji wan wiha ne:

Aqûlkirina Multimodal a Pêşketî: Gemini di ramana pirmodal a pêşkeftî de bi pêş dikeve, di heman demê de nivîs, wêne, deng, û hêj bêtir nas dike û têgihiştî dike. Ev nêzîkatiya berfireh şiyana wê ya girtina agahdariya nuwaze û di ravekirin û ramanê de, nemaze di mijarên tevlihev ên mîna matematîk û fîzîkê de, zêde dike.
Bernamesaziya Komputerê: Gemini di têgihiştin û hilberandina bernameyên komputerê yên bi kalîte de li ser zimanên ku pir têne bikar anîn jêhatî ye. Di heman demê de ew dikare wekî motora pergalên kodkirinê yên pêşkeftî jî were bikar anîn, wekî ku di çareserkirina pirsgirêkên bernamesaziya pêşbaziyê de hatî destnîşan kirin.
Veguherîna Teşhîsa Bijîjkî: Kapasîteyên hilberandina daneya multimodal a Gemini dikare di tespîtkirina bijîjkî de veguheztinek nîşan bide, ku bi peydakirina gihîştina çavkaniyên daneya cihêreng re pêvajoyên biryargirtinê zêde bike.
Veguheztina Pêşbîniya Darayî: Gemini bi şirovekirina daneyên cihêreng ên di raporên darayî û meylên bazarê de, pêşbîniya darayî ji nû ve şekil dike, ji bo biryargirtinê agahdarî têgihîştinên bilez peyda dike.

zehmetiyên

Digel ku Google Gemini di pêşkeftina AI-ya multimodal de gavên berbiçav avêtiye, ew bi hin kêşeyan re rû bi rû dimîne ku hewcedarî lênihêrîna baldar e. Ji ber perwerdehiya daneya wê ya berfereh, pêdivî ye ku meriv bi baldarî nêzikî wê bibe da ku karanîna berpirsiyariya daneyên bikarhêner, çareserkirina nepenî û fikarên mafên xweparastinê bicîh bîne. Aloziyên potansiyel ên di daneyên perwerdehiyê de di heman demê de pirsgirêkên dadperweriyê jî derdixînin holê, ku berî her serbestberdana gelemperî ceribandina exlaqî hewce dike da ku kêmasiyên weha kêm bike. Di heman demê de fikar di derbarê potansiyela xirab karanîna modelên AI-ê yên hêzdar ên mîna Gemini de ji bo êrişên sîber jî hene, ku girîngiya bicîhkirina berpirsiyar û çavdêriya domdar di perestgeha AI-ya dînamîkî de ronî dike.

Pêşveçûna Pêşerojê ya Gemini

Google pabendbûna xwe pejirand ku Gemini zêde bike, ji bo guhertoyên pêşerojê bi pêşkeftinên di plansazkirin û bîranînê de hêzdar dike. Wekî din, pargîdanî armanc dike ku pencereya çarçoveyê berfireh bike, ku Gemini bike ku hîn bêtir agahdarî pêvajoyê bike û bersivên nuwaze peyda bike. Gava ku em li hêviya destkeftiyên potansiyel in, kapasîteyên cihêreng ên Gemini ji bo pêşeroja AI-ê perspektîfên sozdar pêşkêş dikin.

The Bottom Line

Gemini ya Google DeepMind di yekbûna AI-ê de guherînek paradîgmayê nîşan dide, ku ji modelên kevneşopî derbas dibe. Bi multîmodalîteya xwemalî û ramana xaç-modal, Gemini di karên tevlihev de pêş dikeve. Tevî kêşeyan, serîlêdanên wê di veguheztina pêşkeftî, bername, tespîtkirin û pêşbîniya darayî de potansiyela wê ronî dike. Gava ku Google bi pêşkeftina xweya pêşerojê re soz dide, bandora kûr a Gemini bi hûrgulî perestgeha AI-ê ji nû ve diafirîne, û destpêka serdemek nû di kapasîteyên multimodal de destnîşan dike.