Поврзете се со нас

Мислите лидери

Еволуцијата на обуката за модели со вештачка интелигенција: надвор од големината до ефикасност

mm

Објавено

 on

Во пејзажот на вештачката интелигенција кој брзо се развива, традиционалниот пристап за подобрување на јазичните модели преку само зголемување на големината на моделот претрпува клучна трансформација. Оваа промена го нагласува постратешкиот пристап, фокусиран на податоци, како што е примерот со неодамнешните случувања во моделите како Лама3.

Податоците се се што ви треба

Историски гледано, преовладувачкото верување во унапредувањето на способностите за вештачка интелигенција е дека поголемото, тоа е подобро.

Во минатото, бевме сведоци на драматично зголемување на можностите за длабоко учење едноставно со додавање повеќе слоеви на невронските мрежи. Алгоритми и апликации како препознавање слики, кои некогаш биле само теоретски можни пред појавата на длабоко учење, брзо стана широко прифатен. Развојот на графички картички дополнително го засили овој тренд, овозможувајќи им на поголемите модели да работат со зголемена ефикасност. Овој тренд се пренесе и на сегашната возбуда на големиот јазичен модел.

Периодично, наидуваме на најави од големи компании за вештачка интелигенција кои објавуваат модели со десетици, па дури и стотици милијарди параметри. Лесно е да се разбере образложението: колку повеќе параметри поседува моделот, толку тој станува повешт. Сепак, овој метод на скалирање со брутална сила достигна точка на намалување на приносите, особено кога се зема предвид исплатливоста на таквите модели во практична примена. Неодамнешната објава на Мета за пристапот Llama3, кој користи 8 милијарди параметри, но е збогатен со 6-7 пати поголем број на висококвалитетни податоци за обука, одговара - а во некои сценарија, ја надминува - ефикасноста на претходните модели како GPT3.5, кои може да се пофали со над 100 милијарди параметри. Ова означува значајна свртница во законот за скалирање за јазичните модели, каде што квалитетот и квантитетот на податоците почнуваат да имаат предност пред чистата големина.

Трошоци наспроти перформанси: деликатна рамнотежа

Како што моделите за вештачка интелигенција (ВИ) преминуваат од развој кон практична употреба, нивното економско влијание, особено високите оперативни трошоци на моделите од големи размери, стануваат сè позначајни. Овие трошоци често ги надминуваат трошоците за почетна обука, нагласувајќи ја потребата од пристап за одржлив развој кој дава приоритет на ефикасната употреба на податоци наместо проширувањето на големината на моделот. Стратегии како зголемување на податоците трансфер учење може да ги подобри збирките на податоци и да ја намали потребата за опсежна преквалификација. Рационализирањето на моделите преку изборот на карактеристики и намалувањето на димензионалноста ја подобрува пресметковната ефикасност и ги намалува трошоците. Техниките како што се напуштање и предвремено запирање ја подобруваат генерализацијата, дозволувајќи им на моделите да работат ефективно со помалку податоци. Алтернативните стратегии за распоредување, како што е рабното пресметување, ја намалуваат зависноста од скапата облак инфраструктура, додека пресметувањето без сервер нуди скалабилно и економично користење на ресурсите. Со фокусирање на развој во центарот на податоци и истражување на методите за економично распоредување, организациите можат да воспостават поодржлив екосистем за вештачка интелигенција што ги балансира перформансите со економичноста.

Намалувањето на враќањето на поголемите модели

Пејзажот на развојот на вештачката интелигенција е подложен на промена на парадигмата, со растечки акцент на ефикасното користење на податоците и оптимизацијата на моделите. Централизираните компании за вештачка интелигенција традиционално се потпираат на создавање сè поголеми модели за да постигнат најсовремени резултати. Сепак, оваа стратегија станува сè понеодржлива, како во однос на пресметковните ресурси, така и во однос на приспособливоста.

Децентрализираната вештачка интелигенција, од друга страна, претставува различен сет на предизвици и можности. Децентрализираните блокчејн мрежи, кои ја формираат основата на децентрализираната вештачка интелигенција, имаат фундаментално различен дизајн во споредба со централизираните компании за вештачка интелигенција. Ова го прави предизвик за потфатите со децентрализирана вештачка интелигенција да се натпреваруваат со централизирани ентитети во однос на скалирање на поголемите модели додека ја одржуваат ефикасноста во децентрализираните операции.

Ова е местото каде што децентрализираните заедници можат да го максимизираат својот потенцијал и да создадат ниша во пејзажот на вештачката интелигенција. Со искористување на колективната интелигенција и ресурси, децентрализираните заедници можат да развијат и распоредуваат софистицирани модели на вештачка интелигенција кои се и ефикасни и скалабилни. Ова ќе им овозможи ефективно да се натпреваруваат со централизираните компании за вештачка интелигенција и да ја поттикнат иднината на развојот на вештачката интелигенција.

Гледајќи напред: Патот до одржлив развој на вештачката интелигенција

Траекторијата за идниот развој на вештачката интелигенција треба да се фокусира на создавање модели кои не се само иновативни, туку и интегративни и економични. Акцентот треба да се префрли на системи кои можат да постигнат високи нивоа на точност и корисност со управливи трошоци и употреба на ресурси. Таквата стратегија не само што ќе обезбеди приспособливост на технологиите за вештачка интелигенција, туку и нивна пристапност и одржливост на долг рок.

Како што полето на вештачката интелигенција созрева, стратегиите за развој на вештачка интелигенција мора соодветно да се развиваат. Преминот од вреднување на големината кон приоретизирање на ефикасноста и економичноста во обуката за модели не е само технички избор, туку стратешки императив што ќе ја дефинира следната генерација на апликации за вештачка интелигенција. Овој пристап најверојатно ќе катализира нова ера на иновации, каде што развојот на вештачката интелигенција е воден од паметни, одржливи практики кои ветуваат пошироко усвојување и поголемо влијание.

Jiahao Sun, основачот и извршен директор на Flock.io, е алумнус од Оксфорд и е експерт за вештачка интелигенција и блокчејн. Со претходните улоги како директор за вештачка интелигенција за Кралската банка на Канада и истражувач на вештачката интелигенција на Империал колеџ во Лондон, тој го основаше FLock.io за да се фокусира на решенијата за вештачка интелигенција фокусирани на приватноста. Преку неговото лидерство, FLock.io е пионерски напредок во безбедна, колаборативна обука и распоредување на модели на вештачка интелигенција, покажувајќи ја својата посветеност на користењето технологија за општествен напредок.