Вештачка општа интелигенција
Еволуциониот пејзаж на генеративната вештачка интелигенција: Истражување на мешавина од експерти, мултимодалност и потрага по AGI
Областа на вештачката интелигенција (ВИ) забележа огромен раст во 2023 година. Генеративната вештачка интелигенција, која се фокусира на создавање реални содржини како слики, аудио, видео и текст, беше во првите редови на овие достигнувања. Моделите како DALL-E 3, Stable Diffusion и ChatGPT покажаа нови креативни способности, но исто така предизвикаа загриженост околу етиката, предрасудите и злоупотребата.
Како што генеративната вештачка интелигенција продолжува да се развива со брзо темпо, мешавините на експерти (МО), мултимодалното учење и аспирациите кон вештачката општа интелигенција (AGI) изгледаат подготвени да ги обликуваат следните граници на истражување и апликации. Оваа статија ќе обезбеди сеопфатно истражување за моменталната состојба и идната траекторија на генеративната вештачка интелигенција, анализирајќи како иновациите како Gemini на Google и очекуваните проекти како OpenAI Q* го трансформираат пејзажот. Ќе ги испита импликациите во реалниот свет во здравството, финансиите, образованието и другите домени, додека на површина ќе се појават предизвиците околу квалитетот на истражувањето и усогласеноста на вештачката интелигенција со човечките вредности.
Објавувањето на ChatGPT кон крајот на 2022 година конкретно предизвика возбуда и загриженост околу вештачката интелигенција, од неговата импресивна моќ на природниот јазик до нејзиниот потенцијал да шири дезинформации. Во меѓувреме, новиот модел на Google Gemini демонстрира значително подобрена способност за разговор во однос на претходниците како LaMDA преку напредок како што е вниманието на шилестата и плочата. Проектите за шпекулации како Q* на OpenAI укажуваат на комбинирање на разговорната вештачка интелигенција со учењето за засилување.
Овие иновации сигнализираат промена на приоритетот кон мултимодални, разновидни генеративни модели. Натпреварите, исто така, продолжуваат да се вжештуваат меѓу компании како Google, Meta, Anthropic и Cohere кои се борат да ги поместат границите во одговорниот развој на вештачката интелигенција.
Еволуцијата на истражувањето на вештачката интелигенција
Како што растеа способностите, трендовите и приоритетите на истражувањето исто така се менуваа, често одговарајќи на технолошките пресвртници. Подемот на длабокото учење повторно го разгоре интересот за невронските мрежи, додека обработката на природниот јазик се зголеми со моделите на ниво на ChatGPT. Во меѓувреме, вниманието на етиката и понатаму останува како постојан приоритет во услови на брз напредок.
Складиштата за претходно печатење како arXiv, исто така, забележаа експоненцијален раст на поднесоците за вештачка интелигенција, овозможувајќи побрзо ширење, но намалувајќи го прегледот од колегите и зголемувајќи го ризикот од непроверени грешки или пристрасност. Интеракцијата помеѓу истражувањето и влијанието во реалниот свет останува сложена, што бара повеќе координирани напори за да се насочи напредокот.
Министерството за економија и мултимодални системи - следниот бран на генеративна вештачка интелигенција
За да се овозможи поразноврсна, софистицирана вештачка интелигенција во различни апликации, два пристапа добиваат важност се мешавините на експерти (МО) и мултимодалното учење.
Архитектурите на Министерството за економија комбинираат повеќе специјализирани „експерти“ на невронска мрежа оптимизирани за различни задачи или типови на податоци. Близнаците на Google го користи Министерството за економија за да ги совлада долгите разговорни размени и концизното одговарање на прашања. MoE овозможува ракување со поширок опсег на влезови без големина на модел на балон.
Мултимодалните системи како Gemini на Google поставуваат нови одредници со обработка на различни модалитети надвор од само текст. Сепак, реализацијата на потенцијалот на мултимодалната вештачка интелигенција бара надминување на клучните технички пречки и етички предизвици.
Близнаци: Редефинирање на одредниците во мултимодалноста
Gemini е мултимодална разговорна вештачка интелигенција, дизајнирана да ги разбере врските помеѓу текст, слики, аудио и видео. Нејзината двојна структура на енкодер, вкрстено модално внимание и мултимодално декодирање овозможуваат софистицирано контекстуално разбирање. Се верува дека Близнаците ги надминуваат системите за единечни кодери во поврзувањето на текстуалните концепти со визуелните региони. Со интегрирање на структурирано знаење и специјализирана обука, Gemini ги надминува претходниците како GPT-3 и GPT-4 во:
- Ширината на ракувани модалитети, вклучувајќи аудио и видео
- Изведба на репери како масивно разбирање јазик со повеќе задачи
- Генерирање кодови низ програмските јазици
- Приспособливост преку приспособени верзии како Gemini Ultra и Nano
- Транспарентност преку оправдување за аутпути
Технички пречки во мултимодални системи
Реализацијата на робусната мултимодална вештачка интелигенција бара решавање на проблеми во различноста на податоците, приспособливост, евалуација и интерпретабилност. Неурамнотежените збирки на податоци и недоследностите на прибелешките доведуваат до пристрасност. Обработката на повеќе струи на податоци ги оптоварува пресметковните ресурси, барајќи оптимизирани архитектури на модели. Потребен е напредок во механизмите и алгоритмите за внимание за да се интегрираат контрадикторни мултимодални влезови. Проблемите со приспособливоста постојат поради големите пресметковни трошоци. Рафинирањето на метриката за евалуација преку сеопфатни одредници е од клучно значење. Зголемувањето на довербата на корисниците преку објаснета вештачка интелигенција, исто така, останува од витално значење. Решавањето на овие технички пречки ќе биде клучно за отклучување на можностите на мултимодалната вештачка интелигенција.
Составување на градежни блокови за вештачка општа интелигенција
AGI ја претставува хипотетичката можност за совпаѓање или надминување на човечката интелигенција на ВИ во кој било домен. Додека модерната вештачка интелигенција се истакнува во тесните задачи, AGI останува далеку и контроверзна со оглед на неговите потенцијални ризици.
Сепак, зголемениот напредок во областите како што се учењето за пренос, обуката со повеќе задачи, способноста за разговор и апстракцијата е многу поблиску до возвишената визија на AGI. Шпекулативниот Q* проект на OpenAI има за цел да го интегрира учењето за зајакнување во LLM како уште еден чекор напред.
Етичките граници и ризиците од манипулирање со модели со вештачка интелигенција
Џејлбрејковите им овозможуваат на напаѓачите да ги заобиколат етичките граници поставени за време на процесот на дотерување на вештачката интелигенција. Ова резултира со генерирање на штетни содржини како дезинформации, говор на омраза, е-пошта за кражба на идентитет и злонамерен код, што претставува ризик за поединци, организации и општеството во целина. На пример, џеилбрејкуван модел би можел да произведе содржина која промовира расколни наративи или поддржува сајбер-криминални активности. (Дознај повеќе)
Иако сè уште нема пријавени сајбер напади со користење на џеилбрејк, повеќекратните џеилбрејкови со доказ за концепт се лесно достапни на интернет и се продаваат на темната мрежа. Овие алатки обезбедуваат инструкции дизајнирани да манипулираат со модели на вештачка интелигенција како ChatGPT, потенцијално овозможувајќи им на хакерите да протекуваат чувствителни информации преку чет-ботови на компанијата. Ширењето на овие алатки на платформи како форумите за сајбер криминал ја нагласува итноста за справување со оваа закана. (Прочитај повеќе)
Ублажување на ризиците од Jailbreak
За да се спротивставиме на овие закани, неопходен е повеќестран пристап:
- Цврсто фино подесување: Вклучувањето разновидни податоци во процесот на дотерување ја подобрува отпорноста на моделот на противнички манипулации.
- Обука за противници: Обуката со спротивставени примери ја подобрува способноста на моделот да препознае и да се спротивстави на манипулираните влезови.
- Редовна евалуација: Континуираното следење на резултатите помага во откривање на отстапувања од етичките упатства.
- Човечки надзор: Вклучувањето на човечки рецензенти додава дополнителен слој на безбедност.
Закани од вештачка интелигенција: експлоатација на халуцинации
Халуцинацијата со вештачка интелигенција, каде што моделите генерираат излези кои не се втемелени во нивните податоци за обука, може да се вооружат. На пример, напаѓачите манипулираа со ChatGPT за да препорачаат непостоечки пакети, што доведе до ширење на малициозен софтвер. Ова ја нагласува потребата за континуирана будност и силни контрамерки против таквата експлоатација. (Истражувајте понатаму)
Додека етиката за следење на AGI останува преполна, нејзината аспиративна потрага продолжува да влијае на генеративните насоки за истражување на вештачката интелигенција - без разлика дали сегашните модели личат на отскочни камења или заобиколувања на пат кон вештачка интелигенција на ниво на луѓе.