Connect with us

Штучний інтелект

Представляємо Gemma: відкритий стрибок Google у генераційному AI

mm

Google недавно представив Gemma, відкриту мовну модель, яка поділяє свій технологічний фундамент з Gemini, високорозвиненим AI Google. Названа на честь латинського терміну для “дорогоцінного каменя”, Gemma призначена бути більш доступним аналогом її попередника, Gemini 1.5, зберігаючи при цьому баланс між високими показниками продуктивності та відповідальним використанням. Цей крок до відкритого генераційного AI підкреслює зобов’язання Google щодо демократизації технологій AI, дозволяючи ширше застосування та інновації в цій галузі. Стаття проливає світло на відмінні характеристики Gemma та те, як вона відрізняється від двох провідних відкритих моделей AI на ринку, Meta’s Llama 2 і Mistral’s Mistral 7B.

Gemma: Новий стрибок у моделях мови

Gemma – це сім’я легких, відкритих мовних моделей, доступних у конфігураціях з 2 млрд і 7 млрд параметрів, щоб задовольнити широкий спектр обчислювальних потреб. Її можна розгорнути на різних платформах, включаючи GPU, TPU, CPU та застосунки на пристрої, демонструючи свою універсальність. Архітектура Gemma використовує передові техніки нейронних мереж, зокрема трансформерну архітектуру, основу останніх розробок AI.

Що відрізняє Gemma, це її виняткова продуктивність у текстових завданнях, вона випереджає конкурентів у 11 з 18 академічних бенчмарків. Вона excels у мовному розумінні, висновку, відповідях на питання, повсякденному висновку та спеціалізованих галузях, таких як математика, наука та кодування. Ця продуктивність підкреслює значний внесок Gemma у розвиток мовних моделей.

Ключові особливості

Gemma представляє ряд особливостей, призначених для полегшення доступу та інтеграції до різних рамок та проєктів розробки AI:

  • Сумісність між фреймворками: Gemma пропонує інструменти для висновку та нагляду за тонкою настройкою, сумісними з основними фреймворками розробки, такими як JAX, PyTorch та TensorFlow через вбудований Keras 3.0. Це забезпечує розробникам можливість використовувати свої улюблені інструменти без перешкод адаптації до нових середовищ.
  • Доступ до готових ресурсів: Gemma оснащена Colab та Kaggle notebooks для негайного використання, а також інтеграцією з популярними платформами, такими як Hugging Face та NVIDIA NeMo. Ці ресурси спрямовані на спрощення процесу початку роботи з Gemma для нових та досвідчених розробників.
  • Гнучке та оптимізоване розгортання: Gemma призначена для використання на різних апаратних засобах, від особистих пристроїв до сервісів у хмарі та IoT пристроїв, оптимізована для апаратури AI, забезпечуючи високу продуктивність на різних пристроях. Вона також підтримує легке розгортання, включаючи Vertex AI та Google Kubernetes Engine.
  • Зобов’язання щодо відповідальності AI: Підкреслюючи безпечний та етичний розвиток AI, Gemma включає автоматичне фільтрування даних, вивчення з підкріпленням від людської обратної зв’язки та всебічне тестування для підтримки високих стандартів надійності та безпеки. Google також пропонує інструменти та ресурси для допомоги розробникам у підтриманні відповідальної практики AI.
  • Заохочення інновацій через сприятливі умови: Умови використання Gemma підтримують відповідальне комерційне застосування та інновації, пропонуючи безкоштовні кредитні ресурси для дослідження та розробки, включаючи доступ до Kaggle, безкоштовний рівень для Colab notebooks та кредитні ресурси Google Cloud для надання можливостей дослідникам та розробникам досліджувати нові межі AI.

Порівняння з іншими відкритими моделями

  • Gemma проти Llama 2: Gemma та Llama 2, розроблені Google та Meta відповідно, демонструють свої унікальні сильні сторони в галузі відкритих мовних моделей, обслуговуючи різні потреби та уподобання користувачів. Gemma особливо оптимізована для завдань у галузі STEM, таких як генерація коду та математичне розв’язання проблем, роблячи її цінним ресурсом для дослідників та розробників, яким потрібні спеціалізовані функції, особливо на платформах NVIDIA. Навпаки, Llama 2 приваблює ширшу аудиторію своєю універсальністю у виконанні ряду загальних мовних завдань, включаючи підсумовування тексту та творче письмо. Спеціалізована спрямованість Gemma на завдання, пов’язані з STEM, може звузити її ширшу придатність у різноманітних реальних сценаріях, тоді як високі обчислювальні вимоги Llama 2 можуть ускладнити її доступність для користувачів з обмеженими ресурсами. Ці відмінності підкреслюють різноманітні застосування та потенційні обмеження технологій AI, відображаючи їх окремі шляхи до внеску у прогрес та виклики в епоху цифрових технологій.
  • Gemma 7B проти Mistral 7B: Хоча Gemma 7B та Mistral AI’s Mistral 7B є легкими, відкритими мовними моделями, вони виділяються у різних галузях. Gemma 7B вирізняється своїми можливостями у генерації коду та математичному розв’язанні проблем, тоді як Mistral 7B визнана за свої логічні висновкові здібності та обробку реальних ситуацій. Незважаючи на ці відмінності, обидві моделі пропонують схожі рівні продуктивності, коли мова йде про швидкість висновку та затримку. Повністю відкрита природа Mistral 7B дозволяє здійснювати більш безпосередні модифікації порівняно з Gemma 7B. Ця різниця в доступності ще більше підкреслюється тим, що Google вимагає від користувачів погодитися з певними умовами перед тим, як вони зможуть використовувати Gemma, спрямованих на забезпечення міцних заходів безпеки та конфіденційності. Навпаки, підхід Mistral AI може представляти виклики у впровадженні подібних стандартів.

Висновок

Gemma від Google представляє значний крок у відкритому генераційному AI, пропонуючи універсальну та доступну мовну модель, призначену як для високої продуктивності, так і для відповідальності використання. Стоячи на технологічній основі високорозвиненого AI Google, Gemini, Gemma призначена для демократизації технологій AI, заохочуючи ширше застосування та інновації. З конфігураціями, розробленими для задоволення різноманітних обчислювальних потреб, та набором особливостей, які забезпечують легкий доступ, сумісність між фреймворками та оптимізоване розгортання, Gemma встановлює новий стандарт у галузі AI. Її виняткова продуктивність у спеціалізованих завданнях STEM виділяє її серед конкурентів, таких як Meta’s Llama 2 та Mistral AI’s Mistral 7B, кожна з яких має свої унікальні сильні сторони. Однак комплексний підхід Gemma до відповідальності розвитку AI та її підтримка інновацій через сприятливі умови використання підкреслюють зобов’язання Google щодо просування технологій AI етичним та доступним способом.

Доктор Техсін Зія є доцентом COMSATS University Islamabad, який має ступінь PhD з штучного інтелекту у Віденському технічному університеті, Австрія. Спеціалізується на штучному інтелекті, машинному навчанні, науці про дані та комп'ютерному баченні, він зробив значний внесок з публікаціями в авторитетних наукових журналах. Доктор Техсін також очолював різні промислові проекти як головний дослідник і служив консультантом з штучного інтелекту.