Connect with us

Wzrost Jednostek Przetwarzania Neuronowego: Ulepszanie Generatywnego AI na Urządzeniach pod względem Prędkości i Zrównoważoności

Sztuczna inteligencja

Wzrost Jednostek Przetwarzania Neuronowego: Ulepszanie Generatywnego AI na Urządzeniach pod względem Prędkości i Zrównoważoności

mm

Ewolucja generatywnego AI nie tylko zmienia nasze interakcje i doświadczenia z urządzeniami komputerowymi, ale również redefineuje rdzeń komputera. Jednym z kluczowych czynników transformacji jest potrzeba działania generatywnego AI na urządzeniach z ograniczonymi zasobami obliczeniowymi. Artykuł omawia wyzwania, jakie się pojawiają, oraz jak jednostki przetwarzania neuronowego (NPUs) wyłaniają się, aby rozwiązać te problemy. Dodatkowo, artykuł przedstawia niektóre z najnowszych procesorów NPU, które są pionierami w tej dziedzinie.

Wyzwania Infrastruktury Generatywnego AI na Urządzeniach

Generatywne AI, potęga stojąca za syntezą obrazu, generowaniem tekstu i kompozycją muzyki, wymaga znacznych zasobów obliczeniowych. Konwencjonalnie, te wymagania były spełnione przez wykorzystanie ogromnych możliwości platform chmurowych. Chociaż skuteczne, ten podejście wiąże się z własnym zestawem wyzwań dla generatywnego AI na urządzeniach, w tym zależnością od stałego połączenia z Internetem i scentralizowanej infrastruktury. Ta zależność wprowadza opóźnienia, luki w zabezpieczeniach i zwiększone zużycie energii.

Trzon infrastruktury AI opartej na chmurze w dużej mierze opiera się na centralnych jednostkach przetwarzania (CPUs) i jednostkach przetwarzania grafiki (GPUs) w celu obsłużenia wymagań obliczeniowych generatywnego AI. Jednakże, gdy są one stosowane do generatywnego AI na urządzeniach, te procesory napotykają znaczne przeszkody. Procesory CPU są zaprojektowane do zadań ogólnego przeznaczenia i nie posiadają specjalistycznej architektury niezbędnej do wydajnego i niskiego zużycia energii wykonywania obciążeń generatywnego AI. Ich ograniczone możliwości przetwarzania równoległego powodują zmniejszoną wydajność, zwiększone opóźnienia i wyższe zużycie energii, co czyni je mniej odpowiednimi do AI na urządzeniach. Z drugiej strony, chociaż procesory GPU mogą wyróżniać się przetwarzaniem równoległym, są one głównie zaprojektowane do zadań przetwarzania grafiki. Aby skutecznie wykonywać zadania generatywnego AI, procesory GPU wymagają specjalistycznych układów scalonych, które zużywają dużo energii i generują znaczne ciepło. Ponadto, ich duża wielkość fizyczna stwarza przeszkody dla ich użycia w kompaktowych aplikacjach na urządzeniach.

Wzrost Jednostek Przetwarzania Neuronowego (NPUs)

W odpowiedzi na powyższe wyzwania, jednostki przetwarzania neuronowego (NPUs) wyłaniają się jako przełomowa technologia do wdrażania generatywnego AI na urządzeniach. Architektura NPU jest głównie inspirowana strukturą i funkcją ludzkiego mózgu, szczególnie tym, jak neurony i synapsy współpracują w celu przetwarzania informacji. W NPU, sztuczne neurony działają jako podstawowe jednostki, naśladując biologiczne neurony przez odbieranie danych wejściowych, przetwarzanie ich i wytwarzanie danych wyjściowych. Te neurony są połączone za pomocą sztucznych synaps, które przekazują sygnały między neuronami o różnych siłach, które dostosowują się podczas procesu uczenia. To naśladuje proces zmiany wag synaptycznych w mózgu. NPU są zorganizowane w warstwy; warstwy wejściowe, które odbierają surowe dane, warstwy ukryte, które wykonują pośrednie przetwarzanie, i warstwy wyjściowe, które generują wyniki. Ta warstwowa struktura odzwierciedla wieloetapową i równoległą zdolność przetwarzania informacji w mózgu. Ponieważ generatywne AI jest również zbudowane przy użyciu podobnej struktury sztucznych sieci neuronowych, NPU są dobrze przystosowane do zarządzania obciążeniami generatywnego AI. To wyrównanie strukturalne redukuje potrzebę specjalistycznych układów scalonych, prowadząc do bardziej kompaktowych, energooszczędnych, szybszych i zrównoważonych rozwiązań.

Rozwiązywanie Różnorodnych Potrzeb Obliczeniowych Generatywnego AI

Generatywne AI obejmuje szeroki zakres zadań, w tym syntezę obrazu, generowanie tekstu i kompozycję muzyki, każde z własnym zestawem unikalnych wymagań obliczeniowych. Na przykład, synteza obrazu silnie opiera się na operacjach macierzowych, podczas gdy generowanie tekstu wiąże się z przetwarzaniem sekwencyjnym. Aby skutecznie sprostać tym różnorodnym potrzebom obliczeniowym, jednostki przetwarzania neuronowego (NPUs) są często integrowane z technologią System-on-Chip (SoC) obok CPU i GPU.

Każdy z tych procesorów oferuje odrębne zalety obliczeniowe. Procesory CPU są szczególnie uzdolnione w sekwencyjnej kontroli i natychmiastowości, procesory GPU wyróżniają się w przetwarzaniu strumieniowym danych równoległych, a NPU są doskonale dostosowane do podstawowych operacji AI, zajmujących się matematyką skalarną, wektorową i tensorową. Poprzez wykorzystanie heterogenicznej architektury obliczeniowej, zadania mogą być przypisane do procesorów na podstawie ich zalet i wymagań konkretnego zadania.

NPU, zoptymalizowane do obciążeń AI, mogą wydajnie odciążyć zadania generatywnego AI z głównego CPU. To odciążenie nie tylko zapewnia szybkie i energooszczędne operacje, ale także przyspiesza zadania inferencyjne AI, pozwalając modelom generatywnego AI działać bardziej płynnie na urządzeniu. Z NPU zajmującymi się zadaniami związanymi z AI, procesory CPU i GPU są wolne, aby przydzielić zasoby do innych funkcji, tym samym poprawiając ogólną wydajność aplikacji przy zachowaniu efektywności termicznej.

Prawdziwe Przykłady NPU

Postęp NPU zyskuje na impetzie. Oto niektóre przykłady NPU w świecie rzeczywistym:

  • Hexagon NPU firmy Qualcomm jest specjalnie zaprojektowany do przyspieszania zadań inferencyjnych AI przy niskiej mocy i ograniczonych zasobach. Został on zbudowany do obsługi zadań generatywnego AI, takich jak generowanie tekstu, synteza obrazu i przetwarzanie audio. Hexagon NPU jest zintegrowany z platformami Snapdragon firmy Qualcomm, zapewniając wydajną realizację modeli sieci neuronowych na urządzeniach z produktami AI firmy Qualcomm.
  • Silnik Neuronowy Apple jest kluczowym składnikiem chipów serii A i M, napędzając różne funkcje oparte na AI, takie jak Face ID, Siri i rzeczywistość rozszerzoną (AR). Silnik Neuronowy przyspiesza zadania, takie jak rozpoznawanie twarzy dla bezpiecznego Face ID, przetwarzanie języka naturalnego (NLP) dla Siri oraz ulepszoną śledzenie obiektów i zrozumienie sceny dla aplikacji AR. Zdecydowanie poprawia wydajność zadań związanych z AI na urządzeniach Apple, zapewniając płynne i efektywne doświadczenie użytkownika.
  • NPU Samsunga to specjalistyczny procesor zaprojektowany do obliczeń AI, zdolny do wykonywania tysięcy obliczeń jednocześnie. Zintegrowany z najnowszymi układami SoC Exynos, które napędzają wiele telefonów Samsunga, ta technologia NPU umożliwia niską moc i wysoką prędkość obliczeń generatywnego AI. Technologia NPU Samsunga jest również zintegrowana z flagowymi telewizorami, umożliwiając innowacje dźwięku opartego na AI i poprawiając doświadczenie użytkownika.
  • Architektura Da Vinci firmy Huawei służy jako rdzeń ich procesora AI Ascend, zaprojektowanego do zwiększenia mocy obliczeniowej AI. Architektura wykorzystuje wysokowydajny silnik obliczeniowy 3D, co czyni go potężnym dla obciążeń AI.

Podsumowanie

Generatywne AI zmienia nasze interakcje z urządzeniami i redefineuje komputery. Wyzwanie polegające na uruchomieniu generatywnego AI na urządzeniach z ograniczonymi zasobami obliczeniowymi jest znaczne, a tradycyjne CPU i GPU często nie są w stanie sprostać temu wyzwaniu. Jednostki przetwarzania neuronowego (NPUs) oferują obiecujące rozwiązanie ze specjalistyczną architekturą zaprojektowaną do spełnienia wymagań generatywnego AI. Poprzez integrację NPU z technologią System-on-Chip (SoC) obok CPU i GPU, możemy wykorzystać zalety każdego procesora, prowadząc do szybszych, bardziej wydajnych i zrównoważonych wyników AI na urządzeniach. W miarę ewolucji NPU, są one przeznaczone do ulepszania możliwości AI na urządzeniach, czyniąc aplikacje bardziej responsywnymi i energooszczędnymi.

Dr. Tehseen Zia jest profesorem nadzwyczajnym w COMSATS University Islamabad, posiada tytuł doktora w dziedzinie sztucznej inteligencji na Vienna University of Technology, Austria. Specjalizując się w sztucznej inteligencji, uczeniu maszynowym, nauce o danych i widzeniu komputerowym, wniósł znaczący wkład poprzez publikacje w renomowanych czasopismach naukowych. Dr. Tehseen Zia również kierował różnymi projektami przemysłowymi jako główny badacz i pełnił funkcję konsultanta ds. sztucznej inteligencji.