Sztuczna inteligencja
Wykorzystywanie Krzemu: Jak Własne Czipy Kształtują Przyszłość Sztucznej Inteligencji
Sztuczna inteligencja, podobnie jak każde oprogramowanie, opiera się na dwóch podstawowych składnikach: programach sztucznej inteligencji, często określanych jako modele, oraz sprzęcie komputera, czyli czipach, które napędzają te programy. Do tej pory główny nacisk w rozwoju sztucznej inteligencji był położony na udoskonalenie modeli, podczas gdy sprzęt był zazwyczaj postrzegany jako standardowy komponent dostarczany przez dostawców zewnętrznych. Ostatnio jednak ten podejście zaczęło się zmieniać. Duże firmy sztucznej inteligencji, takie jak Google, Meta i Amazon, rozpoczęły rozwój własnych czipów sztucznej inteligencji. Wewnętrzny rozwój niestandardowych czipów sztucznej inteligencji zapowiada nową erę w rozwoju sztucznej inteligencji. Artykuł ten będzie badał powody za tym zmianą podejścia i przedstawi najnowsze rozwoju w tej ewoluującej dziedzinie.
Dlaczego Wewnętrzny Rozwój Czipów Sztucznej Inteligencji?
Zmiana w kierunku wewnętrznego rozwoju niestandardowych czipów sztucznej inteligencji jest napędzana przez kilka krytycznych czynników, w tym:
Rozwój Popytu Na Czipy Sztucznej Inteligencji
Tworzenie i używanie modeli sztucznej inteligencji wymaga znacznych zasobów obliczeniowych, aby skutecznie obsłużyć duże ilości danych i wygenerować dokładne przewidywania lub spostrzeżenia. Tradycyjne czipy komputerowe nie są w stanie obsłużyć wymagań obliczeniowych podczas szkolenia na trylionach punktów danych. To ograniczenie doprowadziło do stworzenia zaawansowanych czipów sztucznej inteligencji, które są specjalnie zaprojektowane, aby spełnić wysokie wymagania wydajności i efektywności nowoczesnych aplikacji sztucznej inteligencji. W miarę jak badania i rozwój sztucznej inteligencji nadal rosną, rośnie również popyt na te specjalistyczne czipy.
Nvidia, lider w produkcji zaawansowanych czipów sztucznej inteligencji i znacznie wyprzedzający swoich konkurentów, stoi przed wyzwaniami, ponieważ popyt znacznie przekracza jego zdolność produkcyjną. Sytuacja ta doprowadziła do listy oczekujących na czipy Nvidia, które zostały wydłużone do kilku miesięcy, opóźnienie, które nadal rośnie, ponieważ popyt na ich czipy sztucznej inteligencji rośnie. Ponadto rynek czipów, który obejmuje głównych graczy, takich jak Nvidia i Intel, napotkał wyzwania w produkcji czipów. Problem ten wynika z ich zależności od tajwańskiego producenta TSMC w zakresie montażu czipów. Ta zależność od jednego producenta prowadzi do wydłużonych czasów oczekiwania na produkcję tych zaawansowanych czipów.
Czas Obliczeń Sztucznej Inteligencji Jest Energooszczędny I Zrównoważony
Bieżąca generacja czipów sztucznej inteligencji, które są zaprojektowane do ciężkich zadań obliczeniowych, mają tendencję do zużycia dużej ilości energii i generowania znacznych ilości ciepła. To doprowadziło do znacznych implikacji środowiskowych dla szkolenia i używania modeli sztucznej inteligencji. Badacze OpenAI zwracają uwagę, że: od 2012 roku, moc obliczeniowa wymagana do szkolenia zaawansowanych modeli sztucznej inteligencji podwaja się co 3,4 miesiąca, co sugeruje, że do 2040 roku emisje z sektora technologii informacyjnej i komunikacyjnej (ICT) mogą stanowić 14% globalnych emisji. Inne badanie wykazało, że szkolenie jednego dużego modelu językowego może emitować do 284 000 kg CO2, co jest równoważne z zużyciem energii przez pięć samochodów w ciągu ich całego życia. Ponadto szacuje się, że zużycie energii przez centra danych wzrośnie o 28 procent do 2030 roku. Te ustalenia podkreślają konieczność znalezienia równowagi między rozwojem sztucznej inteligencji a odpowiedzialnością środowiskową. W odpowiedzi wiele firm sztucznej inteligencji inwestuje obecnie w rozwój bardziej efektywnych energetycznie czipów, mając na celu uczynienie szkolenia i operacji sztucznej inteligencji bardziej zrównoważonymi i przyjaznymi dla środowiska.
Dostosowywanie Czipów Do Specjalistycznych Zadań
Różne procesy sztucznej inteligencji mają różne wymagania obliczeniowe. Na przykład, szkolenie modeli głębokiego uczenia wymaga znacznej mocy obliczeniowej i wysokiej przepustowości, aby obsłużyć duże zestawy danych i wykonać złożone obliczenia szybko. Czipy zaprojektowane do szkolenia są zoptymalizowane, aby poprawić te operacje, zwiększając szybkość i wydajność. Z drugiej strony, proces inferencji, w którym model stosuje swoją wiedzę, aby dokonać przewidywań, wymaga szybkiej przetwarzania z minimalnym zużyciem energii, zwłaszcza w urządzeniach brzegowych, takich jak smartfony i urządzenia IoT. Czipy do inferencji są zaprojektowane, aby zoptymalizować wydajność na wat, zapewniając szybką reakcję i oszczędność baterii. To specjalistyczne dostosowanie projektów czipów do zadań szkolenia i inferencji pozwala na precyzyjne dostosowanie każdego czipu do jego przeznaczenia, poprawiając wydajność w różnych urządzeniach i aplikacjach. Ten rodzaj specjalizacji nie tylko wspiera bardziej zaawansowane funkcje sztucznej inteligencji, ale także promuje większą efektywność energetyczną i opłacalność.
Reducowanie Finansowych Obciążeń
Finansowe obciążenie obliczeń dla szkolenia i operacji modeli sztucznej inteligencji pozostaje znaczne. OpenAI, na przykład, używa obszernego superkomputera stworzonego przez Microsoft do szkolenia i inferencji od 2020 roku. Kosztowało OpenAI około 12 milionów dolarów, aby przeszkolić swój model GPT-3, a wydatek wzrósł do 100 milionów dolarów za szkolenie GPT-4. Zgodnie z raportem SemiAnalysis, OpenAI potrzebuje około 3617 serwerów HGX A100, łącznie 28 936 GPU, aby obsłużyć ChatGPT, co daje średni koszt na zapytanie około 0,36 dolara. Biorąc pod uwagę te wysokie koszty, Sam Altman, dyrektor generalny OpenAI, szuka znacznych inwestycji, aby zbudować światową sieć zakładów produkujących czipy sztucznej inteligencji, zgodnie z raportem Bloomberg.
Kontrolowanie Innowacji
Czipy sztucznej inteligencji od dostawców zewnętrznych często mają ograniczenia. Firmy, które polegają na tych czipach, mogą znaleźć się ograniczone przez rozwiązania standardowe, które nie są w pełni dostosowane do ich unikalnych modeli sztucznej inteligencji lub aplikacji. Wewnętrzny rozwój czipów pozwala na dostosowanie do konkretnych przypadków użycia. Niezależnie od tego, czy jest to samochód autonomiczny, czy urządzenie mobilne, kontrolowanie sprzętu pozwala firmom w pełni wykorzystać swoje algorytmy sztucznej inteligencji. Niestandardowe czipy mogą poprawić określone zadania, zmniejszyć opóźnienia i poprawić ogólną wydajność.
Najnowsze Postępy W Rozwoju Czipów Sztucznej Inteligencji
Ten dział opisuje najnowsze osiągnięcia Google, Meta i Amazon w budowaniu technologii czipów sztucznej inteligencji.
Procesory Axion Google
Google stale postępuje w dziedzinie technologii czipów sztucznej inteligencji od wprowadzenia Tensor Processing Unit (TPU) w 2015 roku. Budując na tej podstawie, Google niedawno wprowadził procesory Axion, swoje pierwsze niestandardowe procesory CPU specjalnie zaprojektowane dla centrów danych i obciążeń sztucznej inteligencji. Procesory te opierają się na architekturze Arm, znanej z ich wydajności i kompaktowej konstrukcji. Procesory Axion mają na celu poprawić wydajność obciążeń sztucznej inteligencji opartych na CPU i inferencji, przy jednoczesnym zachowaniu efektywności energetycznej. Ten postęp oznacza również znaczny wzrost wydajności dla różnych ogólnych obciążeń, w tym serwerów sieciowych i aplikacji, kontenerowych usług, otwartych baz danych, pamięci podręcznych, silników analitycznych danych, przetwarzania multimediów i więcej.
MTIA Meta
Meta posuwa się do przodu w technologii czipów sztucznej inteligencji z Meta Training and Inference Accelerator (MTIA). Narzędzie to jest zaprojektowane, aby zwiększyć wydajność procesów szkolenia i inferencji, zwłaszcza dla algorytmów rankingowych i rekomendacyjnych. Meta niedawno opisał, jak MTIA jest kluczową częścią swojej strategii, aby wzmocnić swoją infrastrukturę sztucznej inteligencji poza GPU. Początkowo zaplanowane do uruchomienia w 2025 roku, Meta już wprowadził obie wersje MTIA do produkcji, pokazując szybszy tempa w swoich planach rozwoju czipów. Chociaż MTIA obecnie koncentruje się na szkoleniu określonych typów algorytmów, Meta planuje rozszerzyć jego użycie, aby objąć szkolenie generatywnej sztucznej inteligencji, takiej jak modele językowe Llama.
Trainium i Inferentia Amazon
Od czasu wprowadzenia niestandardowego czipu Nitro w 2013 roku, Amazon znacznie rozszerzył swój rozwój czipów sztucznej inteligencji. Firma niedawno przedstawiła dwie innowacyjne czipy sztucznej inteligencji, Trainium i Inferentia. Trainium jest specjalnie zaprojektowany, aby poprawić szkolenie modeli sztucznej inteligencji i ma być włączony do EC2 UltraClusters. Klaster ten, który może obsłużyć do 100 000 czipów, jest zoptymalizowany do szkolenia modeli podstawowych i dużych modeli językowych w sposób efektywny energetycznie. Inferentia, z drugiej strony, jest dostosowana do zadań inferencji, w których modele sztucznej inteligencji są aktywnie stosowane, koncentrując się na zmniejszaniu opóźnień i kosztów podczas inferencji, aby lepiej obsłużyć potrzeby milionów użytkowników, którzy wchodzą w interakcje z usługami napędzanymi sztuczną inteligencją.
Podsumowanie
Ruch w kierunku wewnętrznego rozwoju niestandardowych czipów sztucznej inteligencji przez duże firmy, takie jak Google, Microsoft i Amazon, odzwierciedla strategiczną zmianę, aby rozwiązać rosnące potrzeby obliczeniowe technologii sztucznej inteligencji. Tendencja ta podkreśla konieczność rozwiązań, które są specjalnie dostosowane do efektywnej obsługi modeli sztucznej inteligencji, spełniając unikalne wymagania tych zaawansowanych systemów. W miarę jak popyt na czipy sztucznej inteligencji nadal rośnie, liderzy branży, tacy jak Nvidia, prawdopodobnie zobaczą znaczny wzrost wyceny rynkowej, podkreślając kluczową rolę, jaką niestandardowe czipy odgrywają w rozwijaniu innowacji sztucznej inteligencji. Tworząc własne czipy, te giganci technologiczni nie tylko poprawiają wydajność i efektywność swoich systemów sztucznej inteligencji, ale także promują bardziej zrównoważoną i opłacalną przyszłość. Ewolucja ta ustanawia nowe standardy w branży, napędzając postęp technologiczny i przewagę konkurencyjną na szybko zmieniającym się rynku globalnym.










