Sztuczna inteligencja

‘Tokenmaxxing’ Ujawnia Wyzwania Związane z Kosztami Sztucznej Inteligencji

mm
Closeup of stacks of gold tokens.

Rozwój sztucznej inteligencji (AI) spowodował, że organizacje coraz częściej włączają ją do swoich operacji biznesowych. Wraz ze wzrostem wykorzystania AI, rośnie również zapotrzebowanie na moc obliczeniową, co skłania do zwrócenia uwagi na tokeny, które modele zużywają do przetwarzania i generowania informacji. Każde zapytanie, odpowiedź i automatyczny workflow opiera się na nich, co sprawia, że zużycie tokenów jest kluczowe dla określenia kosztów wdrożenia AI.

Przyczyniło się to do wzrostu tokenmaxxing, czyli praktyki maksymalizowania wartości uzyskiwanej z modeli AI poprzez większe zapytania i dłuższe rozmowy. Chociaż ta aplikacja demonstruje rosnące możliwości i użyteczność nowoczesnych systemów AI, również podkreśla rosnące koszty związane z większym zużyciem tokenów.

Czym Jest Tokenmaxxing?

Tokenmaxxing polega na używaniu większych zapytań i przypisywaniu złożonych zadań systemom AI. Zamiast ograniczać AI do prostych pytań lub krótkich żądań, użytkownicy dostarczają obszernych kontekstów i polegają na modelach, aby ukończyć wieloetapowe workflow w jednej interakcji. Trend ten zyskał na popularności, gdyż dostawcy AI wprowadzili większe okna kontekstowe, które pozwalają modelom przetwarzać więcej informacji na raz.

Bardziej zaawansowane modele również rozszerzyły zakres zadań, które AI może wykonywać. Zachęca to użytkowników i organizacje do konsolidacji badań, analizy i działań wspierających decyzje w mniejszej liczbie, ale bardziej wymagających zapytań. W efekcie tokenmaxxing stał się naturalną odpowiedzią na rosnące możliwości nowoczesnych systemów AI.

Jak Działają Tokeny AI

Tokeny AI są podstawowymi jednostkami tekstu, które modele językowe wykorzystują do przetwarzania i generowania informacji. Zamiast czytać tekst jako pełne słowa, modele AI dzielą treść na mniejsze części, które mogą obejmować całe słowa, części słów lub pojedyncze znaki. Interakcje z AI obejmują dwa podstawowe typy tokenów: wejściowe i wyjściowe. Tokeny wejściowe składają się z zapytań i kontekstu wspierającego, podczas gdy tokeny wyjściowe reprezentują tekst wygenerowany w odpowiedzi.

Większość dostawców AI wykorzystuje cenę opartą na tokenach, co oznacza, że klienci są rozliczani zgodnie z liczbą tokenów wejściowych i wyjściowych. Koszty rosną wraz ze wzrostem długości zapytań, odpowiedzi stają się bardziej szczegółowe lub aplikacje obsługują większe ilości żądań. Zużycie tokenów wpływa na wiele aplikacji AI, w tym chatboty obsługi klienta i narzędzia wyszukiwania AI, co sprawia, że zużycie tokenów jest istotne dla ogólnych kosztów wdrożenia.

Dlaczego Rosnące Koszty Tokenów Stają Się Problemem

Wraz ze wzrostem wykorzystania AI generatywnej, zużycie tokenów rośnie szybciej niż oczekiwano. Co zaczyna się jako zarządzalny wydatek operacyjny, może szybko stać się znacznym wyzwaniem kosztowym, gdy AI jest wdrażany w firmach i procesach biznesowych.

Rosnące Zapotrzebowanie Na Moc Obliczeniową AI

Rozwój AI powoduje gwałtowny wzrost kosztów inferencyjnych, gdy więcej osób i organizacji korzysta z narzędzi AI przez cały dzień. W rzeczywistości 26% Amerykanów zgłasza korzystanie z nich kilka razy dziennie, czy to przez asystentów wirtualnych, czy silniki rekomendacji. Wraz ze wzrostem wykorzystania, dostawcy AI muszą przetwarzać więcej żądań, co skutkuje wyższymi wymaganiami obliczeniowymi i większym zużyciem tokenów.

Jednocześnie większe okna kontekstowe i zdolności multimodalne zwiększają ilość informacji, które modele muszą przetwarzać podczas każdej interakcji. Użytkownicy mogą teraz przesyłać długie dokumenty i obrazy, oczekując szczegółowych, kontekstowo świadomych odpowiedzi.

Agenci AI zwiększają te koszty, wykonując wiele połączeń modeli, pobierając informacje i wykonując wieloetapowe procesy rozumowania w tle. To, co wydaje się pojedynczym żądaniem użytkownika, może w rzeczywistości obejmować wiele interakcji AI, co zwiększa zużycie tokenów i wydatki operacyjne.

Wyzwania Biznesowe Stworzone Przez Cenę Opisaną Na Tokenach

Prognozowanie wydatków AI pozostaje wyzwaniem, ponieważ zużycie tokenów może fluktuować znacznie wraz ze zmianą wzorców użytkowania. Projekt, który wydaje się ekonomiczny podczas testowania, może generować znacznie wyższe wydatki, gdy zostanie wdrożony w firmie. Popyt sezonowy i rosnące obciążenia AI mogą utrudnić przewidywanie miesięcznych wydatków.

Wiele firm stoi również przed paradoksem, że udane wdrożenia AI prowadzą do wyższych wydatków operacyjnych. Gdy firmy zwracają się do agentów AI, aby zwiększyć produktywność i zautomatyzować więcej zadań, łączne koszty mogą gwałtownie wzrosnąć, nawet jeśli cena każdego tokenu spadnie. Agenci AI wykonują wiele akcji w tle, co powoduje, że zużycie tokenów rośnie szybko wraz ze wzrostem adopcji.

Trendy te podniosły obawy dotyczące zysku i zarządzania AI na poziomie przedsiębiorstwa. Firmy muszą określić, jak alokować koszty w różnych departamentach i zapewnić, że inwestycje AI przynoszą wymierne korzyści. Jednocześnie stają przed stałym wyzwaniem balansowania wydajności modelu z efektywnością kosztową, ponieważ najbardziej zaawansowane modele mają najwyższe wydatki operacyjne.

Jak Firmy Redukują Wydatki Na Tokeny AI

Rosnące koszty tokenów skłoniły firmy do poszukiwania sposobów na maksymalizację wartości ich inwestycji w AI bez poświęcania wydajności. Wraz ze wzrostem adopcji AI, wdrażają one szereg strategii, aby kontrolować zużycie tokenów i utrzymywać przewidywalne wydatki operacyjne.

Strategie Optymalizacji Dla Użytkowników AI

Firmy redukują zużycie tokenów poprzez techniki inżynierii zapytań, które eliminują niepotrzebny tekst i poprawiają wydajność. Jasne, ukierunkowane zapytania i standaryzowane szablony mogą generować lepsze wyniki, używając mniejszej liczby tokenów. Wiele firm wykorzystuje również trasowanie modeli, gdzie mniejsze, tańsze modele obsługują rutynowe zadania, a zaawansowane modele są zarezerwowane dla złożonych zadań wymagających większych zdolności rozumowania.

Inną popularną strategią jest generacja uzupełniona o pobieranie, która pobiera tylko najbardziej istotne informacje, zamiast wysyłać większe ilości kontekstu z każdym żądaniem. Podejście to redukuje zużycie tokenów, utrzymując dokładność. Aby dalej kontrolować koszty, organizacje wdrażają narzędzia monitorowania i ramy zarządzania AI, które zapewniają wgląd w wzorce zużycia i wspierają odpowiedzialną adopcję AI.

Rzeczywiste Kompromisy Między Kosztem A Wydajnością

Firmy wybierają tańsze modele AI dla zadań rutynowych, takich jak podsumowanie, klasyfikacja i ekstrakcja danych, gdzie premium zdolności rozumowania mogą zapewnić ograniczoną dodatkową wartość. Rozważania kosztowe mogą również wpływać na szersze decyzje strategiczne.

Na przykład Microsoft rzekomo zakończył licencje Claude Code, ponieważ nie chce już wynajmować inteligencji konkurenta. Zamiast tego kieruje developerów w kierunku modelu kodowania opracowanego na potrzeby Copilot. Decyzje takie odzwierciedlają rosnące starania, aby zredukować wydatki AI, utrzymując kontrolę nad inwestycjami technologicznymi.

Jednak nadmierne cięcia kosztów mogą wprowadzić nowe wyzwania. Tańsze modele mogą generować mniej dokładne wyniki lub wymagać dodatkowego nadzoru ludzkiego, co redukuje część oczekiwanych oszczędności. Firmy muszą ocenić czynniki, takie jak złożoność zadania i wpływ biznesowy, przy wyborze modeli AI. Celem jest zbalansowanie efektywności i wydajności, zapewniając, że redukcja kosztów nie następuje kosztem jakości lub doświadczenia użytkownika.

Jak Firmy AI Reagują

Dostawcy AI oferują opcje modeli warstwowych i elastyczne struktury cenowe, aby dostosować się do różnych wzorców użytkowania i budżetów. Firmy mogą wybierać spośród szeregu modeli o różnych poziomach wydajności i kosztów, co pozwala im dopasować możliwości AI do konkretnych obciążeń.

Na przykład OpenAI zapewnia plany subskrypcyjne dla użytkowników, którzy chcą przewidywalnego dostępu i stabilniejszych wydatków miesięcznych. Oferuje również cenę opartą na tokenach dla klientów o większych lub mniej przewidywalnych obciążeniach.

Poza tradycyjnym rozliczaniem opartym na użyciu, niektórzy dostawcy eksperymentują z subskrypcjami i modelami cenowymi opartymi na zadaniach, które ułatwiają przewidywanie kosztów. Jednocześnie modele open-source i wdrożenia hostowane samodzielnie zyskują na popularności jako alternatywy dla rozliczania opartego na tokenach. Opcje te mogą dać firmom większą kontrolę nad wydatkami operacyjnymi i infrastrukturą, chociaż wymagają dodatkowej wiedzy technicznej i zasobów obliczeniowych do efektywnego zarządzania.

Balansowanie Wydajności AI I Wydatków

Wraz ze wzrostem adopcji AI, rosnące zużycie tokenów tworzy nowe wyzwania kosztowe dla firm i dostawców AI. Firmy reagują na to strategiami, takimi jak optymalizacja zapytań, trasowanie modeli i silniejsze praktyki zarządzania, aby kontrolować wydatki na tokenmaxxing, utrzymując jednocześnie wydajność. W efekcie zrozumienie ekonomii tokenów staje się niezbędną częścią skutecznego skalowania i zarządzania technologiami AI.

Zac Amos jest pisarzem technicznym, który specjalizuje się w sztucznej inteligencji. Jest również redaktorem działu w ReHack, gdzie można przeczytać więcej jego prac.