Connect with us

Claude 3.7 Sonnet to jest odrodzenie AI Anthropic

Sztuczna inteligencja

Claude 3.7 Sonnet to jest odrodzenie AI Anthropic

mm

Firma Anthropic wydała Claude 3.7 Sonnet, wysoko oczekiwany upgrade do swojej rodziny dużych modeli językowych (LLM). Określany jako „najbardziej inteligentny model do tej pory” i pierwszy hybrydowy model rozumnego AI na rynku, Claude 3.7 Sonnet wprowadza kilka dużych ulepszeń w porównaniu z poprzednikiem (Claude 3.5 Sonnet) pod względem szybkości, rozumnego myślenia i wykonywania zadań w świecie rzeczywistym. 

Wydanie to następuje w czasie, gdy konkurenci, tacy jak OpenAI i xAI, wprowadzają szybkie ulepszenia, jak na przykład Grok 3, co powoduje, że wielu entuzjastów AI (w tym ja) postrzega ten launch jako odpowiedź Anthropic na ostatnie innowacje. Nowy model ma na celu połączenie szybkich odpowiedzi konwersacyjnych z głębszym analitycznym myśleniem w jednym systemie – zintegrowanym podejściem, które może pokazać nam, jak będzie wyglądała interakcja z AI w przyszłości. 

Długo oczekiwany upgrade do ukochanego asystenta AI

Dla wielu regularnych użytkowników AI, Claude 3.5 Sonnet był już ulubionym narzędziem. Uważano je za jedno z najlepszych. Jednak w ostatnich miesiącach Anthropic stanął pod coraz większą presją. Przemysł AI szalał nowymi funkcjami i modelami – ChatGPT OpenAI zyskał głos, wieloetapowe zdolności rozumnego myślenia i głębokie badania. Grok 3 zadebiutował z danymi w czasie rzeczywistym, a inne platformy, takie jak Perplexity i Gemini, nieustannie wydawały nowe wersje. Wielu obserwatorów zaczęło zauważać, że Anthropic zaczyna pozostawać w tyle. Społeczność z niecierpliwością oczekiwała odpowiedzi Anthropic, spodziewając się, że nowy model Claude będzie dostępny wkrótce.

Claude 3.7 Sonnet wreszcie nadszedł, aby spełnić te oczekiwania. Jest to znaczący skok do przodu w porównaniu z Claude 3.5, a nie drobna modyfikacja. Anthropic określa go jako kompleksowy upgrade: szybszy, inteligentniejszy i bardziej wszechstronny.

Szybkość i jakość wyjścia modelu są uderzające. W moich własnych testach stwierdziłem, że jest niezwykle szybki w porównaniu z poprzednią wersją, przetwarzając długie wejścia tekstowe niemal natychmiast. Biorąc pod uwagę powolny cykl aktualizacji Anthropic, wydanie 3.7 wydaje się długo oczekiwanym dogonieniem, które odzyskuje pozycję Claude’a w wyścigu AI. Claude 3.7 podwaja to, co sprawiło, że użytkownicy kochali Claude 3.5 – wyjątkową wydajność w praktycznych zadaniach – dodając innowacyjne możliwości rozumnego myślenia pod maską.

Hybrydowe rozumnego myślenia: szybkie odpowiedzi i głębokie myślenie w jednym

Główną cechą Claude 3.7 Sonnet jest jego hybrydowa zdolność rozumnego myślenia. W prostych słowach, ten model może działać w dwóch trybach: standardowym trybie dla niemal natychmiastowych odpowiedzi oraz nowym trybie „rozciągniętego myślenia”, w którym pracuje nad problemami krok po kroku, pokazując swoją łancuch myśli użytkownikowi.

Zamiast wydania oddzielnego modelu Claude z rozszerzonym myśleniem, Anthropic połączył oba tryby – szybkie i głębokie myślenie – w jeden AI. „Tak jak ludzie używają jednego mózgu zarówno do szybkich odpowiedzi, jak i głębokiej refleksji, uważamy, że rozumnego myślenia powinno być zintegrowaną funkcjonalnością… a nie oddzielnym modelem”, wyjaśniła firma w swoim ogłoszeniu, podkreślając zintegrowane podejście dla bezproblemowego doświadczenia użytkownika.

W praktyce oznacza to, że użytkownicy mogą decydować, kiedy chcą szybkiej odpowiedzi, a kiedy pozwalają Claude’mu głębiej rozważyć problem. Prosta funkcja przełączania pozwala przełączyć się do trybu rozszerzonego, jeśli pytanie wymaga szczegółowej analizy lub wieloetapowej logiki. W trybie standardowym Claude 3.7 Sonnet działa jak ulepszona wersja 3.5 – szybsza i bardziej wyrafinowana, ale z tym samym szybkim stylem konwersacyjnym. W trybie rozszerzonym AI „samoreflektuje” przed odpowiedzią, zapisując swój proces myślowy wewnętrznie (i czyniąc go widocznym), aby dojść do bardziej dokładnych lub złożonych rozwiązań.

Łańcuch myśli jest wyświetlany krok po kroku na ekranie, funkcja, która stała się popularna w innych zaawansowanych systemach AI i teraz wreszcie trafia do Claude.

Alex McFarland/Unite.AI

Filozofia Anthropic tutaj celowo kontrastuje z niektórymi konkurentami. OpenAI, na przykład, oferował oddzielne modele lub tryby, co niektórzy uważają za mylące. Podejście Claude 3.7, które łączy wszystko w jednym, ma na celu uproszczenie rzeczy dla użytkowników. Przełączanie między trybami jest proste, a styl wprowadzania pozostaje taki sam. Użytkownicy zaawansowani mogą nawet dostosować, jak długo AI myśli: za pomocą API, deweloperzy mogą ustawić budżet tokenów dla rozumnego myślenia, mówiąc Claude, jak długo ma rozważyć (od kilku kroków do ogromnego procesu myślowego o 128k tokenach) przed podaniem odpowiedzi. Ten szczegółowy kontrola pozwala na wymianę szybkości na gruntowność na żądanie.

Główne ulepszenia w Claude 3.7 Sonnet:

Oto niektóre z głównych ulepszeń, które widzimy w Claude 3.7 Sonnet:

  • Tryby hybrydowego rozumnego myślenia – oferuje zarówno natychmiastowe odpowiedzi, jak i tryb „rozciągniętego myślenia”, w którym AI pracuje nad problemami krok po kroku z widocznym rozumnym myśleniem. Użytkownicy wybierają tryb na zapytanie, łącząc szybką konwersację i głęboką analizę w jednym systemie.
  • Zintegrowana filozofia modelu – łączy szybkie i refleksyjne myślenie w jednym AI „mózgu” dla łatwości użytkowania. To podejście kontrastuje z rywalami wymagającymi wielu modeli lub wtyczek, redukując złożoność dla użytkownika końcowego.
  • Szybkość i responsywność – dostarcza odpowiedzi szybciej niż Claude 3.5. Wczesne testy pokazują zauważalnie szybszą wydajność w trybie standardowym.
  • Rozszerzona kontrola myślenia – za pomocą API, użytkownicy mogą ograniczyć lub rozszerzyć długość rozumnego myślenia AI (do 128 000 tokenów), aby zbalansować szybkość i jakość według potrzeb. To zapewnia, że tryb rozszerzony jest używany tylko w takim zakresie, w jakim jest to konieczne.
  • Fokus na zadaniach w świecie rzeczywistym – według firmy, szkolenie Claude 3.7 zostało przesunięte w kierunku praktycznych zadań biznesowych i kreatywnych, a nie skomplikowanych puzzleów matematycznych. Model wyróżnia się w rozwiązywaniu codziennych problemów i zadań, które odzwierciedlają typowe przypadki użycia.
  • Kodowanie i użycie narzędzi – lepsza wydajność w zadaniach programistycznych, szczególnie w rozwoju front-endu. Anthropic uruchomił nawet towarzyszące narzędzie, Claude Code, które pozwala deweloperom używać Claude z linii poleceń do pisania i poprawiania kodu. Wczesne benchmarki pokazują, że Claude 3.7 zajmuje czołowe miejsca w rozwiązywaniu rzeczywistych problemów oprogramowania.

Ograniczenia i co dalej dla użytkowników AI

Pomimo całego entuzjazmu, Claude 3.7 Sonnet nie jest pozbawiony ograniczeń i nie jest magiczną kulą dla wszystkich wyzwań AI. Po jednej stronie, Anthropic świadomie zmniejszył wagę niektórych dziedzin podczas szkolenia tego modelu. „Optymalizowaliśmy nieco mniej dla matematyki i problemów z konkursów komputerowych” na rzecz bardziej codziennych zadań biznesowych. To oznacza, że chociaż Claude 3.7 może rozwiązywać matematyczne i kodowe pytania (często lepiej niż 3.5), może nie zajmować pierwszego miejsca na każdym akademickim benchmarku lub puzzlu. Użytkownicy, których potrzeby są skierowane ku złożonym dowodom matematycznym lub specjalistycznym konkursom kodowania, mogą nadal znaleźć obszary, w których odpowiedzi Claude wymagają podwójnej weryfikacji lub gdzie model rywala dostrojony do tego niszy robi to lepiej. Anthropic wydaje się przyjąć ten kompromis, kierując model w kierunku praktycznej użyteczności zamiast teoretycznej potęgi.

Ponadto, tryb „rozciągniętego myślenia”, chociaż potężny, wprowadza pewną złożoność. Jest on intrinsicznie wolniejszy niż tryb standardowy; gdy AI jest w głębokiej refleksji, użytkownicy zauważą krótką pauzę, gdy pracuje nad swoim rozumnym myśleniem. To jest oczekiwane – wymiana szybkości na gruntowność – ale oznacza to, że użytkownicy muszą decydować, kiedy naprawdę potrzebują tej dodatkowej mocy. W wielu codziennych zapytaniach konwersacyjnych tryb standardowy będzie wystarczający i bardziej efektywny. Istnieje również fakt, że rozszerzone rozumnego myślenie może czasem przesadzić i dostarczyć znacznie więcej, niż potrzeba. W niektórych przypadkach może to przytłoczyć lub zboczyć z tematu. Anthropic będzie musiał zapewnić, że skłonność AI do „idzenia na całość” z pomysłami pozostaje istotna i na temat. Użytkownicy mogą nauczyć się wprowadzać bardziej precyzyjne dane lub ustalać limity tokenów, aby powstrzymać niekontrolowane dywagacje.

Podsumowanie

Wydanie Claude 3.7 Sonnet to oświadczenie, że Anthropic jest bardzo zaangażowany w grę obok OpenAI, Google/DeepMind i nowych graczy, takich jak xAI. Dla entuzjastów AI i deweloperów dodaje to kolejny model top-tier do eksperymentowania, jeden, który oferuje unikalny twist z jego hybrydowym rozumnym myśleniem.

W konkurencyjnym przemyśle AI, najnowszy ruch Anthropic może również wpłynąć na to, jak firmy pozycjonują swoje modele. Wybierając nie robienie wielkiego skoku w rozmiarze modelu lub efektownej prezentacji multi-modalnej, ale raczej udoskonalając doświadczenie użytkownika (zjednoczenie trybów, szybkość, praktyczne przypadki użycia), Anthropic wyznacza niszę skupioną na użyteczności i niezawodności. 

Ogólnie rzecz biorąc, Claude 3.7 Sonnet to przełomowy moment dla Anthropic. Jest to ewolucja serii Claude, która pokazuje, że firma uczy się z potrzeb społeczności – podwajając swoje atuty, jednocześnie rozwiązując słabości. Są jeszcze obszary do obserwacji (i przyszłych iteracji Claude, których można się spodziewać), ale ten release wyraźnie ożywił bazę użytkowników Anthropic. 

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją, który bada najnowsze rozwoje w dziedzinie sztucznej inteligencji. Współpracował z licznymi startupami i wydawnictwami związanymi z sztuczną inteligencją na całym świecie.