๋„์„œ ๋ฆฌ๋ทฐ

์ฑ… ๋ฆฌ๋ทฐ: The Thinking Machine – ์  ์Šจ ํ™ฉ, ์—”๋น„๋””์•„, ๊ทธ๋ฆฌ๊ณ  ์„ธ๊ณ„์—์„œ ๊ฐ€์žฅ่งธ็›ฎ๋˜๋Š” ๋งˆ์ดํฌ๋กœ์นฉ

mm

The Thinking Machine: 젠슨 황, 엔비디아, 그리고 세계에서 가장觸目되는 마이크로칩은 대부분의 인공지능에 관한 책과 달리 기술적으로 문해력 있는 독자들에게 새로운 관점을 제공한다.

인공지능을 여러 년간 따라온 사람들처럼, 내게 인공지능에 대한 이해는 일반적인 里程碑에 의해 형성되었다. 이야기通常은 1956년 다트머스 워크샵에서 시작하여, 초기 기호 시스템을 거쳐, IBM의 Deep Blue가 개리 카스파로프를 이긴 것, DeepMind가 고를 마스터한 것, 그리고 최근에 OpenAI가 대규모 언어 모델이 복잡한 멀티플레이어 환경에서 전략을 조정할 수 있음을 보여준 것과 같은 랜드마크 사건들로 구성된다. 이러한 순간들은 지적으로 만족스럽고 기억하기 쉽다.

스蒂븐 윗의 책이 특히 잘하는 것은 이러한 프레임을 도전하는 것이다. 인공지능이 세계를 놀라게 한 순간에 집중하는 대신, The Thinking Machine은 그 성취 아래에 있는 보이지 않는 층에 초점을 맞춘다. 그것은 현대 인공지능 시대가 주로 영리한 아이디어에 의해 열리지 않았으며, 계산 자체가 수행되는 방식의 근본적인 변화에 의해 열렸음을 설득력 있게 주장한다.

젠슨 황과 엔비디아를 중심으로, 윗은 인공지능 혁명을 컴퓨팅 아키텍처, 개발자 생태계, 그리고 장기적인 비전의 이야기로 재구성한다. 결과는 단순한 기업 전기가 아니다. 인공지능의 더 넓은 역사에 대한 누락된 장이다.

비디오 게임에서 새로운 컴퓨팅 패러다임으로

엔비디아의 시작은 현재 인공지능과 관련된 높은 목표와는 거리가 있다. 회사는 1993년에 그래픽스 칩 제조업체로 등장하여, 점점 더 현실적인 비디오 게임 세계를 렌더링하는 데 중점을 두었다. 당시의 도전은 지능이 아니었다. 속도였다. 게임은 빛, 운동, 깊이를 시뮬레이션하기 위해 많은 계산을 즉시 수행해야 했다.

엔비디아가 추구한 해결책은 병렬 컴퓨팅이었다. 병렬 컴퓨팅은 순차적으로 하나씩 명령을 수행하는 대신 많은 계산을 동시에 수행하는 것을 의미한다. 단일 강력한 코어를 사용하는 대신, GPU는 동시에 유사한 수학적 연산을 수행하는 수천 개의 작은 코어를 사용한다. 이 접근 방식은 대규모 데이터셋에 걸쳐 반복되는 계산을涉及하는 워크로드에 특히 강력하다.

원래 이 아키텍처는 그래픽스에 위해 구축되었다. 그러나 윗은 이 결정이 어떻게 sessiz하게 신경망을 위한 이상적인\Foundation을 만들었는지 보여준다. 현대 인공지능 모델을 훈련시키는 것은 대규모 데이터셋에 걸쳐 동일한 수학적 연산을 반복적으로 적용하는 것을 포함한다. GPU는 이미 이러한 작업에 최적화되어 있었다.

이 책의 이 부분이 매력적인 이유는 기술 설계 선택이 어떻게 생존과 연결되는지 명확하게 보여주기 때문이다. 엔비디아는 인공지능을 예상하고 병렬 컴퓨팅을 선택하지 않았다. 그것은 실시간 그래픽스에서 경쟁하기 위해 선택했다. 그 필요성은 회사를 향후 변혁적인 컴퓨팅 모델을 마스터하도록 강제했다.

젠슨 황과 시스템적으로 생각하기, 제품으로 생각하지 않기

이 이야기의 중심에는 젠슨 황이 있다. 그는 일반적인 경영자로 묘사되지 않는다. 그는 시스템적으로 생각하는 사람으로 묘사된다. 윗은 황을 요구적이고, 집요하고, 종종 어려운 사람으로 묘사하지만, 기술에 대한 그의 시각은 장기적으로 일관적이다.

경쟁사들이 GPU를 게임 사이클에 묶인 폐기 가능한 구성 요소로 취급하는 반면, 황은 그것을 더广い 컴퓨팅 플랫폼의 基礎로 취급했다. 이 구별은 임계적이다. 제품은 대체된다. 플랫폼은 누적된다.

내부적으로, 엔비디아는 이 마음가짐을 반영했다. 엔지니어들은 몇 년 앞을 생각하도록 격려했다. 소프트웨어는 실리콘만큼 전략적으로 중요했다. 도구와 개발자 지원에 대한 투자는 명확한 수요가 있는 이전에 이루어졌다. 이러한 선택은 당시에는 과도하거나 불필요해 보였다. 그러나 회사를 앞으로 나아가게 하는 모음을 만들었다.

윗은 엔비디아의 부상이 필연적이지 않았다는 것을 명확하게 한다. 회사는 한 번 이상 거의 실패했다. 그것을 앞으로 나아가게 한 것은 단일적인 돌파구가 아니었다. 가속 컴퓨팅이 궁극적으로 게임을 넘어 중요해질 것이라는 지속적인 믿음이었다.

CUDA와 인공지능 기원 이야기

이 책의 가장 중요한 공헌 중 하나는 CUDA의 역할을 인공지능 역사에서 재구성하는 것이다.

CUDA를 단순히 성공적인 개발자 도구로 생각하기 쉽다. 그러나 윗은 왜 그것이 더 많은 주목을 받을 가치가 있는지 보여준다. CUDA는 그래픽스 외에서 병렬 컴퓨팅을 사용할 수 있도록 만들었다. CUDA 이전에는 GPU를 일반 계산에 사용하려면 그래픽스 특정 인터페이스를 통해 문제를 강제해야 했다. 이것은 취약하고, 비효율적이며, 전문가들에게만 제한적이었다.

CUDA는 개발자가 친숙한 프로그래밍 모델을 사용하여 GPU를 프로그래밍할 수 있도록 변경했다. 수천 개의 컴퓨팅 코어가 일반 자원으로 사용할 수 있게 되었다. 이것은 고성능 컴퓨팅에 대한 진입 장벽을 낮추었으며, 많은 사람들이 당시 충분히 평가하지 못했다.

이것은 내가 인공지능 역사에 대해 배울 때 내 경험과 강하게 공鳴한다. 내가 흡수한 내러티브는 모델과 알고리즘에 중점을 두었다. The Thinking Machine은 그 아이디어가 실제로 어떻게 확장할 수 있었는지, 그리고 엔비디아가 왜 그렇게 핵심적인 힘으로 등장했는지 설명한다.

인공지능 연구자들은 신경망이 병렬 컴퓨팅에 거의 완벽하게 일치한다는 것을 빠르게 인식했다. 훈련에는 대규모 데이터셋에 걸쳐 동일한 연산을 반복적으로 적용하는 것이 포함된다. CUDA는 이 과정이 더 빠르고, 더 저렴하고, 더 신뢰할 수 있게 되었다.

이것은 특히 深層 학습이 가속화되고, 나중에 트랜스포머 기반 모델이 등장했을 때 중요했다. 트랜스포머는 규모에 의해 번창한다. GPU 가속 없이, 오늘날의 인공지능 풍경을 정의하는 많은 모델은 이론적이거나 비용이 많이 들었을 것이다. CUDA는 이러한 아키텍처를 발명하지 않았다. 그러나 그것은 그들의 빠른 진화를 가능하게 했다.

윗은 특히 CUDA의 힘을 인공지능 연구자들이 발견하고, 엔비디아를 인공지능 경주로 끌어들이는 과정을 잘 포착한다.

알고리즘보다 인프라

이 책의 가장 귀중한 통찰 중 하나는 인공지능의 진행이 알고리즘만큼 인프라에 의해 제한된다는 것이다. 많은 인기 있는 설명은 알고리즘, 훈련 트릭, 데이터셋에 중점을 둔다. The Thinking Machine은 독자에게 이러한 것이 충분한 컴퓨팅 없이 중요하지 않음을 상기시킨다.

이 관점에서, 현대 인공지능 붐은 갑자기 나타난 것이 아니라, 지연된 것으로 보인다. 신경망은 수십 년 동안 존재했다. 무엇이 바뀐 것은 그것들을 의미 있는 규모로 훈련할 수 있는 하드웨어의 가용성이었다.

엔비디아는 단순히 더 빠른 칩을 제공하지 않았다. 그것은 하드웨어, 소프트웨어 라이브러리, 개발자 도구의 생태계를 구축했다. 연구자들이 엔비디아 플랫폼을 최적화함에 따라, 엔비디아는 제품을 더 잘 지원하기 위해 제품을 개선했다. 이 피드백 루프는 원시 성능을 훨씬 뛰어넘는 지속 가능한 이점을 만들었다.

이 책은 오늘날 점점 더 명백한 현실을 조용히 강조한다. 인공지능의 리더십은 연구의才能만큼 공급망, 제조 능력, 소프트웨어 생태계, 플랫폼 제어에 의해 형성된다.

비전, 위험, 그리고 누적되는 결과

윗은 엔비디아의 지배에 대한 함의를 피하지 않는다. 회사가 글로벌 인공지능 인프라의 基礎가 되면서, 그 영향력도 증가한다. 젠슨 황의 믿음은 가속 컴퓨팅이 기술적 진보의 다음 단계를 정의할 것이라는 것이 책을 통해 이어진다.

도덕적으로 비난하기보다는, The Thinking Machine은 엔비디아의 지속적인 공학적 결정과 전략적 결정이 어떻게 시간의 경과에 따라 누적되는지를 보여준다. 엔비디아는 추세를 따라가지 않았다. 그것은 병렬 컴퓨팅에 대한 초기의 헌신, 반복되는 시장 주기, 그리고 하드웨어를 필수적인 것으로 만드는 도구에 대한 끊임없는 투자로 승리했다.

인공지능이 실제로 어떻게 확장했는지 이해하려는 독자들을 위한

이미 인공지능 역사에 대한 헤드라인 순간을 알고 있는 독자들을 위한 책이다. 이 책은 그 아래에 있는 누락된 층을 채운다. 그것은 왜 그 돌파구가 실제로 확장할 수 있었는지, 그리고 엔비디아가 왜 그렇게 핵심적인 힘으로 등장했는지 설명한다.

이 책은 인공지능을 지능적인 모델의 集合이 아닌, 산업 시스템으로 이해하려는 독자들을 위한 것이다. 그것은 칩, 데이터 센터, 그리고 기술적 힘을 조용히 형성하는 종종 보이지 않는 공학적 결정에 관심이 있는 사람들과도 공鳴할 것이다.

The Thinking Machine은 병렬 컴퓨팅, 개발자 플랫폼, 장기적인 비전이 현대 인공지능의 基礎를 어떻게 구축했는지 보여주기 때문에 성공한다.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.