Connect with us

도서 리뷰

책 리뷰: Deep Learning Crash Course: 실제 프로젝트를 통해 배우는 인공 지능 입문

mm

Deep Learning Crash Course: 실제 프로젝트를 통해 배우는 인공 지능 입문은 Giovanni Volpe, Benjamin Midtvedt, Jesús Pineda, Henrik Klein Moberg, Harshith Bachimanchi, Joana B. Pereira, Carlo Manzo와 같은 물리학, 기계 학습, 응용 인공 지능 연구 분야의 경험 풍부한 연구자와 교육자 그룹이 작성했습니다.

이 책에 대해 설명하기 전에, 개인적인 고백으로 시작하고 싶습니다. 이것은 제가 처음으로 No Starch Press에서 읽은 책입니다. 그리고 들어가기 전에, 저는 진정으로 무엇을 기대해야 할지 몰랐습니다. 큰 인공 지능 중심 웹사이트를 운영하는 저는 또한 현대 인공 지능 표준에 따라 끔찍하게 못하는 코더입니다. HTML, CSS, JavaScript, PHP의 기본을 충분히 이해하지만, Python에 관해서는 제 실력은 중간 정도에 머물러 있습니다. 이것은 중요했습니다. 왜냐하면 Python은 책 전체에서 사용되는 언어이며, 거의 모든 프로젝트에서 중심 역할을 합니다.

저는 그 대신에 무엇을 발견했는지요? 그것은 좌절보다는 훨씬 더 가치 있는 것이었습니다. 이 책은 단순하지 않으면서도耐心적이며, 압도적이지 않으면서도 깊습니다. 그리고 매우 드문 인공 지능 책이 할 수 있는 것처럼 실제적인 방식으로 praktisch합니다. 그것은 이미 기계 학습 문화, 용어, 워크플로에 대해 유창하다고 가정하지 않습니다. 대신, 그것은 장을 따라 설명과 직접적인 실제 작업을 통해 천천히 자신감을 구축합니다.

초기 인상이 설정하는 톤

이것은 600 페이지가 넘는 방대한 책이며, 그 공간을 효과적으로 사용합니다. 저에게 즉시 눈에 띄운 한 가지 세부 사항은 저자가 이미 첫 번째 초안이 완료된 후에 전체 코드베이스를 TensorFlow에서 PyTorch로 전환하기로 결정했다는 것입니다. 그것은 작은 변화가 아닙니다. 특히 책의 크기에는 더욱 그렇습니다. 그것은 중요한 것을 신호합니다. 이것은 시간이 지남에 따라 고정된 책이나 체크 박스를 체크하기 위해 작성된 책이 아닙니다. 이것은 관련性을 유지하고 오늘날 실제로 수행되는 深層 학습과 일치하도록 설계된 책입니다.

초기부터 톤은 실제적이고 현실적입니다. 책은 추상적인 철학이나 조밀한 수학으로 시작하지 않습니다. 그것은 모델을 구축하는 메커니즘, 실험을 실행하는 것, 코드가 무엇을 하는지 그리고 왜 하는지 이해하는 것에서 시작합니다. 이러한 접근 방식은 특히 개념을 높은 수준에서 이해하지만 실제 구현으로 번역하는 데 어려움을 겪는 독자에게 큰 차이를 만듭니다.

기억하기보다 구축함으로써 학습

Deep Learning Crash Course의 가장 강력한 측면 중 하나는 프로젝트 기반 구조입니다. 이것은 몇 시간 동안 읽은 후에 아마도 무언가를 시도하는 책이 아닙니다. 당신은 끊임없이 무언가를 구축하고 있습니다. 각 주요 개념은 구체적인 프로젝트에 연결되며, 프로젝트는 이해가 증가함에 따라 복잡성이 증가합니다.

당신은 신경망을 사용하여 PyTorch를 사용하여 처음부터 신경망을 구축하고 훈련합니다. 초기 장은 신경망의 핵심 아이디어를 소개합니다. 그것은 층, 가중치, 활성화 함수, 손실 함수, 최적화를 포함합니다. 중요한 것은 이러한 아이디어가 추상적인 수학 문제로 취급되지 않는다는 것입니다. 그것들은 특정 문제를 해결하는 도구로 취급되며, 각 설계 선택의 영향을 직접 결과에서 볼 수 있습니다.

Python을 매일 작성하지 않는 저로서는 저자가 코드를 통해 어떻게 주의深く 안내하는지에 감사를 느낍니다. 당신은 언제나 마법처럼 무엇이 일어나고 있는지 이해하도록 기대하지 않습니다. 설명은 자세하지만, 읽을 수 있으며, 정밀성만큼 직관에 중점을 둡니다.

패턴 캡처 및 데이터 이해

기본이 자리 잡은 후, 책은 데이터에서 추세와 패턴을 캡처하는 것으로 이동합니다. 이것은 회귀 및 분류 문제와 같은 더 실제적인 작업에 밀집한 신경망이 적용되는 곳입니다. 당신은 모델이 일반화되는 방법, 모델이 실패하는 방법, 그리고 어떻게 그러한 실패를 진단하는지 학습합니다.

이 섹션은 실제로 가장 중요한 실세계 기술 중 일부를 가르칩니다. 검증, 과적합, 과소적합, 성능 평가와 같은 주제는 이론 덤프를 통해 자연스럽게 소개됩니다. 당신은 학습 곡선을 어떻게 해석하는지, 하이퍼파라미터를 어떻게 조정하는지, 모델의 동작에 대해 어떻게 이유를 내는지 배우게 됩니다. 출력을 맹목적으로 신뢰하는 대신에.

API 또는 미리 구축된 도구를 통해만 인공 지능과 상호 작용한 독자에게 이 섹션은 책의 가격을 지불할 만합니다.

신경망을 사용한 이미지 처리

책의 가장 흥미로운 섹션 중 하나는 이미지 처리컴퓨터 비전에 중점을 둡니다. 이것은 합성곱 신경망이 등장하는 곳입니다. 책은 합성곱 신경망을神秘한 블랙 박스로 취급하지 않습니다. 대신, 책은 그것을 이해할 수 있는 구성 요소로 분해합니다.

당신은 실제로 합성곱이 무엇을 하는지, 풀링 레이어가 중요한 이유, 그리고 특징 추출이 레이어 전체에서 어떻게 작동하는지 배우게 됩니다. 더 중요한 것은 이러한 아이디어를 실제 이미지 데이터 세트에 적용하는 것입니다. 프로젝트에는 이미지 분류, 변환, 스타일 전송 및 DeepDream과 같은 창의적인 시각적 실험과 같은 것이 포함됩니다.

이 섹션은 책의 일러스트레이션으로부터 많은 것을 이익을 얻습니다. 코드와 함께 시각적 설명이 제공되므로 모델이 수학적으로 무엇을 하는지와 무엇을 시각적으로 생성하는지 연결하기가 더 쉽습니다. 시각적 학습자에게 이 부분은 특히 만족스럽습니다.

압축에서 생성까지

그런 다음 책은 오토인코더와 인코더-디코더 아키텍처, 포함 U-Net로 확장합니다. 이러한 모델은 차원 감소, 잠재적 표현, 구조화된 출력 생성과 같은 아이디어를 소개합니다. 당신은 모델이 복잡한 데이터의.compact한 표현을 학습하고 어떻게 그러한 표현이 노이즈 제거 및 분할과 같은 작업에 사용될 수 있는지 볼 수 있습니다.

그런 다음 범위는 다시 생성적 적대적 신경망확산 모델로 확장됩니다. 이러한 장은 생성적 모델을 훈련하는 어려움에서 물러서지 않습니다. 불안정성, 수렴 문제, 평가와 같은 주제는 공개적으로 논의됩니다.

저는 이곳에서 가장 감謝하는 것은 책이 이러한 모델을 과장하지 않는다는 것입니다. 그것은 그들의 힘과 그들의 한계를 모두 보여줍니다. 이것은 종종 과장으로 지배되는 분야에서 새롭습니다.

시퀀스, 언어, 주의

책의 또 다른 주요 강점은 시퀀스 데이터와 언어를 다루는 방식입니다. 순환 신경망은 시간 시리즈와 순서가 있는 입력을 처리하는 모델을 이해하는 데 도움이 되는 발판으로 소개됩니다.

그런 다음 책은 주의 메커니즘과 트랜스포머 아키텍처로 이동합니다. 이러한 장은 현대 언어 모델을 이해하는 데坚實한 개념적 기초를 제공합니다. 설명은 주의가 중요한 이유, 학습 동적을 어떻게 변경하는지, 어떻게 모델이 확장할 수 있는지에 중점을 둡니다.

현재 인공 지능 시스템이 더 깊은 수준에서 어떻게 작동하는지 이해하려고 하는 독자에게 이 섹션은 많은 점을 연결합니다.

그래프, 의사 결정, 상호 작용에서 학습

나중에 장은 그래프 신경망을 탐구합니다. 그것은 관계 데이터를 모델링하는 데 사용되며, 여기서 연결은 개별 값만큼 중요합니다. 이것은 과학적 데이터, 네트워크, 구조화된 시스템에 관련된 예제를 포함합니다.

책은 또한 활성 학습과 심층 강화 학습을 소개합니다. 여기서 모델은 환경과 상호 작용하고 결정함으로써 학습합니다. 이러한 섹션은 정적 데이터 세트를 넘어서 동적 시스템으로 이동하며, 피드백과 결과에 따라 학습이 어떻게 적응하는지 보여줍니다.

책의 끝까지, 독자는 깊은 학습 시스템의 전체 수명 주기를 경험합니다. 데이터摄取에서 의사 결정 에이전트까지.

책을 넘어서 지속되는 실제 기술

전체 책을 통해 실제적인 습관에 강한 중점이 있습니다. 당신은 어떻게 실험을 구조화하고, 모델을 디버깅하고, 결과를 시각화하며, 성능에 대해 비판적으로 생각하는지 학습합니다. 이것은 튜토리얼을 넘어서 실제 애플리케이션으로 이동할 때 가장 중요한 기술입니다.

포함된 노트북과 데이터 세트는 실험, 프로젝트 수정, 아이디어 탐색을 쉽게 합니다. 이러한 유연성은 책을 일회적인 읽기 이상으로, 장기적인 참조로 만듭니다.

이 책은 누구에게 적합한가

이 책은 프로그래머, 엔지니어, 연구자, 기술적으로 호기심이 많은 전문가들에게 적합합니다. 그들은 인공 지능을 구축함으로써 이해하고 싶습니다. 당신은 시작하기 위해 전문적인 Python 개발자가 될 필요가 없으며, 진행하기 위해 고급 수학 배경이 필요하지 않습니다. 당신이 필요한 것은 호기심과 프로젝트를 신중하게 작업하기 위한 의지입니다.

또한 책은 참조 가이드로서極めて 잘 작동하며, 이것은 정확히 제가 책을 사용할 계획입니다. vibe coding과 높은 수준의 시스템 설계에 점점 더 집중하는 저로서는, 코드의 모든 줄을 끝까지 실행하는 대신에, 저는 이 책을 제가 концепту적인 이해를 깊게 하기 위해 정기적으로 돌아갈 것입니다. 설명, 다이어그램, 아키텍처 분해는 모델이 어떻게 구조화되는지, 왜 특정 접근 방식을 선택하는지, 어떤 트레이드 오프가 존재하는지 이해할 수 있게 합니다. 이러한 의미에서, 책은 단계별 과정으로서뿐만 아니라 실험, 프로토 타이핑, 또는 더 높은 수준에서 이유를 내는 독자에게 장기적인 동반자로서 성공합니다.

최종 생각

Deep Learning Crash Course는 실제로 제 기대를 초과했습니다. 그것은 단순히 深層 학습을 설명하지 않았습니다. 그것은 접근 가능하고 달성 가능하게 느끼게 했습니다. 끝까지, 저는 PyTorch 기반 모델을 읽기, 수정하기, 작성하기에 훨씬 더 편안하게 느꼈습니다.

이것은 책이 노력을 보상하는 책입니다. 그것은 독자의 지능을尊重하지만 전문 지식을 가정하지 않습니다. 그리고 그것은 저가 인공 지능 교육에서 경험한 가장 실제적인 학습 경험 중 하나를 제공합니다. 인공 지능 관찰자에서 인공 지능 구축자로 이동하려는 모든 사람에게, 이 책은 강력한 추천입니다.

앙투안은 Unite.AI의 비전있는 리더이자 공동 창립자로서, AI와 로봇공학의 미래를 형성하고 촉진하는 데 대한 불변의 열정에 의해 추동됩니다. 연쇄적인 기업가로서, 그는 AI가 사회에 대한 전기와 같은 파괴력을 가질 것이라고 믿으며, 종종 파괴적인 기술과 AGI의 잠재력에 대해 열광합니다.

作为 futurist, 그는 이러한 혁신이 우리의 세계를 어떻게 형성할지 탐구하는 데 전념하고 있습니다. 또한, 그는 Securities.io의 창립자로서, 미래를 재정의하고 전체 부문을 재형성하는 최첨단 기술에 투자하는 플랫폼입니다.