본 게시글은 한빛미디어의 나는 리뷰어다 이벤트로 제공받은 딥러닝의 정석 책에 대한 리뷰입니다.

1. 책의 구성 및 내용

기초 지식으로 신경망이 무엇인지, 경사 하강법이나 학습률, 역전파 알고리즘, 미니 배치, 오버피팅 방지 등을 배우고 텐서플로로 간단한 신경망을 구현한다. 그 후 여러 가지 경사 하강법과 CNN, 오토인코더, Word2Vec에 대해 배운 후 시퀀스 분석을 위한 모델 파트를 중점으로 seq2seq, SyntaxNet, LSTM 모델을 다루고있다. 강화 학습도 소개되어 있긴 하나 간단하게 알려주는 정도에서 머문다.

2. 책의 특징

  • 기본적인 내용은 간단하게만 짚고 넘어간다.

  • 수식을 일일이 풀어서 설명하지 않는다.
  • 모든 수식을 뜯어 완전히 이해하고 싶은 사람에게 별로일듯 싶다.
  • 오버피팅을 막기 위한 L2 정규화를 직관적 해석과 시각적으로 설명해준다.

  • 텐서플로를 조금 더 자세히 설명해준다.
  • MNIST 예제 소개는 텐서플로 설명이 자세하다는 점을 제외하면 다른 책과 비슷하다.

  • CNN 쪽도 크게 다를 건 없다.
  • 수식을 좀 더 적극적으로 사용했다. 다만 의미가 크게 잘 다가오진 않는다.
  • 배치 정규화의 의미를 좀 더 잘 설명해준다.

  • PCA 와 오토인코더를 비교해서 구체적으로 설명해준다.
  • 디노이징에 관해 다양체 개념을 알기 쉽게 설명해준다.
  • Word2Vec을 설명하며 단어들의 관계를 발견하고 벡터로 인코딩해야한다는 관점이 잘 다가왔다.
  • 텐서플로 코드가 많다는 점을 빼면 전체적으로 다른 책과 많이 다르진 않다.

  • SyntaxNet 과 빔 탐색 개념이 새로웠다.
  • RNN에 대한 설명은 비슷했으나 그래픽이 좀 더 이해가 잘됐다.
  • 수식에 대한 설명이 친절하진 않다.
  • 대신 LSTM 부분의 설명이 좋다.
  • 시퀀스 분석 모델에 관한 설명이 구체적이다.

  • 8장의 메모리 증강 신경망 파트는 거의 이해하지 못했다. 이책에서만 있는 특별한 부분이며 동시에 매우 흥미로운 주제다.

  • 마지막 강화학습 단락은 비중있게 다루지 않는다.
  • 독자 타겟이 애매하다는 느낌을 받았다.

3. 어떤 사람에게 추천하는가

딥러닝을 아예 처음 시작하는 사람에겐 추천하지 않는다. 다른 텐서플로 첫걸음이나 딥러닝 첫걸음 등의 책을 읽어본 적 있는 사람에게 추천하고 밑바닥부터 시작하는 딥러닝을 읽은 사람에겐 이 책이 약간 애매할 수 있다. 시퀀스 모델쪽이나 메모리 증강 신경망에 대해 더 공부하고 싶은 사람에겐 매우 추천한다.