[Review] 비전 시스템을 위한 딥러닝 도서 리뷰


Deep Learning for vision Systems : 비전 시스템을 위한 딥러닝

img

오라일리(O’Reilly)의 빨간 동물 표지와 양대산맥을 가지고 있는 Manning Publications의 중세시대 사람 표지 책 중 하나이다.

특히 OOO in action으로 유명한데, 표지만 봐도 “믿고 본다”라는 인식이 강하다.

사실 이전부터 딥러닝에 관한 책은 수도 없이 많이 출시가 되었다. 이 책의 특징은 “비전”에 초점을 맞췄다는것. 딥러닝은 CNN으로부터 부흥을 얻었다고 해도 반박할 사람은 없을 것이다. 그만큼 여러 인공지능 뉴비들은 비전 분야에 쉽게 접근할 수 있었을 것이다.

이 책에서 마음에 들었던 부분은 1장 “컴퓨터 비전 입문” 이다. 신경망이 어쩌고 저쩌고 부터 시작하기 보다는, 비전 시스템이 어떻게 구성되는지, 비전 응용 분야에는 어떤 것들이 있는지 소개하기 때문에 비전공자들도 쉽게 이해할 수 있을 것 같다.

이후 2장 “딥러닝과 신경망”에서는 퍼셉트론부터 시작해서 활성화 함수, 오차 함수, 최적화, 역전파 알고리즘까지 딥러닝을 공부했더라면 필수적으로 알아야할 것들에 대한 설명이 나온다.

사실 ML/DL 면접에서도 필수적으로 나오는 질문 중 하나라고 생각한다. 그만큼 중요한 딥러닝 기초이기 때문에 가장 중요한 장이지 않을까 생각한다.

이후 3장 “합성곱 신경망”에서는 CNN이 발전해왔던 History를 배운다. 사실 현재는 전혀 사용하지 않은 네트워크이겠지만, 네트워크의 발전 방향을 공부하면서 ‘아 이런 문제 발생했을 때, 해결을 이렇게 했구나’ 생각을 하면서 배우는 것이 중요하다고 생각한다.

4장 “딥러닝 프로젝트 시동 걸기와 하이퍼파라미터 튜닝”은 실습을 통해 하이퍼파라미터 튜닝을 진행한다. 사실 이론만 공부하면 뭐하겠는가? 실제로 모델을 구축하고 loss를 줄여나가는 과정은 꼭 필요하다. keras를 바탕으로 쉽게 코드를 작성할 수 있고 중요한 부분은 전부 주석처리가 되어있어서 이해도 쉽다.

다만 요즘에는 하이퍼파라미터 튜닝을 자동으로 해주는 tool이 많은데, ‘이거를 소개시켜줬으면 참 좋았겠다’ 라는 생각이 들었다.

이후에는 5장 “고급 합성곱 신경망 구조”, 6장 “전이학습”, 7장 “R-CNN, SSD, YOLO를 이용한 사물 탐지”가 나오는데 필자는 7장에 주목하고 싶다.

이 책 제목이 “비전 시스템을 위한 딥러닝”인데, 이 책을 구매한 사람들은 아무래도 Object Detection을 실제로 구현해보고 싶은 사람들일 것이기 때문이다. YOLO와 같은 객체탐지 오픈 소스는 말 그대로 오픈 소스이기 때문에 Github에서 긁어서 쉽게 시스템을 구축할 수 있다. 이 책에서는 어떻게 객체 탐지를 하는지에 대한 근본적인 설명이 있었기 때문에 필자는 YOLO를 사용한지 2년이 넘었지만 이제 원리를 하나씩 이해했다.

이후에 나오는 8장 “생성적 적대 신경망”, 9장 “딥드림과 신경 스타일 전이”, 10장 “시각 임베딩”에서는 이미지를 생성하는 분야에 대한 소개가 담겨있다. 특히 요즘 인기있는 GAN, Face Recognition, Re-identify 등에 대한 소개가 담겨있지만, 실습이 없다는 것이 아쉬웠다.

총평을 하자면, 딥러닝을 처음 접하는 사람들에게도 적합하고, 공부는 이미 했지만 면접준비 등 다시 생각 정리를 하고 싶은 사람에게 이 책을 추천한다.

<이 리뷰는 한빛미디어 ‘나는 리뷰어다’로 부터 책을 지원 받아 작성되었습니다>




© 2020. by lsh110600

Powered by aiden