ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 혼자공부하는 머신러닝+딥러닝 책 리뷰
    Review/Book 2024. 2. 18. 23:16

    머신러닝과 딥러닝에 대한 공부를 시작하게 된 계기

    나는 직업적으로 데이터 엔지니어라는 직군을 가지고 있고, 최근들어 GPT모델을 사용한 생성형 AI 모델의 급성장과 생태계 파괴수준의 시장에서의 영향력은 아무래도 일반적인 사무직보다 더 크게 다가왔고 실제로도 많은 일처리 방식이나 생활 양식에 등 다방면에 걸쳐서 변화를 이끌어냈다.
    물론 이러한 일련의 과정들이 없었더라도 직장에서 데이터 사이언티스트와의 협업이라든가 모델링이 필요한 업무의 요구사항이라든가 이것을 배워야한다는 필요성과 가치는 항상 느껴오고 있었다.
    다만 아직 업무에 적응하기도 바쁜데… 배워야할 것들이 아직 태산인데…따위와 같은 핑계 아닌 핑계들로 인해서 뒤로 미루고 애써 못본 척을 해야했다.
    하지만 이제는 진짜로 뛰어들어야 할 때다. 더이상 늦춰지면 영영 기차가 떠나가 버릴지도 모르겠다는 생각이 들정도로 발등에 불이 튀었다. 그래서 머신러닝과 딥러닝에 업무로써 직접적인 도입을 실천하기 보다는 점진적으로 조금씩 그 개념부터 차근차근 살펴나가기로 했다.
    그 첫걸음이 바로 이 ‘혼자공부하는 머신러닝+딥러닝’이다. 우선 가장먼저 책의 제목부터 마음에 들었다. 독학을 강조하면서 그만큼 쉬운 이해와 설명을 내포하고 있는 제목이다. 실제로도 그랬다. 한빛 마켓과 김 팀장이라는 가장의 회사와 인물을 예로 들어서 다양한 업무상 겪게되는 문제들을 머신러닝과 딥러닝을 통해서 해결한다.
    읽는 이들은 이러한 예시들을 통해서 어떻게 머신러닝이 실제 현실에서의 문제들을 어떤 방식으로 풀어나가는지를 보여주고 있다.

    그래서 머신러닝이 뭔데?

    머신러닝은 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이다. 한마디로 데이터 속에서 어떠한 규칙을 발견하고 그러한 알고리즘을 모델이라고 부르기도 한다.
    많은 머신러닝 알고리즘 중에 인공 신경망을 기반으로 한 방법들을 통칭하여 딥러닝이라고 부른다.
    보통 프로그램은 누군가 정해준 기준대로 일한다. 예를 들어 앞에 빨간불이 있으면 멈춰, 초록불이면 가! 이런 식이다. 하지만 머신러닝은 그런 기준을 정해주지 않아도 알아서 빨간불이면 멈추고 초록불이면 간다. 당연히 머신러닝은 만능이 아니고 한계점도 분명히 존재한다. 수많은 데이터를 통해서 학습을 시켜줘야하며 그 데이터의 질은 좋아야하며 설사 그렇다고 하더라도 모델의 score가 100%가 되기는 아주 힘들다. 이 알고리즘의 스코어를 올리기 위해서 다양한 회귀 알고리즘이 있고 이 책에서는 그런 방법들 또한 소개하고 있다.

    쉽게 설명한다고 했지만 여전히 어려워

    솔직히 말해서 6장까지는 이미 파이썬을 어느정도 알고있기도 하고 scikit-learn이나 케라스 등 이미 접해보거나 귀동냥으로 조금씩 줏어들어서 익숙한 내용들이 많았다. 하지만 이후 딥러닝 파트에서 부터는 저자가 아무리 쉽게 설명한다고 하더라도 딥러닝 이외에 수학이나 통계에 관련된 원론적인 개념들과 기반지식이 필요했기 때문에 지면관계상 생략한 것들을 필요로하는 내용들이 빈번하게 요구되면서 바로 단번에 이해하기 힘든 부분들이 많았다.
    특히 심층 신경망이나 옵티마이징하는 부분처럼 신경망에 관계된 내용은 특히 그랬다. 그래도 희망적인건 어설프게나마 대충 어떤 내용이겠거니하고 추측은 가능하겠더라는 것이다.
    전에 데이터 엔지니어 관련된 모임에서 발표를 공유하는 파트에서 머신러닝과 관련된 주제로 발표하시는 분들이 더러있었다. 그런분들의 발표는 거의 대부분 그냥 이런게 있구나하는 정도로만 넘어가고 전혀 이해하지 못했었는데 그래도 앞으로는 어느정도 방향성을 가지고 말하고 있구나 정도의 윤곽은 잡고싶다.
    당연히 아직도 먼 이야기이긴 하지만 이 책을 발판으로 삼아 앞으로 다양한 책들과 강의로 더욱 발돋움해야겠다.

    댓글

Copyright 2023. 은유 All rights reserved.