데이터 사이언티스트, 학부를 다닐 때만 해도 이 직업에 대해 아는 바가 없었다. 하지만, 직장을 갖고 업무를 하면 할수록 ‘데이터(Data)’의 중요성을 새삼 깨닫고 있다. 이와 더불어 이 직무에 대해서도 굉장히 관심을 많이 갖게 되었는데 JD를 조사하면서 알게 된 점은 아래와 같다.
개발하는 것도 좋지만, 기획도 마음에 들었던 나로서는 한쪽으로 치우치지 않고 중간에 위치한 ‘데이터 사이언티스트’라는 직무가 천직이나 다름없었다. 하지만 이렇게만 봐서는 데이터 사이언티스트가 무엇을 하는 것인지 알 수 없어 조금 더 디테일한 그림을 찾아보았다.
이것을 찾을 때만 해도 나는 ‘데이터 정제’, ‘모델 학습’, ‘분석 / 시각화’에 대해 몰랐다. 가장 앞단의 데이터 취득(수집, 변환, 저장) 정도만 크롤링을 통해 할 수 있는 정도였다. 하지만, 지금은 다르다. 웬만한 주제에 대해서는 ‘시각화’까지는 할 수 있는 수준에 올랐다. 시작은 단순 호기심이었지만, 하면 할수록 데이터에 가치를 부여하는 것이 정말 재밌고 보람 있게 느껴졌다. ‘가치’를 부여하는 ‘분석’ 역량은 아직 내가 느끼기엔 부족하다. ‘분석’에 목적에 따라 다르긴 하겠지만, 보다 의미 있는 결과를 만들기 위해서는 많은 ‘경험’을 통해 보는 눈을 길러야 한다는 것은 어쩔 수 없는 듯했다.
그래서 이러한 ‘경험’들을 많이 갖고 계신 선배 데이터 사이언티스트(과학자) 분들의 이야기를 들어보고자, 이번 주엔 데이터 과학자 원칙이라는 책을 읽게 되었다. 한 사람의 이야기만 듣기보다는 다양한 사람의 이야기를 듣고 싶었는데, 딱 이 책이 그러한 구성이었다. 총 9명의 연사가 각기 다른 주제를 가지고 본인의 경험을 기반으로 이야기를 들려주고 있어 참으로 좋았다.
- 이정원, 권시헌, 권정민, 김영민, 김진환, 박준선, 변성윤, 이진형, 이제헌
맨 앞장에 추천사를 보면 이러한 문구로 시작한다.
타인의 생각을 엿보는 일은 그 자체로도 재미있지만, 나를 돌아보고 앞길을 계획할 때 큰 도움이 됩니다.
from. 박성철(마켓컬리 풀필먼트 & 딜리버리 프로덕트 본부장)
멋지지 아니한가?, 정말 감탄이 나오는 문구였다. 이것은 마치 경험 많은 선배가 후배들에게 아량을 베풂과 동시에 자신의 성장까지 동반하고 있다는 내용을 아름답게 풀어낸 한 편의 시와 같았다.
1장에서는 배구를 시작으로, 연구소에서 일하면서 겪었던 팀을 만들고 이끌어가는 문화에 대해 서술하였다. 1인 창업자로 활동하지 않는 이상 ‘팀’이라는 존재는 어디를 가든 따라오는 존재이다. 이 장을 통해 성공적인 팀 활동을 위해 매일 아침 ‘오메가’라는 명칭으로 진행했던 ‘스크럼’이 어떠한 긍정적인 영향을 끼쳤는지를 알 수 있었다.
2장에서는 데이터 사이언티스트로서 소양과 커리어를 쌓는 방법을 주로 다루었다. 확실하지 않은 길을 어떻게 확신에 찬 길로 바꿀까 고민을 많이 했는데, 해당 연사조차 비전공이었고, 자신만의 길을 개척하면서 점차 자리를 잡아간 것을 보고 나 또한 완벽한 길을 찾기보다는 나만의 길을 만들어 가야겠다는 생각을 하게 되었다.
3장에서 말하고 있는 우화 1은 어찌 보면 내가 바라보고 있는 회사에서의 내 위치와 같았다. “데이터는 긴 호흡으로 이루어진다.” 별거 아닌 말 같지만 데이터에 대한 중요성이 아직 퍼지지 않은 회사에서 근무하고 있는 나에게는 굉장히 의미 있는 말로 다가왔다. 어느 회사를 가든지 그 규모에 따라 시기는 늦어질 수 있지만, 회사가 결국 커지고 나면 그간 쌓아온 데이터, 앞으로 쌓일 데이터 등을 이용해 가치를 찾고 앞으로 방향성을 수립하는 시기가 분명 올 것이라 믿는다. 따라서, 지금의 회사가 데이터에 대해 중요시 않는다 할지라도, 위에서 연사가 들은 한마디처럼 긴 호흡을 가지고 데이터를 이용해 회사에 기여할 수 있는 인재가 될 수 있도록 차근차근 준비해 나가는 것이 마치 나의 숙명으로 여겨졌다.
4장은 어느 정도 데이터 과학자로서 경험이 있는 주니어라면 읽어볼 만하다. 이제 막 출근한 주니어라면 아직은 내용이 버거울 수 있으니, 가볍게 읽고 넘어가길 추천한다.
5장은 데이터 분석의 본질에 집중하기라는 제목으로 데이터 분석가의 현실을 중점으로 이야기를 해주고 있다. 글을 쓴 시점에서 데이터 직군의 현실과 함께 데이터 분석이 어떻게 매출 상승까지 이어지는 지를 알 수 있다. 특히 캐글에서와 현실에서의 데이터 분석의 차이를 아래와 같은 그림을 통해 잘 설명해주고 있어, 아주 인상 깊었다.
6장은 데이터 과학자의 ‘기술 부채’ 갚기라는 제목으로 현업에서의 분석과 엔지니어링의 조화를 설명해주고 있다. 특히 데이터 과학자라면 알아두면 좋을 엔지니어링 시 필요한 스타일 가이드, 깃, 코드 리뷰, 가독성, 문서 작성, 버전 관리 등에 초점을 두고 말해주고 있어 주니어 단계에서 놓칠 수 있는 부분들을 한번 더 짚어주고 있어 좋았다.
7장은 ‘메타인지’를 중심 키워드로 직업에 있어 중심을 잡는 방법을 말해주고 있다.
자신의 인지 과정(인지 능력, 지식, 자신에 대한 이해)을 인식하고 이해하는 능력으로 자신에 대해 잘 이해하고 어떤 것을 아는지 모르는지를 분석해 개선 방안을 모색하는 과정입니다.
- 의도적으로 남다른 선택 해보기
- 주기적으로 일하는 목적 찾기
- 제너럴리스트, 스페셜리스트 이분법으로 생각하지 않기
- 업무도 메타인지하며 목적 중심으로 생각하기
- 나의 세상 정의하기
- 회사에서 필요한 일과 내 흥미를 일치시키기
- 팀 현황을 파악해서 개선점 만들기
- 더 나은 커뮤니케이션 능력 기르기
- 비즈니스 모델과 데이터의 접점 분석하기
- 지금 힘들다면 여유가 있는지 생각해 보기
위와 같이 총 10개의 소제목을 통해 데이터 과학자로서 중심을 잡고 흔들리지 않는 방법을 연사님의 경험을 바탕으로 알려준다. “중요한 점은 자신의 현 상황과 욕구를 파악하고, 그 방향으로 가려면 어떤 경험을 해야 할까를 생각하고 실제로 실행하는 겁니다.” 지금의 나도 이 길이 맞는가, 흔들리고 있는데 본 장을 읽으면서 하나씩 확장해 나가야겠구나라는 생각을 할 수 있었다.
7장은 데이터로 고객을 움직이는 데이터팀이 되어가는 여정이라는 제목으로 데이터팀에서 주로 사용하는 기법들에 대해 설명하고 있다. 기본적인 SQL에서 실무에서 데이터 마트와 데이터 웨어하우스를 어떤 때 사용하는지, 중간에 테이블을 만드는 경우가 있다면 어떠한 목적 하에 만드는지 등 이론 학습만으로는 배울 수 없는 실무적인 스킬, 꿀팁 등이 담겨 있어 좋았다.
데이터 분석에 필요한 데이터 생성 순서
'운영 DB’ → ‘ODS’ → ‘데이터 웨어하우스’ → ‘데이터 마트’ *ODS(Operating Data Stage): 운영 DB에서 데이터를 복제해 놓은 곳
*데이터 웨어하우스: 여러 테이블을 조인하면서 조회 성능이 감소하는 것을 방지하기 위해서 테이블을 비정규화하며 데이터 조회 성능을 높여줌
*데이터 마트: 반복적으로 자주 조회하거나 대시보드로 만드는 데 사용하는 데이터 집계용
마지막 9장은 ‘전달력을 높이는 시각화 디자인 원칙’이라는 이름으로 자칫 과학자라고 하여, 놓칠 수 있는 ‘시각화’의 중요성과 그 원리를 설명해주고 있다. 특히 이 내용은 최근 내가 관심 있게 보고 있는 내용 중 하나여서 더 흥미롭게 읽을 수 있었다. 데이터를 잘 가공했는데, 마냥 데이터로만 보여준다면 그 효과는 반감될 수 있다. 하지만, 시각적으로 잘 조화를 이루어 보여준다면 그 효과는 단순히 배를 넘어 그 사람을 설득시키는 데 큰 기여를 할 수 있는 요소이다.
게슈탈트의 원리: 우리 뇌에서 자동적으로 패턴으로 인식되는 요소들
시각화의 대가인 저자는 이 밖에도 본인이 데이터를 다루면서 성향별 사용하는 툴도 함께 안내해 주었다.
- 맷플롯립
- 지리 정보: 지오팬더스(geopandas)
- 네트워크 데이터 처리: 네트워크엑스(NetworkX)
- 머신러닝 결과 시각화: 사이킷플롯(scikit-plot)
이렇게 모든 장을 상세히 살펴보았는데, 가장 좋았던 점은 매 챕터가 끝날 때면 마지막에 연사 분들이 추천하는 추천 서적이 함께 소개되고 있다는 것이다. 이는 오로지 그동안의 경험을 바탕으로 지금의 데이터 리더가 될 수 있도록 해준 밑거름과 같아서 다음 목표를 수립하는데 많은 도움이 되었다.
끝으로, 본 책에 대해 한 줄로 평하면 “한 권에 책을 읽었지만, 9권의 책을 읽은 듯한 느낌을 받은 책”이라고 할 수 있다. 각 장마다 서로 다른 연사 분들의 이야기는 마치 잘 짜인 커리어 로드맵과 같았다. 각기 다른 경험 속에서 성공한 데이터 과학자로서 도달한 이야기는 주니어 데이터 과학자로 하여금 정말 값진 내용이었다. 데이터 과학자로서의 길이 맞는지 모호하다면 적극 읽어보길 권장한다.
오늘도 찾아주셔서 감사합니다.
'책으로 여는 세상' 카테고리의 다른 글
[책리뷰] 상위 1%가 되는 말하기 스킬 : 우아하지만 단호하고, 심플하지만 감성적인 대화법 (0) | 2024.08.11 |
---|---|
[책리뷰] 실무로 통하는 타입스크립트 (2) | 2024.07.28 |
[책리뷰] 개발자를 위한 필수수학 (0) | 2024.06.30 |
[책리뷰] 업무에 활용하는 Node.js (0) | 2024.06.23 |
[책리뷰] 프로 일잘러의 슬기로운 노션 활용법: 20가지 노션 템플릿과 함께하는 (0) | 2024.06.09 |