Chapter 06 비지도 학습 ▶ 비슷한 과일끼리 모으자! 06-1 군집 알고리즘 ▶ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기 학습 목표 흑백 사진을 분류하기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해합니다. 타깃을 모르는 비지도 학습 지도 학습: 타깃 有 비지도 학습: 타깃 無 과일 사진 데이터 준비하기 픽셀값 분석하기 평균값과 가까운 사진 고르기 군집(clustering): 비슷한 샘플끼리 그룹으로 모으는 작업 클러스터(cluster): 군집 알고리즘에서 만든 그룹 히스토그램: hist() 구간별로 값이 발생한 빈도를 그래프로 표시한 것 x 축: 값의 구간(계급) y 축: 발생 빈도(도수) 확인 문제 히스토그램을 그릴 수 있는 맷플롯립 함수는 무..
앞서 읽은 책과의 연장선에 있는 책이다. 우리는 결국 실천, 그리고 행동해야 한다. 무의식 속에 행해지는 행동도 있지만, 우리가 무언가를 이루고자 한다면 그것은 의식을 기반으로 발생한 행동일 것이다. 나는 여기에서 과연 나의 ‘멘탈’은 괜찮은 것일까? 라는 의문을 품게 되었다. 우울증에 시달리진 않지만, 때로는 번아웃이 찾아올 때가 있다. 이는 나뿐만 아니라, 현대 직장인이라면 공감하는 부분일 것이다. 정말 열심히 일하지만, 혹은 정말 열심히 공부하지만 그 끝에서 우리의 ‘멘탈’은 과연 괜찮은 것일까? ‘멘탈리티’라는 책을 읽었을 때 채우지 못했던 멘탈 강화를 위해서는 어떠한 준비가 필요한지 나는 얻고 싶었다. 이 책에서 와닿은 바는 3가지 였다. 목표 달성의 공식 = 목표 x 수단 x 멘탈 사람의 심리..
Chapter 05 트리 알고리즘 ▶ 화이트 와인을 찾아라! 05-1 결정 트리 ▶ 결정 트리 알고리즘을 사용해 새로운 분류 문제 다루기 학습 목표 결정 트리 알고리즘을 사용해 새로운 분류 문제를 다루어 봅니다. 결정 트리가 머신러닝 문제를 어떻게 해결하는지 이해합니다. 로지스틱 회귀로 와인 분류하기 데이터프레임의 각 열의 데이터 타입과 누락된 데이터 확인 pandas.info() 이용 누락된 값이 있는 경우 해당 데이터 버리기 평균값으로 채워 사용 (명심) 항상 훈련 세트의 통계 값으로 테스트 세트를 변환한다 즉, 훈련 세트의 평균값으로 테스트 세트의 누락된 값을 채워야 함. 데이터프레임의 열에 대한 간략한 통계 보기 pandas.describe() 이용 확인값: 평균(mean), 표준편차(std), ..
나는 ‘ISTJ’ 이다. 재학 중 MBTI 전문 기관과 연이 있어 조사를 해보았는데, ‘J’ 중에서도 극 ‘J’로 약 95%라는 결과가 나왔다. 학창시절 공부를 정말 잘했던 편은 아니다. 다만, ‘공부 계획’은 정말 미친듯이 짰다. 주위에서 독한 놈이라고 부를 정도로, 계획 짜는 거에 만큼은 미쳐 있었다. 노션을 접하기 전에는 아래와 같이 엑셀을 활용해 연간/월간/주간/일일 계획을 작성했다. 하지만, 이 방법은 갈수록 파일의 개수가 늘어나 오래가지 못했다. 노션을 처음 접했을 땐 마냥 잘 활용하지 못했다. 열 나누기, 페이지 구조, 데이터베이스에 대해 익숙하지 못해서 약 6개월을 헤맸다. 노션 관련 책도 읽어보고, 관련 템플릿도 여럿 찾아보면서 비로소 노션에 눈을 뜨게 되었다. 노션에는 눈을 떴지만, 계..
Chapter 04 다양한 분류 알고리즘 ▶ 럭키백의 확률을 계산하라! 04-1 로지스틱 회귀 ▶ 로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률 예측하기 학습목표 로지스틱 회귀, 확률적 경사 하강법과 같은 분류 알고리즘을 배웁니다. 이진 분류와 다중 분류의 차이를 이해하고 클래스별 확률을 예측합니다. 럭키백의 확률 데이터프레임 판다스에서 제공하는 2차원 표 형식의 주요 데이터 구조 넘파이 배열과 비슷하게 열과 행으로 이루어짐 다중 분류 타깃 데이터에 2개 이상의 클래스가 포함된 문제 로지스틱 회귀(logistic regression) 회귀이지만 분류모델 선형 회귀와 동일하게 선형 방정식을 학습 z = a *(Weight) + b * (Length) + c * (Diagonal) + d ..
이번 주에는 지난 주에 이어 심리학의 흠뻑 취해 이 책을 골랐다. 천재라 불리는 자들은 어떻게 사고할까? 라는 생각에 집어 들었지만, 결론부터 말하면 내가 기대한 바를 채울 수는 없었다. 이 책에서는 천재 = 유대인이라는 전재를 깔고 가는 듯한 느낌이 크다. 물론 이는 틀린 말은 아니다. 책에 소개된 것처럼 우리가 흔히 아는 IT 거물, 경제를 쥐고 흔드는 거물, 세계 부호 순위 TOP 10에 든 인물들을 보면 다들 출신이 유대인이다. 어릴 적부터 랍비 교육을 통해 토론과 사고의 익숙한 이들은 모두 세계 정상에 올라있다. 천재들의 특성은 어릴적 내 친구로부터도 확인할 수 있었다. 똑같은 환경에서 자란 것 같았지만, 어릴적 방안의 백과사전부터 손을 대었던 이 친구는 훗날 영재, 천재라는 소리를 들으며 내가..
Chapter 03 회귀 알고리즘과 모델 규제 ▶ 농어의 무게를 예측하라! 03-1 k-최근접 이웃 회귀 ▶ 회귀 문제를 이해하고 k-최근접 이웃 알고리즘으로 풀어 보기 회귀와 분류 회귀: 임의의 어떤 숫자를 예측하는 문제 회귀 알고리즘의 시작, Francis Galton 그는 키가 큰 사람의 아이가 부모보다 더 크지 않는다는 사실을 관찰하고 이를 ‘평균으로 회귀한다’라고 표현. → 그 후 두 변수 사이의 상관관계를 분석하는 방법 = 회귀라 명명. 분류: 클래스 중 하나로 분류하는 문제 k-최근접 이웃 회귀 k-최근접 이웃 분류 알고리즘 예측하려는 샘플에 가장 가까운 샘플 k개를 선택 그다음 이 샘플들의 클래스를 확인하여 다수 클래스를 새로운 샘플의 클래스로 예측 k-최근접 이웃 회귀 예측하려는 샘플에 ..
새해가 되고, 첫 직장을 갖게 되었다. 졸업의 문턱에서 바라보던 취업을 하니, 그동안 지켜오던 습관이 와르르 무너져 내리고, 멘탈도 함께 무너져 내렸다. 분명 취업은 호사이다. 하지만, 이제 시작인데 ‘멘탈’이 무너지면 안 된다는 생각에 ‘멘탈’과 관련된 책을 읽게 되었다. ‘멘탈’, 결국에는 본인 마음먹기 나름인 것이 사실이다. ‘러닝 머신’을 뛰다 멈추고 싶은 순간에도 스스로를 채찍질하며 쥐어 짜내면 1km 라도 더 뛸 수 있는 것처럼 ‘멘탈’은 결국 본인의 마음, 선택하기 나름이다. 이 책에서는 강한 멘탈을 지닌 사람을 ‘클리너(Cleaner)’라 칭하고 있다. ‘멘탈’은 항상 흔들린다. 이렇기 때문일까? 검도에서는 운동 시작 전/후로 다 같이 무릎을 꿇고 ‘묵상’을 한다. ‘묵상’을 할 때면 온갖..