전체 글

YOLO/ Sin prisa sin pausa
AI 트렌드를 따라 LLM 이 현재 가장 관심이 뜨거운 분야로 급부상하고 있다. 학부생 시절 졸업작품을 제작할 당시에도 이러한 자연어 처리(NLP)에 관심이 많아 이와 관련된 EduTech를 주제로 진행했었는데, 그때만 해도 인공지능은 나에게 미지의 분야였다. 물론, 졸업작품은 잘 마칠 수 있었지만 인공지능은 정말 어렵게만 느껴졌다. 인공지능 산업이 발전함에 따라, 인공지능을 그저 어려운 학문으로만 남겨두고 싶지 않았다. 그래서 나는 ‘혼자 공부하는 머신러닝+딥러닝’ 책도 정독해보고, 다음 스텝으로 이 책을 선택하여 GPT-4 모델에 대한 이해, 자연어 처리에 대한 조금 더 심화된 학습을 진행하고 싶었다. 1장에서는 LLM을 들어가기 전 인공지능과 자연어 처리에 대한 개괄적이고, 기초적인 개념들을 파악할..
Chapter 07 딥러닝을 시작합니다 ▶ 패션 럭키백을 판매합니다! 07-1 인공 신경망 ▶ 텐서플로로 간단한 인공 신경망 모델 만들기 학습 목표 딥러닝과 인공 신경망 알고리즘을 이해하고 텐서플로를 사용해 간단한 인공 신경망 모델을 만들어봅시다. 패션 MNIST MNIST 머신러닝: 붓꽃 데이터셋 딥러닝: MNIST 데이터셋 손으로쓴 0~9까지의 숫자로 이루어짐 패션 MNIST MNIST와 크기, 개수가 동일하지만 숫자 대신 패션 아이템으로 이루어진 데이터 각 픽셀은 0~255 사이의 정숫값을 가짐 이런 이미지의 경우 보통 255로 나누어 0~1 사이의 값으로 정규화 이는 표준화는 아니지만 양수 값으로 이루어진 이미지를 전처리할 때 널리 사용하는 방법 로지스틱 회귀로 패션 아이템 분류하기 인공 신경망 ..
학창시절 ‘국어’는 썩 좋아하는 과목은 아니었다. 특히 ‘문학’은 나와는 거리가 있었다. 다양한 정보, 세상 이야기를 접할 수 있는 ‘비문학’은 나와 잘 맞았다. ‘문학’은 정서적인 부분과 해석에 중점을 두었다면, ‘비문학’은 그 글 자체만으로 읽는 재미가 있었다. 문학, 비문학의 기초가 되는 ‘문법’은 공무직을 준비한다면 필수 교과목 중 하나이다. 한때 공무직을 준비하면서 학창 시절로 돌아가 열심히 ‘문법’ 을 암기식으로 공부하기도 했다. 하지만, 이는 시험 때만 잠깐 빛을 볼 뿐 일상 생활 속에서 그 지식이 활용되지는 못했다. 취업 후 얼마안되어서 ‘책’을 좋아하는 나조차도 문해력이 뒤쳐지고 있다는 생각을 들게한 사건이 있었다. ‘적확’이라는 표현이었는데, 처음엔 ‘정확’의 오타가 아닐까? 싶어 습관..
Chapter 06 비지도 학습 ▶ 비슷한 과일끼리 모으자! 06-1 군집 알고리즘 ▶ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기 학습 목표 흑백 사진을 분류하기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해합니다. 타깃을 모르는 비지도 학습 지도 학습: 타깃 有 비지도 학습: 타깃 無 과일 사진 데이터 준비하기 픽셀값 분석하기 평균값과 가까운 사진 고르기 군집(clustering): 비슷한 샘플끼리 그룹으로 모으는 작업 클러스터(cluster): 군집 알고리즘에서 만든 그룹 히스토그램: hist() 구간별로 값이 발생한 빈도를 그래프로 표시한 것 x 축: 값의 구간(계급) y 축: 발생 빈도(도수) 확인 문제 히스토그램을 그릴 수 있는 맷플롯립 함수는 무..
앞서 읽은 책과의 연장선에 있는 책이다. 우리는 결국 실천, 그리고 행동해야 한다. 무의식 속에 행해지는 행동도 있지만, 우리가 무언가를 이루고자 한다면 그것은 의식을 기반으로 발생한 행동일 것이다. 나는 여기에서 과연 나의 ‘멘탈’은 괜찮은 것일까? 라는 의문을 품게 되었다. 우울증에 시달리진 않지만, 때로는 번아웃이 찾아올 때가 있다. 이는 나뿐만 아니라, 현대 직장인이라면 공감하는 부분일 것이다. 정말 열심히 일하지만, 혹은 정말 열심히 공부하지만 그 끝에서 우리의 ‘멘탈’은 과연 괜찮은 것일까? ‘멘탈리티’라는 책을 읽었을 때 채우지 못했던 멘탈 강화를 위해서는 어떠한 준비가 필요한지 나는 얻고 싶었다. 이 책에서 와닿은 바는 3가지 였다. 목표 달성의 공식 = 목표 x 수단 x 멘탈 사람의 심리..
Chapter 05 트리 알고리즘 ▶ 화이트 와인을 찾아라! 05-1 결정 트리 ▶ 결정 트리 알고리즘을 사용해 새로운 분류 문제 다루기 학습 목표 결정 트리 알고리즘을 사용해 새로운 분류 문제를 다루어 봅니다. 결정 트리가 머신러닝 문제를 어떻게 해결하는지 이해합니다. 로지스틱 회귀로 와인 분류하기 데이터프레임의 각 열의 데이터 타입과 누락된 데이터 확인 pandas.info() 이용 누락된 값이 있는 경우 해당 데이터 버리기 평균값으로 채워 사용 (명심) 항상 훈련 세트의 통계 값으로 테스트 세트를 변환한다 즉, 훈련 세트의 평균값으로 테스트 세트의 누락된 값을 채워야 함. 데이터프레임의 열에 대한 간략한 통계 보기 pandas.describe() 이용 확인값: 평균(mean), 표준편차(std), ..
나는 ‘ISTJ’ 이다. 재학 중 MBTI 전문 기관과 연이 있어 조사를 해보았는데, ‘J’ 중에서도 극 ‘J’로 약 95%라는 결과가 나왔다. 학창시절 공부를 정말 잘했던 편은 아니다. 다만, ‘공부 계획’은 정말 미친듯이 짰다. 주위에서 독한 놈이라고 부를 정도로, 계획 짜는 거에 만큼은 미쳐 있었다. 노션을 접하기 전에는 아래와 같이 엑셀을 활용해 연간/월간/주간/일일 계획을 작성했다. 하지만, 이 방법은 갈수록 파일의 개수가 늘어나 오래가지 못했다. 노션을 처음 접했을 땐 마냥 잘 활용하지 못했다. 열 나누기, 페이지 구조, 데이터베이스에 대해 익숙하지 못해서 약 6개월을 헤맸다. 노션 관련 책도 읽어보고, 관련 템플릿도 여럿 찾아보면서 비로소 노션에 눈을 뜨게 되었다. 노션에는 눈을 떴지만, 계..
Chapter 04 다양한 분류 알고리즘 ▶ 럭키백의 확률을 계산하라! 04-1 로지스틱 회귀 ▶ 로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률 예측하기 학습목표 로지스틱 회귀, 확률적 경사 하강법과 같은 분류 알고리즘을 배웁니다. 이진 분류와 다중 분류의 차이를 이해하고 클래스별 확률을 예측합니다. 럭키백의 확률 데이터프레임 판다스에서 제공하는 2차원 표 형식의 주요 데이터 구조 넘파이 배열과 비슷하게 열과 행으로 이루어짐 다중 분류 타깃 데이터에 2개 이상의 클래스가 포함된 문제 로지스틱 회귀(logistic regression) 회귀이지만 분류모델 선형 회귀와 동일하게 선형 방정식을 학습 z = a *(Weight) + b * (Length) + c * (Diagonal) + d ..
PatienceLee
PatienceLee