일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- tableau
- 유데미
- 부트캠프후기
- 유데미부트캠프
- 코테
- 유데미코리아
- MySQL
- Tableau Desktop Specialist
- 데이터분석
- 자격증준비
- 파이썬
- 코딩테스트
- 프로그래머스
- 러닝스푼즈
- 자격증
- 2024년
- 프리온보딩
- trouble shooting
- AICE
- SQL
- 쿼리테스트
- Python
- 회고록
- 데이터분석가
- 데이터시각화
- 스타터스부트캠프
- 태블로
- 취업부트캠프
- 실습
- 프로젝트
- Today
- Total
신이 되고 싶은 갓지이
AICE Basic 이론편1 - 머신러닝과 딥러닝의 이해 본문
AICE 자격증 준비 첫번째로 정리해볼 내용은 머신러닝과 딥러닝의 기본 내용이다.
✏️ 머신러닝
머신러닝 기계학습에는 지도학습, 비지도학습, 강화학습 이렇게 3가지 방법이 있다.
- 지도학습 : 기계가 사람이 정해준 정답을 갖고 학습하는 방식. 대량의 데이터일 수록 효율적인 학습 방법
- 비지도학습 : 정답이 없는 데이터를 군집화를 통해 학습하는 방식. 정확한 학습 환경이 주어지는 것이 중요 . 지도학습보다 어렵지만 정답 데이터가 필요하지 않다는 점 때문에 많은 관심을 받고 있음
- 강화학습 : 학습과정에서 정답을 맞출 경우 보상을 통해 정답을 맞출 확률을 더 높여준다. 행동심리학의 보상실험에서 유래됨.
1. 지도학습
1) 지도학습이란?
정답을 알려주고 학습을 시키는 가장 친절한 학습 방법. 과거 데이터로 미래를 예측하기에 가장 많이 사용되는 학습방법으로 예측하는 종류에 따라서 결과가 범주형이면 분류(classification), 수치형이면 회귀(regression)로 나뉜다. 학습 시키는 데이터는 입력(Feature,X)데이터와 출력(Lable, Y)데이터이다.
✔️ 분류
명확하게 나누어진 범주형 데이터를 구분하는 훈련을 통해 분류기를 생성
✔️ 회귀
수치형 데이터를 훈련을 통해 미래를 예측
* 서로 다른 두 그룹을 나누는 선을 그으면 분류, 오차를 가장 적게 하는 선을 그으면 회귀
2) 지도학습 과정
라벨링된 데이터 → Train Set, Test Set을 8:3 또는 7:3으로 생성 → 정답이 있는 Train으로 기계학습 → 정답이 없는 stats로 알고 있는 정답과 비료하여 평가 → 정확도(얼마나 잘 맞췄는지)와 오차율(정답과 얼마나 차이나는지)을 확인
2. 비지도학습
출력데이터(정답, label, Y)를 알려주지 않고 입력데이터(학습할 데이터)만 주어 학습시키는 학습 방법으로 문제만을 갖고 패턴과 구조를 찾아냄. 이를 군집화(Clustering)이라고 함. 정답이 없기 때문에 성능의에 대한 검증은 불가능함
3. 강화학습
행동심리학에서 유래되어 특정 행동을 시행하여 상/벌에 따라 해야 할 행동을 학습.
4. 머신러닝 총정리
지도학습 (Supervised Learning) |
비지도 학습 (Unsupervised Learning) |
강화학습 (Reinforcement Learning) |
|
학습데이터 | label이 있는 과거 데이터 | label이 없는 과거 데이터 | 동적인 현재 데이터 |
환경피드백 | 직접적 | 없음 | 직접적(상/벌) |
응용분야 | 분류, 회귀 → 위험 평가, 예측 | 군집화, 연관 → 상품추천, 특이사항 탐지 | 바둑, 게임, 자율주행자동차, 드론 |
💡 머신러닝 알고리즘
데이터 분석 플랫폼인 Kaggle에서 상위권에 랭크되어 있는 알고리즘에는 앙상블(Ensemble)기법중 GBM(Gradient Boosting Machines)의 Xgboost, Light GBM 등이 많이 사용되고 있음. 이 알고리즘들은 정형데이터의 분류와 회귀 분야에서 예측성이 뛰어나다고 함.
✏️ 딥러닝
딥러닝은 인공신경망(ANN)을 사용하는 머신러닝 알고리즘 중 하나이다. 인공신경망이란 입력신호를 받아서 처리 후 다음 단계에 출력신호로 전달하는 뉴런의 신경망을 본따 만들었다. 즉, 딥러닝은 뇌의 정보처리 방식을 모사한 '인공신경망'과 유사하게 여러 층(Layer)으로 깊이있게(Deep) 구성하여 학습을 진행시키는 것이다.
hidden layer1 hidden layer2
X1 → input laye hidden layer1 hidden layer2
X2 → input layer → hidden layer1 → hidden layer2 → output layer →Y
X3 → input layer hidden layer1 hidden layer2
hidden layer1 hidden layer2
1. DNN (Deep Neural Network)
심층신경망으로 입력층, 여러개의 은닉층, 출력층으로 구성된 가장 일반적인 모형. y=wx+b라는 선형식으로 표현되어 가중치 w와 바이어스 b를 구하는 과정을 학습하는 딥러닝 알고리즘.
2. CNN (Convolutional Neural Network)
합성곱신경망으로 이미지의 지역별 feature을 뽑아서 학습하는 분야에 특화되어 있음. 이미지, 영상처리, 오디오 처리에 탁월.
3. RNN (Recurrent Neural Network)
순환신경망으로 자신의 출력을 다시 입력으로 활용. 시계열 예측, 문장 처리와 같이 순서가 있는 데이터 학습에 특화되어있다. 말, 글, 음악, 영화, 주식시세와 같은 시간이 있는 데이터 학습에 탁월.
4. GAN (Generative Adcersarial Network)
생성적 적대 신경망으로 두 신경망 모델의 경쟁을 통해 학습. 두 모델을 경쟁시켜 발전.
5. 딥러닝이 주목 받는 이유
장점
- Feature추출을 기계가 직접, 알아서 추출하기 때문
- 데이터 사이즈가 커질 때, 정확도가 높기 때문
단점
- 과적합(Over-fitting) 문제 → 학습 데이터에만 잘 맞고 test데이터는 잘 맞지 않는 모델이 될 수 있음
- 복잡한 로직으로인한 학습시간 증가 → 컴퓨터 성능(GPU)에 영향을 많이 받음
- 사람의 개입 없이 기계가 알아서 추출하기 때문에 처리과정에 대한 설명이 어려움(Black Box)
💡 AI 핫 키워드
- NLP - 자연어 인식/처리
- CV(Computer Vision) - 영상 인식/처리
- STT, TTS - 음성 인식/처리
'추가공부 > AICE' 카테고리의 다른 글
AICE Basic 이론편4 - AI 구현 프로세스 (AI 모델링하기) (1) | 2023.07.20 |
---|---|
AICE Basic 이론편3 - AI 구현 프로세스 (문제정의, 데이터 수집/전처리) (1) | 2023.07.20 |
AICE Basic 이론편2 - 인공지능 업무에 적용하기 (0) | 2023.07.08 |
KT에서 주관하는 국내 인공지능 활용평가 자격증 AICE 준비! (1) | 2023.07.07 |