파이썬 기반의 AI 프로그래밍 03-2
- 1 -
3. 지도 학습 알고리즘 Ⅱ 2강. 지도 학습 알고리즘(4)
학습내용
- 나이브 베이즈 분류기
학습목표
- 나이브 베이즈 분류기의 개념을 알고, 머신러닝에 적용할 수 있다.
1. 나이브 베이즈 분류기 1) 개념
가. 선형 모델과 유사
나. LogisticRegression, LinearSVC보다 빠른 훈련 속도, 일반화 성능은 처짐 다. 각 특성 개별 취급하여 파라미터 학습
라. 각 특성에서 클래스별 통계를 단순히 취합 Scikit-learn 구현 분류기
2) Gaussian NB
가. 연속적 데이터에 적용
나. 클래스별 각 특성 표준편차와 평균 계산 3) Bernoulli NB
가. 이진 데이터 및 텍스트 데이터 적용 4) Multinomial NB
가. 카운트 데이터 및 텍스트 데이터
파이썬 기반의 AI 프로그래밍 03-2
- 2 - 나. 클래스별 특성 평균 계산
5) 장.단점과 매개변수
가. BernoulliNB, MultinomialNB - 복잡도 조절 Alpha 변수 1개
- Alpha가 주어지면 알고리즘이 모든 특성에 양의 값을 가진 가상의 데이터 포 인트를 해당 개수만큼 추가 → 완만한 통계 데이터 생성
- Alpha가 크면 완만, 낮은 모델 복잡도 나. GaussianNB
- 고차원 데이터셋 사용 다. 장점
- 빠른 훈련과 예측 속도 - 이해력 높은 훈련 과정 - 고차원 데이터 적용 가능
파이썬 기반의 AI 프로그래밍 03-2
- 3 - 평가하기
1. scikit-learn에서 지원하는 나이브 베이즈 분류기는 GaussianNB, BernoulliNB, MultinomialNB이다.
O X
- 정답 : O
해설 : scikit-learn에서 지원하는 GaussianNB, BernoulliNB, MultinomialNB 3가지 나이브 베이즈 분류기는 적용하는 데이터에 따라 나누어집니다.
학습정리
1. 나이브 베이즈 분류기
- 각 특성 개별 취급하여 파라미터 학습 - 각 특성에서 클래스별 통계를 단순히 취합 - GaussianNB
- BernoulliNB - MultinomialNB