상세 컨텐츠

본문 제목

인공지능 전문가 자격증 요점정리

[자격증 준비]/SQL자격증

by 데브수달 2022. 11. 25. 23:06

본문

728x90
반응형

단순  선형 외귀 특징

  • 가장 기초적이나 여전히 많이 사용되는 알고리즘
  • 입력값이 1개인 경우에만 적용이 가능함
  • 입력값과 결과값의 관계를 알아보는 데 용이함
  • 입력값이 결과값에 얼마나 영향을 미치는지 알 수 있음
  • 두 변수 간의 관계를 직관적으로 해석하고자 하는 경우 활용

다중 선형 회귀 특징

  • 여러 개의 입력값과 결과값 간의 관계 확인 가능
  • 어떤 입력값이 결과값에 어떠한 영향을 미치는지 알 수 있음
  • 여러 개의 입력값 사이 간의 상관 관계(두 가지 것의 한쪽이 변화하면 다른 한쪽도 따라서 변화하는 관계)가 높을 경우 결과에 대한 신뢰성을 잃을 가능성이 있음.

회귀 평가 지표 

RSS-단순 오차 

RSS특징

  • 가장 간단한 평가 방법으로 직관적인 해석 가능
  • 오차를 그대로 이용하기에 입력 값의 크기에 의존적
  • 절대적인 값과 비교가 불가능

MSE,MAE- 절대적인 크기에 의존한 지표

MSE,MAE특징

  • MSE: 이상치(Outlier) 즉, 데이터들 중 크게 떨어진 값에 민감함
  • MAE:변동성이 큰 지표와 낮은 지표를 같이 예측할 시 유용
  • 가장 간단한 평가 방법들로 직관적인 해석이 가능함
  • BUT 평균 그대로 이용하기에 입력 값의 크기에 의존적
  • 절대적인 값과 비교가 불가능

R(2) (결정계수)

R2특징

  • 오차가 없을수록 1에 가까운 값을 가짐
  • 값이 0인 경우, 데이터의 평균 값을 출력하는 직선 모델을 의미
  • 음수 값이 나온 경우, 평균 값 예측보다 성능이 좋지 않다.

분류 문제에 다양한 머신러닝 모델을 사용하여 해결할 수있다. 

트리구조 기반- 의사결정나무, 랜덤포레스트, ...

확률 모델 기반- 나이브 베이즈 분류기 ,...

결정 경계 기반 -선형 분류기, 로지스틱 회귀 분류기, SVM,...

신경망- 퍼셉트론, 딥러닝 모델,...

 

의사결정나무란 

스무고개와 같이 특정 질문들을 통해 정답을 찾아가는 모델

최상단의 뿌리 마디에서 마지막 끝 마디까지 아래 방향으로 진행

EX.항공 지연 문제 해결

 

분류 평가 지표(1)

혼동 행렬- 분류 모델의 성능을 평가하기 위함

True Positive: 실제Positive값을Positive라고예측(정답)True Negative: 실제Negative값을Negative라고예측(정답)False Positive: 실제Negative값을Positive라고예측(오답) 1오류False Negative: 실제Positive값을Negative라고예측(오답) 2오류

EX. 전체 100개 항공기 관련 정보 활용하여 지연 여부 예측을 실시했을 때 결과 값\

 

정밀도

재현율

FPRROC Curve와 AUC

 

분류목적에따라다양한지표를계산하여평가

분류결과를전체적으로보고싶다면혼동행렬(Confusion Matrix)

정답을얼마나맞췄는지정확도(Accuracy)

실제Positive 데이터에중요도가높다면정밀도(Precision), 재현율(Recall)

실제Negative 데이터에중요도가높다면FPR

FPRTPR변화에따른모델의전체적인성능ROC그래프AUC

 

728x90
반응형

관련글 더보기