Class imbalance

Class Imbalance (클래스 불균형) 대부분의 비즈니스 상황에서 타겟 클래스의 불균형은 매우 흔하다. 예를 들어 제조 공정간 불량 예측을 수행하는 모델을 학습시킬 때, 데이터 중에는 정상 데이터가 불량보다 훨씬 많을 것이다. 머신러닝 알고리즘들은 보통 데이터가 클래스 내에서 고르게 분포되어있다고 가정하기 때문에, 다수의 클래스를 더 많이 예측하는 쪽으로 모델이 편향되는 경향이 있다. 즉, 소수의 클래스에서 오분류 비율이 높아질 수 있다는 것이다. 이러한 부분 때문에 클래스 불균형은 모델링을 할때 매우 문제가 될 수 있다. 극단적인 예시를 한번 살펴보면 실제값 314개의 데이터 중 0은 283개, 1은 31개인 데이터에 대해서 모델이 314개를 모두 0이라고 예측했다고 해보자 이 분류모델이 예측을..
kybeen
'Class imbalance' 태그의 글 목록