| rare event logistic regression 약물 부작용, 불량품 , 사고, 상품 조회 등과 같이 전체 사건 대비 event의 수가 작은 binary outcome 데이터에 대해 logistic regression을 수행하는 경우 각 변수의 $\beta$값을 추정하는데 있어 정밀도가 떨어지는(over estimate) 문제점이 있다. 특히 이런 rare event의 경우 적절한 처리를 해주지 않으면 머신러닝 알고리즘을 사용하더라도 향상된 결과를 기대하기 어려운데 그 이유가 대부분의 결과를 major한 class로 예측하기 때문이다. 머신러닝 알고리즘에서는 샘플링(SMOTE, under sampling, over sampling) 등으로 해결하는 접근이 가장 유명하지만 이번엔 샘플링이 아닌 ..