나는 회사에서 데이터를 다루고 있지만, 분석에 대해 모르는 내용이 많다. 이번 휴직 기간에 여러 수업들을 들어보면서, 내가 몰랐던 것이 무엇인지, 왜 해야하는지에 대해 알게 되었다. 그 대표적인 것이 바로 배깅(Bagging). ADsP시험 준비하면서 알게 된 단어인데, 앙상블 chapter에 있어서 앙상블의 하나의 방법인줄만 알았다. (물론 앙상블의 방법 중 하나인 것은 맞다.) 데이터분석 전문가 가이드(무려 988페이지임.)에 나온 내용은 다음과 같다. 배깅(bagging)은 bootstrap aggregating의 준말로 원 데이터 집합으로부터 크기가 같은 표본을 단순 임의 복원추출하여 각 표본(이를 붓스트랩 표본이라 함)에 대해 분류기를 생성한 후 그 결과를 앙상블하는 방법이다. 오우~ ADsP시..