m-fold cross validation

m-fold cross-validation 을 하는 방법은,

  1. original sample을 m개의 subset sample로 나눈다
  2. 이 가운데 (m-1) 개의 subset을 사용해 training 한 후 나머지 1개의 subset을 validation한다.
  3. 위의 2번 을 모든 subset에 대해서 각각 1번씩 validation 수행
  4. m개의 validation결과를 average 하거나 (혹은 다른 방법으로 combination 해서) single estimation 결과를 산출

m-fold cross-validation의 장점은 모든 observation이 training과 validation에 모두 사용된다는 것이다. 또한, observation은 모두 단 1번만의 validation이 수행된다. 10-fold cross-validation이 일반적으로 사용된다.

m개의 subset을 나눌때는 mean이 동일하도록 나눠야 한다. 즉, 2 class 문제의 경우, 각각 class가 subset에 가능한 동일한 비율로 분포되도록 나눠줘야 한다.

One thought on “m-fold cross validation

Leave a comment