살군의 보조기억 장치

Another memory device…

m-fold cross validation

with one comment

m-fold cross-validation 을 하는 방법은,

  1. original sample을 m개의 subset sample로 나눈다
  2. 이 가운데 (m-1) 개의 subset을 사용해 training 한 후 나머지 1개의 subset을 validation한다.
  3. 위의 2번 을 모든 subset에 대해서 각각 1번씩 validation 수행
  4. m개의 validation결과를 average 하거나 (혹은 다른 방법으로 combination 해서) single estimation 결과를 산출

m-fold cross-validation의 장점은 모든 observation이 training과 validation에 모두 사용된다는 것이다. 또한, observation은 모두 단 1번만의 validation이 수행된다. 10-fold cross-validation이 일반적으로 사용된다.

m개의 subset을 나눌때는 mean이 동일하도록 나눠야 한다. 즉, 2 class 문제의 경우, 각각 class가 subset에 가능한 동일한 비율로 분포되도록 나눠줘야 한다.

Advertisements

Written by gomiski

2010/06/15 at 12:52 am

One Response

Subscribe to comments with RSS.

  1. 쉬운 설명 감사합니다.

    강윤태

    2011/06/28 at 2:11 am


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: