K-겹 교차 검증은 모델 성능을 평가하는 데 사용되는 기술입니다. 이는 새로운, 보이지 않는 데이터에 대해 모델이 얼마나 잘 일반화되는지 추정하는 데 특히 유용합니다. 이 프로세스에는 데이터 세트를 'k' 하위 집합 또는 대략 동일한 크기의 접기로 나누는 작업이 포함됩니다. 단계는 다음과 같습니다.
1. 데이터 세트 분할:
데이터 세트는 'k'개의 동일한 크기의 하위 집합 또는 접기로 나뉩니다. 예를 들어, 1,000개의 샘플이 있고 'k'를 5로 선택하면 각 접기에는 200개의 샘플이 포함됩니다.
2. 반복적인 훈련 및 평가:
모델은 'k'회 학습되었습니다. 각 반복마다 다른 접기가 검증 세트로 사용되고 나머지 접기는 훈련에 사용됩니다. 예를 들어:
-
반복 1: 검증을 위해 1을 접고 훈련을 위해 2를 k로 접습니다.
-
반복 2: 검증을 위해 2를 접고 훈련을 위해 1과 3을 k로 접습니다.
-
반복 3: 검증을 위해 3을 접고 훈련을 위해 1과 2를 접고 4를 k로 접습니다.
-
... 모든 접기가 검증 세트로 사용될 때까지 계속됩니다.
3. 성능 평가:
각 반복 후에 모델 성능은 검증 세트에서 선택한 측정항목(예: 정확도, 정밀도, 재현율 등)을 사용하여 평가됩니다. 각 반복의 성능 측정항목은 평균화되거나 결합되어 모델 성능의 전체 추정치를 제공합니다.
4. 지표 집계:
각 반복의 성능 지표(예: 정확도 점수)는 평균화되거나 결합되어 모델 성능에 대한 전반적인 평가를 제공합니다. 이 집계된 측정항목은 보이지 않는 데이터에 대한 모델의 예상 성능을 나타냅니다.
단순한 학습/테스트 분할에 비해 K-겹 교차 검증의 장점
-
데이터의 더 나은 사용: K-겹 교차 검증은 각 샘플이 훈련과 검증 모두에 사용됨으로 사용 가능한 데이터를 더 잘 활용합니다.
-
성능 추정의 분산 감소: 단일 학습/테스트 분할과 관련된 분산을 줄여 더욱 신뢰할 수 있는 모델 성능 추정을 제공합니다.
-
일반화: 모델이 데이터의 다양한 하위 집합에서 어떻게 작동하는지 이해하고 일반화 기능을 평가하는 데 도움이 됩니다.
'k' 값 선택
-
더 높은 'k' 값: 더 높은 'k' 값(예: 10 이상)을 사용하면 검증 세트가 더 작아지고 이로 인해 성능 추정의 편향이 낮아지지만 계산 비용이 높아질 수 있습니다..
-
낮은 'k' 값: 낮은 'k' 값(예: 3 또는 5)을 사용하면 계산 비용이 줄어들지만 유효성 검사가 작아 성능 추정에 더 높은 편향이 발생할 수 있습니다. 세트.
실제 시나리오에서
-
대규모 데이터 세트의 경우 'k' 값이 높을수록 계산 비용이 많이 들 수 있습니다.
-
데이터 세트가 작은 경우 'k'가 높을수록 강력한 모델 교육을 위해 각 접기에서 충분한 데이터를 제공하지 못할 수 있습니다.
-
일반적으로 5 또는 10과 같은 값은 계산 효율성과 안정적인 성능 예측 사이의 균형을 유지하기 때문에 일반적으로 사용됩니다.