혹시 데이터 앞에서 "이거 어떤 검정을 써야 하지?" 하며 고민해본 적 있으신가요?
저도 처음엔 t검정, 카이제곱검정, 샤피로-윌크검정... 이름만 들어도 머리가 아팠어요
그런데 막상 정리해보니 각각 언제 쓰는지만 알면 생각보다 간단하더라고요!
오늘은 통계검정의 종류와 선택 기준을 한 번에 정리해봤습니다.
어떤 상황에서 어떤 검정을 써야 하는지, 엑셀로는 어떻게 계산하는지까지!
통계 초보자도 쉽게 따라할 수 있도록 차근차근 설명해드릴게요 😊

✅ 통계검정 선택의 로드맵
통계검정을 선택하는 건 마치 병원에서 진료과를 선택하는 것과 같아요.
증상(데이터 특성)에 따라 가야 할 과(검정 방법)가 정해지거든요!
🗺️ 검정 선택 플로우차트
질문 | 답변 | 다음 단계 |
데이터 유형이 뭔가요? | 연속형 / 범주형 | → 검정 방향 결정 |
비교할 그룹이 몇 개인가요? | 1개 / 2개 / 3개 이상 | → 검정 복잡도 결정 |
그룹이 독립적인가요? | 독립 / 대응(짝) | → 검정 세부 방법 |
정규분포를 따르나요? | 정규 / 비정규 | → 모수/비모수 검정 |
📋 데이터 유형별 검정 방법
데이터 유형 | 비교 대상 | 검정 방법 | 엑셀 함수 |
연속형 | 1개 그룹 평균 | 단일표본 t검정 | T.TEST |
2개 그룹 평균 | 독립표본 t검정 | T.TEST | |
대응 표본 | 대응표본 t검정 | T.TEST | |
3개 이상 그룹 | 분산분석(ANOVA) | 데이터분석도구 | |
범주형 | 독립성 | 카이제곱 독립성 | CHISQ.TEST |
적합도 | 카이제곱 적합도 | CHISQ.TEST | |
동질성 | 카이제곱 동질성 | CHISQ.TEST |
✅ 정규성 검정 - 샤피로-윌크 검정
다른 검정을 하기 전에 먼저 확인해야 할 가장 기본적인 검정이에요!
🔍 샤피로-윌크 검정이란?
목적: 데이터가 정규분포를 따르는지 확인
가설:
- H0: 데이터가 정규분포를 따른다
- H1: 데이터가 정규분포를 따르지 않는다
언제 사용하나요?
- 표본 크기가 작을 때 (n ≤ 50)
- t검정이나 ANOVA 전에 정규성 확인
- 회귀분석의 잔차 정규성 검정
📊 엑셀에서 정규성 확인하기
엑셀에는 샤피로-윌크 검정 함수가 없어서 다른 방법을 사용해요.
-- 방법 1: 왜도와 첨도 확인
왜도(비대칭도): =SKEW(A1:A50)
첨도(뾰족함): =KURT(A1:A50)
판단 기준:
- 왜도: -2 ~ +2 범위면 정규분포 가정 가능
- 첨도: -2 ~ +2 범위면 정규분포 가정 가능
-- 방법 2: D'Agostino-Pearson 정규성 검정 (근사)
=IF(AND(ABS(SKEW(A1:A50))<2, ABS(KURT(A1:A50))<2),
"정규분포 가정 가능", "정규분포 아님")
📈 시각적 정규성 확인
1. 히스토그램 생성
- 삽입 → 차트 → 히스토그램
- 종 모양인지 확인
2. Q-Q 플롯 만들기
- 이론적 분위수 vs 실제 분위수
- 직선에 가까우면 정규분포
3. 상자그림(Box Plot)
- 중앙값 중심으로 대칭인지 확인
- 이상치 개수 확인
📍 정규성 검정 결과 해석
결과 | 의미 | 다음 단계 |
정규분포 따름 | 모수 검정 사용 가능 | t검정, ANOVA 등 |
정규분포 아님 | 비모수 검정 사용 | Mann-Whitney, Kruskal-Wallis |
표본 크기 매우 큼 | 중심극한정리 적용 | 정규분포 가정하고 진행 |
✅ 카이제곱 검정 - 범주형 데이터의 왕
남녀 선호도 차이, 지역별 투표 결과 등 범주형 데이터 분석의 핵심!
🎯 카이제곱 검정의 3가지 유형
1️⃣ 적합도 검정 (Goodness of Fit)
- 목적: 관측된 분포가 기대하는 분포와 같은지 확인
- 예시: 주사위가 공정한지, 선택지별 응답 비율이 예상과 같은지
- 가설: H0: 관측분포 = 기대분포
2️⃣ 독립성 검정 (Independence)
- 목적: 두 범주형 변수가 서로 독립적인지 확인
- 예시: 성별과 제품 선호도, 연령대와 정치 성향
- 가설: H0: 두 변수는 독립이다
3️⃣ 동질성 검정 (Homogeneity)
- 목적: 여러 그룹의 분포가 동일한지 확인
- 예시: 지역별 브랜드 선호도, 학과별 취업률
- 가설: H0: 모든 그룹의 분포가 동일하다
📊 엑셀에서 카이제곱 검정하기
STEP 1: 관측도수와 기대도수 준비
-- 예시: 성별과 제품 선호도 (독립성 검정)
제품A 제품B 제품C 합계
남성 30 20 10 60
여성 15 25 20 60
합계 45 45 30 120
-- 기대도수 계산 (행합계 × 열합계 / 전체합계)
남성-제품A: =60*45/120 = 22.5
여성-제품A: =60*45/120 = 22.5
STEP 2: 카이제곱 통계량 계산
-- 수식: Σ[(관측도수-기대도수)²/기대도수]
=(30-22.5)^2/22.5 + (20-22.5)^2/22.5 + ...
-- 또는 CHISQ.TEST 함수 사용
=CHISQ.TEST(관측도수범위, 기대도수범위)
=CHISQ.TEST(B2:D3, F2:H3)
STEP 3: 결과 해석
-- p값이 0.05보다 작으면 H0 기각
결과: p = 0.023 < 0.05
결론: 성별과 제품 선호도는 독립이 아니다 (관련성 있음)
🎯 실무 예제: 마케팅 캠페인 효과 분석
상황: 3가지 마케팅 방법의 효과가 같은지 확인
성공 실패 합계
이메일 80 20 100
SNS광고 70 30 100
TV광고 60 40 100
합계 210 90 300
-- 기대도수 계산
각 셀 기대도수 = (행합계 × 열합계) / 전체합계
이메일-성공: 100×210/300 = 70
-- CHISQ.TEST로 p값 계산
=CHISQ.TEST(B2:C4, E2:F4)
결과 해석:
p값 < 0.05 → 마케팅 방법별 효과 차이 있음
p값 ≥ 0.05 → 마케팅 방법별 효과 차이 없음
✅ t검정의 모든 것
연속형 데이터의 평균 비교에서 가장 많이 사용되는 검정방법!
📋 t검정의 3가지 유형
1️⃣ 단일표본 t검정
- 목적: 표본평균이 특정 값과 같은지 확인
- 예시: 신제품 만족도가 목표인 7점인지
- 조건: 정규분포, 독립성
-- 엑셀 계산
t통계량 = (표본평균 - 가설평균) / (표본표준편차/√n)
=(AVERAGE(A1:A30)-7)/(STDEV.S(A1:A30)/SQRT(30))
-- p값 계산 (양측검정)
=T.DIST.2T(ABS(t통계량), 자유도)
2️⃣ 독립표본 t검정
- 목적: 두 그룹의 평균이 같은지 확인
- 예시: 남녀 소득 차이, A약 vs B약 효과
- 조건: 정규분포, 독립성, 등분산성
-- T.TEST 함수 사용
=T.TEST(그룹1데이터, 그룹2데이터, 꼬리수, 유형)
=T.TEST(A1:A20, B1:B25, 2, 2)
매개변수:
- 꼬리수: 1(단측), 2(양측)
- 유형: 1(대응), 2(등분산), 3(이분산)
3️⃣ 대응표본 t검정
- 목적: 같은 대상의 전후 비교
- 예시: 교육 전후 성과, 다이어트 전후 체중
- 조건: 차이값이 정규분포
-- 차이값 계산 후 단일표본 t검정
차이 = 후측정 - 전측정
=C1:C20 - B1:B20
-- T.TEST 함수 (대응표본)
=T.TEST(B1:B20, C1:C20, 2, 1)
🔍 등분산성 검정 (F검정)
독립표본 t검정 전에 먼저 확인해야 할 검정!
-- F.TEST 함수로 등분산성 확인
=F.TEST(그룹1데이터, 그룹2데이터)
=F.TEST(A1:A20, B1:B25)
결과 해석:
p값 < 0.05 → 분산이 다름 (이분산 t검정 사용)
p값 ≥ 0.05 → 분산이 같음 (등분산 t검정 사용)
✅ 실무 검정 선택 가이드
🎯 상황별 검정 방법 선택
상황 | 데이터 유형 | 검정 방법 | 엑셀 함수 |
신제품 만족도가 목표 달성했나? | 연속형 | 단일표본 t검정 | T.TEST |
남녀 소득 차이가 있나? | 연속형 | 독립표본 t검정 | T.TEST |
교육 전후 성과 차이가 있나? | 연속형 | 대응표본 t검정 | T.TEST |
성별과 선호도에 관련성이 있나? | 범주형 | 카이제곱 독립성 | CHISQ.TEST |
주사위가 공정한가? | 범주형 | 카이제곱 적합도 | CHISQ.TEST |
데이터가 정규분포인가? | 연속형 | 정규성 검정 | SKEW, KURT |
두 그룹의 분산이 같나? | 연속형 | 등분산성 검정 | F.TEST |
⚠️ 검정 선택 시 주의사항
검정방법 | 주요 가정 | 위반 시 대안 |
t검정 | 정규분포, 독립성 | Mann-Whitney U 검정 |
카이제곱 검정 | 기대도수 ≥ 5 | Fisher의 정확검정 |
ANOVA | 정규분포, 등분산성 | Kruskal-Wallis 검정 |
상관분석 | 선형관계, 정규분포 | Spearman 상관계수 |
💡 검정력(Power) 향상 팁
- 표본 크기 증가: 더 많은 데이터 수집
- 측정 정확도 향상: 오차 줄이기
- 단측검정 고려: 방향성이 명확할 때
- 유의수준 조정: 0.01 대신 0.05 사용
- 실험 설계 개선: 교란변수 통제
'Study > Data Analysis' 카테고리의 다른 글
엑셀 중심극한정리 완벽 가이드 | 표본평균 정규분포부터 신뢰구간 계산까지 (0) | 2025.06.21 |
---|---|
엑셀 이항분포 함수 완벽 가이드 | BINOM.DIST, BINOM.INV로 성공확률부터 품질관리까지 (0) | 2025.06.21 |
엑셀 t분포 함수 완벽 가이드 | T.DIST, T.INV로 가설검정부터 신뢰구간까지 (1) | 2025.06.21 |
MySQL 기초 - 3편: 내장 함수로 데이터 활용 마스터하기 🎯 (1) | 2025.06.20 |
엑셀 정규분포 함수 완벽 가이드 | NORM.DIST, NORM.INV로 확률계산부터 실무활용까지 (2) | 2025.06.20 |