CRUD

Create, Read, Update, and Delete

Study/Data Analysis

엑셀 통계검정 완벽 가이드 | t검정, 카이제곱검정, 정규성검정 방법 선택

하이앤 2025. 6. 21. 12:32
반응형
SMALL

 

혹시 데이터 앞에서 "이거 어떤 검정을 써야 하지?" 하며 고민해본 적 있으신가요?

저도 처음엔 t검정, 카이제곱검정, 샤피로-윌크검정... 이름만 들어도 머리가 아팠어요

그런데 막상 정리해보니 각각 언제 쓰는지만 알면 생각보다 간단하더라고요!

오늘은 통계검정의 종류와 선택 기준을 한 번에 정리해봤습니다.

어떤 상황에서 어떤 검정을 써야 하는지, 엑셀로는 어떻게 계산하는지까지!

통계 초보자도 쉽게 따라할 수 있도록 차근차근 설명해드릴게요 😊

SMALL

✅ 통계검정 선택의 로드맵

통계검정을 선택하는 건 마치 병원에서 진료과를 선택하는 것과 같아요.

증상(데이터 특성)에 따라 가야 할 과(검정 방법)가 정해지거든요!

 

🗺️ 검정 선택 플로우차트

질문 답변 다음 단계
데이터 유형이 뭔가요? 연속형 / 범주형 → 검정 방향 결정
비교할 그룹이 몇 개인가요? 1개 / 2개 / 3개 이상 → 검정 복잡도 결정
그룹이 독립적인가요? 독립 / 대응(짝) → 검정 세부 방법
정규분포를 따르나요? 정규 / 비정규 → 모수/비모수 검정

 

📋 데이터 유형별 검정 방법

데이터 유형 비교 대상 검정 방법 엑셀 함수
연속형 1개 그룹 평균 단일표본 t검정 T.TEST
2개 그룹 평균 독립표본 t검정 T.TEST
대응 표본 대응표본 t검정 T.TEST
3개 이상 그룹 분산분석(ANOVA) 데이터분석도구
범주형 독립성 카이제곱 독립성 CHISQ.TEST
적합도 카이제곱 적합도 CHISQ.TEST
동질성 카이제곱 동질성 CHISQ.TEST
반응형

✅ 정규성 검정 - 샤피로-윌크 검정

다른 검정을 하기 전에 먼저 확인해야 할 가장 기본적인 검정이에요!

 

🔍 샤피로-윌크 검정이란?

목적: 데이터가 정규분포를 따르는지 확인

가설:

  • H0: 데이터가 정규분포를 따른다
  • H1: 데이터가 정규분포를 따르지 않는다

언제 사용하나요?

  • 표본 크기가 작을 때 (n ≤ 50)
  • t검정이나 ANOVA 전에 정규성 확인
  • 회귀분석의 잔차 정규성 검정

 

📊 엑셀에서 정규성 확인하기

엑셀에는 샤피로-윌크 검정 함수가 없어서 다른 방법을 사용해요.

-- 방법 1: 왜도와 첨도 확인
왜도(비대칭도): =SKEW(A1:A50)
첨도(뾰족함): =KURT(A1:A50)

판단 기준:
- 왜도: -2 ~ +2 범위면 정규분포 가정 가능
- 첨도: -2 ~ +2 범위면 정규분포 가정 가능

-- 방법 2: D'Agostino-Pearson 정규성 검정 (근사)
=IF(AND(ABS(SKEW(A1:A50))<2, ABS(KURT(A1:A50))<2), 
   "정규분포 가정 가능", "정규분포 아님")

 

📈 시각적 정규성 확인

1. 히스토그램 생성
   - 삽입 → 차트 → 히스토그램
   - 종 모양인지 확인

2. Q-Q 플롯 만들기
   - 이론적 분위수 vs 실제 분위수
   - 직선에 가까우면 정규분포

3. 상자그림(Box Plot)
   - 중앙값 중심으로 대칭인지 확인
   - 이상치 개수 확인

 

📍 정규성 검정 결과 해석

결과 의미 다음 단계
정규분포 따름 모수 검정 사용 가능 t검정, ANOVA 등
정규분포 아님 비모수 검정 사용 Mann-Whitney, Kruskal-Wallis
표본 크기 매우 큼 중심극한정리 적용 정규분포 가정하고 진행

✅ 카이제곱 검정 - 범주형 데이터의 왕

남녀 선호도 차이, 지역별 투표 결과 등 범주형 데이터 분석의 핵심!

🎯 카이제곱 검정의 3가지 유형

1️⃣ 적합도 검정 (Goodness of Fit)

  • 목적: 관측된 분포가 기대하는 분포와 같은지 확인
  • 예시: 주사위가 공정한지, 선택지별 응답 비율이 예상과 같은지
  • 가설: H0: 관측분포 = 기대분포

2️⃣ 독립성 검정 (Independence)

  • 목적: 두 범주형 변수가 서로 독립적인지 확인
  • 예시: 성별과 제품 선호도, 연령대와 정치 성향
  • 가설: H0: 두 변수는 독립이다

3️⃣ 동질성 검정 (Homogeneity)

  • 목적: 여러 그룹의 분포가 동일한지 확인
  • 예시: 지역별 브랜드 선호도, 학과별 취업률
  • 가설: H0: 모든 그룹의 분포가 동일하다

 

📊 엑셀에서 카이제곱 검정하기

STEP 1: 관측도수와 기대도수 준비

-- 예시: 성별과 제품 선호도 (독립성 검정)
        제품A  제품B  제품C  합계
남성      30    20    10    60
여성      15    25    20    60
합계      45    45    30   120

-- 기대도수 계산 (행합계 × 열합계 / 전체합계)
남성-제품A: =60*45/120 = 22.5
여성-제품A: =60*45/120 = 22.5

STEP 2: 카이제곱 통계량 계산

-- 수식: Σ[(관측도수-기대도수)²/기대도수]
=(30-22.5)^2/22.5 + (20-22.5)^2/22.5 + ... 

-- 또는 CHISQ.TEST 함수 사용
=CHISQ.TEST(관측도수범위, 기대도수범위)
=CHISQ.TEST(B2:D3, F2:H3)

STEP 3: 결과 해석

-- p값이 0.05보다 작으면 H0 기각
결과: p = 0.023 < 0.05
결론: 성별과 제품 선호도는 독립이 아니다 (관련성 있음)

 

🎯 실무 예제: 마케팅 캠페인 효과 분석

상황: 3가지 마케팅 방법의 효과가 같은지 확인

        성공   실패   합계
이메일    80    20    100
SNS광고   70    30    100  
TV광고    60    40    100
합계     210    90    300

-- 기대도수 계산
각 셀 기대도수 = (행합계 × 열합계) / 전체합계
이메일-성공: 100×210/300 = 70

-- CHISQ.TEST로 p값 계산
=CHISQ.TEST(B2:C4, E2:F4)

결과 해석:
p값 < 0.05 → 마케팅 방법별 효과 차이 있음
p값 ≥ 0.05 → 마케팅 방법별 효과 차이 없음

✅ t검정의 모든 것

연속형 데이터의 평균 비교에서 가장 많이 사용되는 검정방법!

 

📋 t검정의 3가지 유형

1️⃣ 단일표본 t검정

  • 목적: 표본평균이 특정 값과 같은지 확인
  • 예시: 신제품 만족도가 목표인 7점인지
  • 조건: 정규분포, 독립성
-- 엑셀 계산
t통계량 = (표본평균 - 가설평균) / (표본표준편차/√n)
=(AVERAGE(A1:A30)-7)/(STDEV.S(A1:A30)/SQRT(30))

-- p값 계산 (양측검정)
=T.DIST.2T(ABS(t통계량), 자유도)

2️⃣ 독립표본 t검정

  • 목적: 두 그룹의 평균이 같은지 확인
  • 예시: 남녀 소득 차이, A약 vs B약 효과
  • 조건: 정규분포, 독립성, 등분산성
-- T.TEST 함수 사용
=T.TEST(그룹1데이터, 그룹2데이터, 꼬리수, 유형)
=T.TEST(A1:A20, B1:B25, 2, 2)

매개변수:
- 꼬리수: 1(단측), 2(양측)
- 유형: 1(대응), 2(등분산), 3(이분산)

3️⃣ 대응표본 t검정

  • 목적: 같은 대상의 전후 비교
  • 예시: 교육 전후 성과, 다이어트 전후 체중
  • 조건: 차이값이 정규분포
-- 차이값 계산 후 단일표본 t검정
차이 = 후측정 - 전측정
=C1:C20 - B1:B20

-- T.TEST 함수 (대응표본)
=T.TEST(B1:B20, C1:C20, 2, 1)

 

🔍 등분산성 검정 (F검정)

독립표본 t검정 전에 먼저 확인해야 할 검정!

-- F.TEST 함수로 등분산성 확인
=F.TEST(그룹1데이터, 그룹2데이터)
=F.TEST(A1:A20, B1:B25)

결과 해석:
p값 < 0.05 → 분산이 다름 (이분산 t검정 사용)
p값 ≥ 0.05 → 분산이 같음 (등분산 t검정 사용)

✅ 실무 검정 선택 가이드

🎯 상황별 검정 방법 선택

상황 데이터 유형 검정 방법 엑셀 함수
신제품 만족도가 목표 달성했나? 연속형 단일표본 t검정 T.TEST
남녀 소득 차이가 있나? 연속형 독립표본 t검정 T.TEST
교육 전후 성과 차이가 있나? 연속형 대응표본 t검정 T.TEST
성별과 선호도에 관련성이 있나? 범주형 카이제곱 독립성 CHISQ.TEST
주사위가 공정한가? 범주형 카이제곱 적합도 CHISQ.TEST
데이터가 정규분포인가? 연속형 정규성 검정 SKEW, KURT
두 그룹의 분산이 같나? 연속형 등분산성 검정 F.TEST

 

⚠️ 검정 선택 시 주의사항

검정방법 주요 가정 위반 시 대안
t검정 정규분포, 독립성 Mann-Whitney U 검정
카이제곱 검정 기대도수 ≥ 5 Fisher의 정확검정
ANOVA 정규분포, 등분산성 Kruskal-Wallis 검정
상관분석 선형관계, 정규분포 Spearman 상관계수

 

💡 검정력(Power) 향상 팁

  1. 표본 크기 증가: 더 많은 데이터 수집
  2. 측정 정확도 향상: 오차 줄이기
  3. 단측검정 고려: 방향성이 명확할 때
  4. 유의수준 조정: 0.01 대신 0.05 사용
  5. 실험 설계 개선: 교란변수 통제

 
반응형
LIST