CRUD

Create, Read, Update, and Delete

Study/Data Analysis

엑셀 t분포 함수 완벽 가이드 | T.DIST, T.INV로 가설검정부터 신뢰구간까지

하이앤 2025. 6. 21. 08:10
반응형
SMALL

 

이번엔 엑셀 t분포 함수,,,

정규분포 다음으로 통계에서 정말 중요한 분포인데, 실무에서도 많이 쓰더라고요

표본이 작을 때나 가설검정할 때, 신뢰구간 만들 때도 필수고...!!

그래서 이번에는 엑셀에서 t분포와 관련된 함수들을 정리해봤어요.

t분포는 표본 크기가 작을 때 사용하는 확률분포라고 보시면 돼요.

데이터 분석과 통계 검정하시는 분들에게 조금이라도 도움이 되길 바라며 시작해볼게요:)

SMALL

✅ t분포가 뭔가요?

t분포는 **Student's t-Distribution**의 줄임말이에요.

쉽게 말해서 표본 크기가 작을 때 사용하는 정규분포의 변형입니다.

정규분포보다 양 끝이 더 두껍고, 표본이 클수록 정규분포에 가까워져요!

 

언제 t분포를 사용하나요?

  • 소표본 분석: 표본 크기가 30개 미만일 때
  • 모집단 표준편차를 모를 때: 표본 표준편차로 추정
  • 평균 검정: 단일표본 t검정, 대응표본 t검정
  • 신뢰구간: 평균의 신뢰구간 계산
  • 회귀분석: 회귀계수의 유의성 검정

정규분포 vs t분포 비교

  • 정규분포: 모집단 표준편차 알고 있을 때, 대표본(n≥30)
  • t분포: 모집단 표준편차 모를 때, 소표본(n<30)
  • 자유도(degree of freedom): t분포는 자유도(n-1)에 따라 모양이 달라짐

=> 자유도가 커짐에 따라(30이상) t분포가 정규분포에 가까워진다.

반응형


✅ T.DIST - t분포 확률 계산

기본 문법

=T.DIST(t값, 자유도, 누적여부)

 

매개변수 설명

  • t값: t통계량 또는 확률을 구하고 싶은 값
  • 자유도: 일반적으로 (표본크기 - 1)
  • 누적여부: TRUE(누적확률), FALSE(확률밀도)

 

실제 활용 예시

-- 자유도 9에서 t값이 2.0일 때 누적확률
=T.DIST(2.0, 9, TRUE)
결과: 0.9616 (96.16%)

-- 자유도 15에서 t값이 1.5일 때 확률밀도
=T.DIST(1.5, 15, FALSE)
결과: 0.0791

-- p값 계산 (양측검정)
=2*(1-T.DIST(ABS(t통계량), 자유도, TRUE))

 

📍 T.DIST 실무 활용 포인트

가설검정에서의 활용

  • p값 계산: 귀무가설을 기각할지 결정
  • 유의수준 비교: 보통 0.05(5%) 기준
  • 양측검정 vs 단측검정 구분

표본 크기별 특징

  • 자유도가 작을수록 분포가 더 평평함
  • 자유도가 30 이상이면 정규분포와 거의 동일
  • 자유도가 1일 때는 코시분포와 유사

✅ T.INV - t분포 역함수

확률이 주어졌을 때 해당하는 t값을 구하는 함수예요.

 

기본 문법

=T.INV(확률, 자유도)

 

실무 활용 예시

-- 95% 신뢰구간 임계값 (자유도 9, 양측)
=T.INV(0.975, 9)
결과: 2.262

-- 99% 신뢰구간 임계값 (자유도 19, 양측)
=T.INV(0.995, 19)
결과: 2.861

-- 단측검정 5% 유의수준 임계값
=T.INV(0.95, 자유도)

 

📍 T.INV 활용 팁

신뢰구간 계산하기

  • 95% 신뢰구간: 평균 ± T.INV(0.975, n-1) × 표준오차
  • 99% 신뢰구간: 평균 ± T.INV(0.995, n-1) × 표준오차
  • 표준오차 = 표본표준편차 / √표본크기

가설검정 임계값

  • 양측검정 5%: ±T.INV(0.975, 자유도)
  • 단측검정 5%: T.INV(0.95, 자유도)
  • 양측검정 1%: ±T.INV(0.995, 자유도)

✅ T.DIST.2T & T.INV.2T - 양측검정 전용

 

T.DIST.2T - 양측 확률

양측검정에서 p값을 바로 계산해주는 편리한 함수예요.

=T.DIST.2T(t값의 절댓값, 자유도)

-- t통계량이 2.5, 자유도 8일 때 양측 p값
=T.DIST.2T(2.5, 8)
결과: 0.0374 (3.74%)

-- 이는 다음과 같음
=2*(1-T.DIST(2.5, 8, TRUE))

 

T.INV.2T - 양측 임계값

=T.INV.2T(유의수준, 자유도)

-- 5% 유의수준, 자유도 10에서 양측 임계값
=T.INV.2T(0.05, 10)
결과: ±2.228

-- 1% 유의수준, 자유도 15에서 양측 임계값
=T.INV.2T(0.01, 15)
결과: ±2.947

 

📍 언제 어떤 함수를 쓸까요?

검정 유형 p값 계산 임계값 계산
양측검정 T.DIST.2T T.INV.2T
단측검정 (우측) 1-T.DIST T.INV
단측검정 (좌측) T.DIST T.INV

✅ 실무 예제 - 종합 활용

🎯 예제 1: 신제품 만족도 조사

상황: 신제품 만족도를 20명에게 조사 (10점 만점)

데이터: 평균 7.2점, 표준편차 1.5점

 

1단계: 평균의 95% 신뢰구간

표본크기: 20명
자유도: 19 (20-1)
표준오차: 1.5/√20 = 0.335

임계값: =T.INV(0.975, 19) → 2.093
오차한계: 2.093 × 0.335 = 0.701

95% 신뢰구간: 7.2 ± 0.701 → [6.50, 7.90]

 

2단계: 가설검정 (만족도 7점 이상인지)

H0: μ = 7 (만족도 7점)
H1: μ > 7 (만족도 7점 초과)

t통계량: =(7.2-7)/(1.5/√20) = 0.596

p값: =1-T.DIST(0.596, 19, TRUE) → 0.278

결론: p값(0.278) > 0.05이므로 
      만족도가 7점보다 높다고 할 수 없음

 

🎯 예제 2: 교육 전후 비교 (대응표본)

상황: 15명 직원의 교육 전후 성과점수 차이

차이의 평균: 3.2점, 차이의 표준편차: 2.8점

H0: μ차이 = 0 (교육 효과 없음)
H1: μ차이 > 0 (교육 효과 있음)

자유도: 14 (15-1)
t통계량: =3.2/(2.8/√15) = 4.43

p값: =1-T.DIST(4.43, 14, TRUE) → 0.0003

결론: p값(0.0003) < 0.05이므로 
      교육 효과가 있다고 판단

 

📊 예제 3: 두 집단 평균 비교

상황: A팀 12명(평균 85점), B팀 10명(평균 78점)

독립표본 t검정 공식:
t = (평균1-평균2) / 합동표준오차

자유도: (12-1)+(10-1) = 20
합동분산 계산 후 t통계량 도출

p값: =T.DIST.2T(t통계량, 20)

 

⚠️ 실무 주의사항

  • 정규성 가정: 모집단이 정규분포를 따른다고 가정
  • 독립성: 관측값들이 서로 독립적이어야 함
  • 표본 크기: 너무 작으면 (n<5) 결과 신뢰도 떨어짐
  • 이상치 영향: 소표본에서는 이상치가 결과에 큰 영향

✅ t분포 함수 완벽 정리

🚨 함수별 용도 정리

함수명 용도 언제 사용?
T.DIST 누적확률 계산 단측검정 p값, 신뢰구간
T.INV 임계값 계산 단측검정 기준, 신뢰구간
T.DIST.2T 양측 p값 양측검정 p값 계산
T.INV.2T 양측 임계값 양측검정 기준값

💡 자주 쓰는 임계값들

자유도 95% 양측 99% 양측 95% 단측
5 ±2.571 ±4.032 2.015
10 ±2.228 ±3.169 1.812
20 ±2.086 ±2.845 1.725
30 ±2.042 ±2.750 1.697

🔍 실무 체크리스트

  1. 표본 크기 확인: 30 미만이면 t분포 사용
  2. 검정 유형 결정: 양측 vs 단측검정
  3. 유의수준 설정: 보통 0.05 (5%)
  4. 자유도 계산: 표본크기 - 1
  5. 가정 확인: 정규성, 독립성

많은 도움이 되셨을까요~?

기초 지식이라도 조금씩 알아두면 도움이 되실거에요:)

반응형
LIST