Skip to content

이론 및 T검정 #
Find similar titles

Structured data

Category
Statistics

이론및 T검정 #

통계검정의 순서도 #

<<통계검정의 순서도>>

Image

이미지 출처: prezi.com

T-검정이란? #

T- 검정은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 추정된 분산이나 표준편차를 이용하여 두 모집단의 평균의 차이를 알아보는 검정 방법이다. 집단의 수는 최대 2개까지 비교 가능하며 3개 이상인 경우 분산분석(ANOVA)를 사용한다.

T-검정의 가정 #

1)종속변수가 양적 변수일 때
2)모집단의 분산이나 표준편차를 알지 못할 때
3)모집단의 분포가 정규분포일 때

T-검정의 유형 #

1. 단일표본 T-검정(One sample T-test) #

표본이 하나일 때, 모집단의 평균과 표본집단의 평균 사이에 차이가 있는지를 검증하는 방법이다. (집단의 수가 1개)

2. 두 표본 T-검정(Two sample T-test) #

두 집단의 표본을 종속적, 독립적 관계로 추출하여 비교함으로써 유사성을 검정하는 방법으로 두 집단의 차이를 알아보기 위해 사용되는 분석방법이다. (집단의 수가 2개) 독립적인 두 집단의 평균의 차이가 0인지를 검정한다.

1)분석 순서 #

1)두 집단의 분산이 같은지 검정한다 (var.test())
2)분산이 다르면 Welcht-test를 적용한다 (t.test())
3)분산이 같으면 pooled variance를 이용한 t-test를 적용한다 (var.equal=TRUE)

2)가정 #

1)독립성: 독립변수의 그룹 군은 서로 독립적 이여야 한다.
2)정규성: 독립변수에 따른 종속변수는 정규분포를 만족해야한다.
3)등분산성: 독립변수에 따른 종속변수 분포의 분산은 각 군마다 동일하다.

3. 대응표본 T-검정(Paired T-test) #

실험 이전의 집단과 실험 이후의 집단이 동일한 집단인 경우 사용하는 검정으로 한 사람이 처리 이전과 이후 각 1번씩 측정을 해서 사전/사후를 비교하는 것을 말한다. 모집단이 1개인 경우이다. 쌍을 이룬 두 변수 간에 차이의 평균이 0인지를 검정한다.

대응표본과 독립표본의 차이 #

독립표본 T 검정 대응표본 T 검정
조사대상 개체가 다름 조사대상 개체가 같음
두 범주의 표본숫자가 다를 수 있음 표본 숫자가 같음
다른 집단을 비교 전후 개념이 있는 경우가 많음

T검정의 예제 #

1. 단일표본 T-검정 #

예제) 2006년 조사에 의하면 한국인의 1인 1일 평균 알코올 섭취량이 8.1g 이다. 200년 알코올 섭취량이 달라졌는지를 조사한 자료이다.

* 2006년도 평균 알코올 섭취량: 8.1g

* 2008년도 알코올 섭취량(random)
15.50 11.21 12.67 8.87 12.15 9.88 2.06 14.50 0 4.97

x = c(15.50, 11.21, 12.67, 8.87, 12.15, 9.88, 2.06, 14.50, 0, 4.97)

mean(x)

sd(x)

t.test(x, mu=8.1)

2. 두 표본 T-검정 #

예제) 데이터 Data.csv는 다른 두 조건(control, test)에서 배양된 뼈세포의 수(resp)를 측정한 자료이다.

Treatment resp
test 148
test 190
test 68
test 79
control 40
control 80
control 64
tcontrol 52
Data = read.csv(“Data.csv”)

Var.test(log(resp) ~ treatment,data=Data)

* 분산이 다른경우:
t.test(log(resp) ~ treatment, data=Data)

* 분산이 같은경우:
t.test(log(resp) ~ treatment, data=Data, var.equal=TRUE)

3. 대응표본 T-검정 #

예제) 데이터 anorexia.csv는 7명을 대상으로 거식증 치료제 FT 복용 전후의 체중 변화를 측정하여 FT가 체중 감소에 영향이 있는지를 조사한 실험이다. 여기서 복용전과 복용후 차이가 0 인지가 관심의 대상이다.

복용 전 복용 후 복용 후 – 복용 전
83.8 95.2 11.4
83.3 94.3 11
86 91.5 5.5
82.5 91.9 9.4
86.7 100.3 13.6
86.6 91.7 5.1
87.3 98 10.7
Data = read.csv(“anorexia.csv”)
t.test(Data$3)  # 복용 후 – 복용 전

참고 #

  1. R을 이용한 누구나 하는 통계분석. 안재형 지음 | 한나래 | 2016년 03월 25일 출간 (1쇄 2011년 01월 15일)
0.0.1_20140628_0