7. 분산분석(ANOVA)

분산분석이란 명목척도로 측정된 독립변수와 등간 또는 비율척도로 측정된 종속변수 사이와 관계를 연구하는 통계기법입니다. 분산분석은 둘 이상의 집단들간에 어떤 변수의 평균점수에 차이가 있는지를 검정하는 것입니다. 분산분석은 하나의 범주형 독립변수와 종속변수간의 관계를 분석하는 일원분산분석과 둘 이상의 독립변수들을 함께 고려했을 때 이들이 종속변수에 미치는 효과를 분석하는 이원분산분석으로 분류할 수 있습니다. 먼저 일원분산분석을 살펴보겠습니다.
 

7.1 일원분산분석

명목척도로 구성된 독립변수와 등간척도 이상으로 구성된 종속변수의 수가 각각 하나씩 있는 경우에 사용하는 분석입니다. 일원분산분석에는 두 개의 독립표본의 평균비교를 확장한 일원분산분석(One-Way ANOVA)과 Paired-diffefence test를 확장한 무작위 블록디자인의 일원분산분석으로 나눌 수 있습니다. 무작위 블록디자인에 의한 일원분산분석은 7.2에서 다루도록 하겠습니다.

 


속옷 회사에서 신체에 따른 기능성 속옷을 개발하기 위해 신체적 조건에 따른 신체만족도를 조사하기로 하였다. 신체적 조건에 따라 신체만족도에 차이가 있는지 알아보고자 한다.

 

1) 가설설정

분산분석에서 영가설은 각 집단별 종속변수의 평균값이 동일하다는 점입니다. 여기서는 집단이 여러 개이므로 다음과 같이 가설이 설정됩니다.

 

<연구가설> : 신체적 조건에 따라 신체만족도에 차이가 있다.

(영가설) :

(대립가설) : 적어도 어느 두 집단은 다르다.

 

2) 유의수준 설정

3) 가정검토

 

분산분석을 적용하기 전에 조사자는 각 집단의 특성과 관련하여 다음과 같은 전제조건들이 충족되는지를 검토해야 합니다.

① 독립성 : 각 집단은 서로 독립적이어야 합니다.

② 정규성 : 각 집단을 정규분포를 이루어야 합니다.

③ 불편성 : 각 집단별 분산의 정도가 비슷해야 합니다.

 

4) 검정통계량

 

분산분석에서는 두 개 이상의 집단들의 평균값을 비교하기 위해 F값을 검정통계량으로 사용합니다. 조사자는 집단간의 차이를 구하기 위해 전체평균과 집단평균간의 차이와 집단평균과 개별관찰치와의 차이로 구분하여 계산합니다. 즉, (전체평균-개별관찰값) = (전체평균-집단평균)+(집단평균-개별관찰값)으로 계산합니다.

 

위 식의 각 구성요소를 제곱하면 세 가지 유형의 분산으로 구성됩니다.

 

+

=

총변량(SST)

+

집단간 변량(SSB)

=

집단내 변량(SSW)

각 구성요소의 계산식에 대해 살펴봅시다.


 

① 총변량(SST : sum of squares total)은 각 관찰값들이 전체 표본의 평균들을 중심으로 얼마만큼 떨어져 있는가를 측정하는 것입니다.


 

: 종속변수 의 개별관찰값

: 전체표본에서의 종속변수의 평균

: 집단의 표본 수

  : 집단의 수


 

② 집단간 변량(SSB : sum of squares between groups)은 독립변수에 의해 나누어진 각 집단의 평균이 전체표본 평균의 중심으로 얼마나 떨어져 있는가를 측정하는 것입니다.


 

번째 집단의 표본 수

번째 집단의 평균


 

③ 집단내 변량(SSW : sum of squares within groups)은 각 표본집단내 개별관찰치들이 각 표본집단의 평균을 중심으로 어느 정도 떨어져 있는가를 측정하는 것입니다.


 


 

집단간 변량과 집단내 변량이 구해지면 이를 통해 집단간의 차이를 검정할 수 있습니다. 분산분석에서는 집단간 차이가 유의하기 위해서는 집단내 변량은 가능한 적어야 하며 집단간 변량은 가능한 커야 합니다. 이를 위해 분산분석에서는 집단간 분산치와 집단내 분산치의 상대적인 비율을 나타내는 통계량을 이용하여 집단간 차이에 대한 검정을 합니다.


 

 

 


 

분산분석에서의 자유도는 크게 세 가지입니다.

집단간 변량의 자유도는 독립표본의 수 - 1(=)이고, 집단내 변량의 자유도는 사례수 - 독립표본 수(=), 총변량의 자유도는 사례수 - 1(=)입니다.


 

이를 토대로 분산분석표를 작성해 본 후 분석해 봅시다.

 

Source

제곱합 SS

자유도 df

제곱평균 MS

F

집단간 변량

 

 

 

 

 

집단내 변량

 

총변량

 

 

조사자는 집단간 차이에 대한 가설설정을 위해 의 임계치를 구해야 합니다. 의 임계치는 유의수준과 각각의 자유도에 따라 결정이 됩니다. 만약 계산된 값이 의 임계치 (=)값보다 작으면, 영가설을 채택하게 됩니다. 반대로 값이 의 임계치 (=)값보다 크면, 영가설을 기각하고 집단간 차이가 있다고 결론지을 수 있습니다.


 

5) 실행방법


 

일원분산분석을 시작하기 위해 [예제 09-1]파일을 열어봅니다. 파일을 열면 데이터 편집기에 6개의 변수가 있습니다. 2장에서 변수변환에 대해 배운 적이 있지요? 여기서는 5개의 변수를 신체만족도라는 하나의 변수로 합치려고 합니다. 2장을 배운 내용을 토대로 간단히 설명을 하겠습니다.


 

우선 변수변환을 위해 변환메뉴에 들어가서 변수계산을 클릭해 줍니다. 키, 몸무게, 가슴둘레, 허리둘레, 힙둘레의 변수는 모두 각각에 대한 자신의 만족도를 측정한 것입니다. 이에 대한 만족도를 하나의 신체만족도로 만들어주기 위해 다섯 개의 변수를 합한 후 그 값을 변수의 개수로 나누어줍니다.

 

변환(T)→변수계산(C)

이 절차를 따라 하면 [그림 7.1]과 같은 대화상자가 나타납니다.


 

대상변수에는 새로 생성할 변수명을 적어 넣습니다. 여기서는 신체만족도에 관한 내용을 적으면 되지만 글자수는 한글인 경우 4자, 영문인 경우 8자로 제한되어 있으므로 ‘만족도’라고 입력합니다. 그러면 유형 및 설명(L) 버튼이 나타나는데 그것을 클릭하여 설명에는 [신체만족도]를 입력하고 유형에는 숫자로 입력하였으므로 [숫자]로 설정해 줍니다.

변수목록 칸에 있는 변수 중 계산하기 위한 변수를 가운데 부분에 있는 수식을 가지고 숫자표현식(E) 안에 계산식을 적어 넣습니다. [(키 + 몸무게 + 가슴둘레 + 허리둘레 + 힙둘레) / 5]를 입력합니다. [그림 7.2]처럼 입력하시면 됩니다.

 

 

그런 후에 [확인]을 누르면 [그림 7.3]과 같이 데이터 편집기 창에 ‘만족도’라는 변수가 생성됩니다.

 

그러면 이제부터 신체조건과 만족도라는 변수를 가지고 일원분산분석을 실시하겠습니다. 절차는 다음과 같습니다.

 

분석(A)→평균비교(M)→일원배치 분산분석(O)

 

이 절차를 따르면 [그림 7.4]의 대화상자가 나타납니다.

 

 

왼쪽 변수 목록 칸에 있는 변수 중에 종속변수인 신체만족도를 종속변수(E)칸에 독립변수인 신체조건을 요인(F)칸에 옮겨놓습니다.


 

① 대비(C)

 

대비란 어떤 변수에 의해 케이스들이 여러 개의 집단으로 나누어진 경우, 그 중에서 서로 공통적인 특성이 있는 집단끼리 묶어서 두 가지로 범주화한 후 두 범주의 평균 차이에 대한 T-test를 하는 기능입니다. 만일 변수1과 변수3이 공통적이고 변수2와 변수4가 공통적이라면 이에 대한 대비 식은 다음과 같습니다.


 

대비에 관한 것을 설정해 주기 위해서는 계수(O)칸에 각 집단에 할당된 처음부터 순서대로 입력한 후 [추가]를 누릅니다. 여기서 주의할 것은 그 입력된 값들의 합이 1이 되어야 한다는 것입니다.

만일 다른 set에서도 범주간 대비를 하고자 하면 [다음(N)] 버튼을 눌러서 같은 방식으로 설정해 주면 됩니다.

 

② 사후분석(H)

 

사후분석에서는 Tukey, Duncan, Scheffe 등이 많이 쓰입니다.

Tukey법은 각 셀의 크기가 같은 경우에만 사용합니다. Tukey법은 가장 보수적인 방법입니다. 보수적이란 말은 쉽게 평균에 차이가 유의미하다고 결론 짓지 않는다는 말입니다.

Scheffe법과 Bonferroni법은 각 셀의 크기가 같거나 다르거나 상관없이 사용할 수 있습니다. Scheffe법의 경우 여러개의 대비들을 동시에 검정하는 것에 유효하게 사용할 수 있습니다.

③ 옵션(O)

 

통계량

기술통계(D)

케이스 수, 평균, 표준편차 등의 기술통계량이 출력됩니다.

분산의 동질성(H)

분산분석을 하기 위해 분산이 동일하다는 가정을 임의로 하게 됩니다. 그러나 표본이 무작위로 추출되었기 때문에 그 가정이 충족되는지 알아보아야 하므로 Levene의 통계량을 이용합니다.

도표

평균도표(M)

이 분석에 대한 도표가 출력됩니다.

결측값

분석별 결측값 제외(A)

해당 검증과 관련된 변수에 대해 결측값이 있는 케이스를 분석에서 제외시킵니다.

목록별 결측값 제외(L)

결측값이 있는 케이스는 모든 분석에서 제외시킵니다.

 

-->기술통계

신체만족도

 

 

N

평균

표준

편차

표준

오차

평균에 대한 95% 신뢰구간

최소값

최대값

하한값

상한값

아주 마른 형

1

4.2000

.

.

.

.

4.20

4.20

마른 형

29

3.3310

.6240

.1159

3.0937

3.5684

2.40

4.80

날씬한 형

18

3.1333

.9653

.2275

2.6533

3.6134

1.00

5.00

표준형

157

3.3962

.6742

.0053

3.2899

3.5025

1.00

5.00

뚱뚱한 형

89

3.8966

.6530

.0069

3.7591

4.0342

2.40

5.00

아주 뚱뚱한 형

11

4.4364

.4632

.1397

4.1252

4.7475

3.60

5.00

통통한 형

36

3.6278

.6345

.1058

3.4131

3.8425

2.20

5.00

합계

341

3.5677

.7266

.0039

3.4903

3.6451

1.00

5.0

 

위의 표에서는 각 신체조건에 따른 집단별 케이스 수, 평균, 표준편차, 표준오차, 각 집단 평균에 대한 95% 신뢰구간, 각 집단별 최소값과 최대값이 나타나있습니다.

-->분산의 동질성에 대한 검정

신체만족도

 

Levene 통계량

자유도1

자유도2

유의확률

.686

6

334

.661

 

위의 표에서는 각 모집단의 분산이 같다는 가정에 대한 검증을 한 값입니다. Levene의 통계량에서 유의확률은 .661이므로 을 기각하지 못하므로 등분산성 가정에 문제가 없다고 할 수 있습니다.

 

-->분산분석

신체만족도

 

 

제곱합

자유도

평균제곱

F

유의확률

집단-간

28.099

6

4.683

10.330

.000

집단-내

151.426

334

.453

 

 

합계

179.525

340

 

 

 

위의 분산분석 표에서는 이고, 유의확률 이므로(영가설) :를 기각합니다. 따라서 각 신체조건에 따라 신체에 대한 만족도에는 차이가 있다고 할 수 있습니다.

 

7.2 일원분산분석 - 무작위 블럭디자인

 

무작위 블록디자인에 대한 분산분석은 paired - difference test를 확장한 것으로 앞의 분석과는 달리 외생변수로 작용할 수 있는 변수를 통제하기 위해 블록설정하여 처리하는 방법입니다.

 

 

휴대폰의 색상에 대해 조사하기 위해 대리점 4군데를 선정하여 휴대폰의 색상만을 비교하기 위해 다른 외생변수(대리점의 크기, 고객 수, 그 지역의 경제적 여건 등)를 제거한 다음 휴대폰의 구매빈도를 조사하려고 한다. 휴대폰의 색상에 따라 구매빈도에는 차이가 있는지 알아보자.

 

1) 가설설정

 

<연구가설> : 휴대폰 색상에 따라 구매빈도에는 차이가 있다.

(영가설) :

(대립가설) : 적어도 어느 두 집단은 다르다.

 

2) 유의수준 설정

 

여기서는 가정과 검정통계량이 위의 일원분산분석과 동일하므로 생략하고 실행방법으로 넘어가겠습니다.

 

3) 실행방법

 

무작위 블록디자인에 의한 일원분산분석을 시작하기 위해 [예제 9-2]를 불러 다음과 같은 절차를 따라합니다.

 

분석(A)→일반선형모형(G)→일변량(U)

이 절차를 따르면 [그림 7.9]와 같은 대화상자가 나타납니다.


왼쪽 변수목록 칸에 있는 변수 중 종속변수를 종속변수(D) 칸으로, 독립변수를 모수요인(F) 칸으로 옮깁니다. 그런 다음 나머지 옵션을 설정하기 위해 자세히 알아봅시다.

 

① 모형(M)

 

완전요인모형(A)

완전요인모형에서는 주효과, 블록변수효과, 상호작용효과, 절편 등 모든 것이 모함된 상태에서 분석을 해 줍니다.

사용자정의(C)

완전요인모형에 있는 기능 중 일부만을 선택하여 분석해 주는 것입니다.

제곱합(Q)

제Ⅲ유형

제곱한 계산법을 설정하는 것으로서 결측셀이 없는 모형의 경우에 일반적으로 사용됩니다.

제Ⅳ유형

제곱한 계산법을 설정하는 것으로서 결측셀이 있는 모형의 경우에 일반적으로 사용됩니다.

여기서는 대리점을 블록변수로 설정하고 색상에 대한 주효과를 통해 구매빈도를 알아보고자 하는 것이므로 사용자정의(C)를 선택하여 두 변수를 모형(M)으로 옮긴 후 [주효과]로 설정해 줍니다. [그림 7.10]과 같이 설정되도록 하면 됩니다.

그 밖에 [대비(N), 도표(T), 저장(S)] 등은 조건은 기본설정 그대로 둡니다.

 

② 사후분석(H)

 


여기서는 색상에 따른 구매빈도에 대한 차이를 알고자 하는 것이므로 요인(F)에 있는 변수 중 색상을 사후검정변수(P)로 옮긴 후 셀의 크기가 동일하므로 Tukey 방법(T)에 클릭을 한 다음 [계속]을 누릅니다.

③ 옵션(O)

 


여기서는 단순히 기술통계량만을 설정해 준 후 [계속]을 누른 다음 [확인]을 누르면 다음과 같은 결과창이 나타납니다.

-->개체-간 요인

 

 

변수값 설명

N

대리점

1

 

3

2

 

3

3

 

3

4

 

3

색상

1

흰색

4

2

은색

4

3

검정색

4

개체간 요인 표에서는 각 케이스별 수가 나타나 있습니다.


 

-->기술통계량

종속변수: 구매빈도

 

대리점

색상

평균

표준편차

N

1

흰색

17.00

.

1

은색

34.00

.

1

검정색

23.00

.

1

합계

24.67

8.62

3

2

흰색

15.00

.

1

은색

26.00

.

1

검정색

21.00

.

1

합계

20.67

5.51

3

3

흰색

1.00

.

1

은색

23.00

.

1

검정색

8.00

.

1

합계

10.67

11.24

3

4

흰색

6.00

.

1

은색

22.00

.

1

검정색

16.00

.

1

합계

14.67

8.08

3

합계

흰색

9.75

7.54

4

은색

26.25

5.44

4

검정색

17.00

6.68

4

합계

17.67

9.25

12

기술통계량 표에서는 각 구매빈도와 평균, 표준편차가 제시되어 있습니다.


개체-간 효과 검정

종속변수: 구매빈도

 

소스

제 III 유형 제곱합

자유도

평균제곱

F

유의확률

수정 모형

895.167(a)

5

179.033

23.609

.001

절편

3745.333

1

3745.333

493.890

.000

대리점

348.000

3

116.000

15.297

.003

색상

547.167

2

273.583

36.077

.000

오차

45.500

6

7.583

 

 

합계

4686.000

12

 

 

 

수정 합계

940.667

11

 

 

 

a R 제곱 = .952 (수정된 R 제곱 = .911)

 

개체간 효과검정 표에서는 색상에 따라 구매빈도에 차이가 있는지, 대리점에 따라 구매빈도에 차이가 있는지에 대한 분석결과가 나타나 있습니다. 분석한 결과 이고, 유의확률이 이므로 (영가설) : 에서 기각될 수 있습니다. 따라서 색상에 따른 구매빈도에는 차이가 있다고 결론지을 수 있습니다. 추가적으로 대리점에 관한 분석을 살펴보면, 이고, 유의확률이이므로 (영가설) : 에서 기각될 수 있습니다. 그러므로 각 대리점에 따른 구매빈도에는 차이가 있다고 볼 수 있습니다.


 

사후검정- -->다중 비교(색상)

종속변수: 구매빈도

Tukey HSD

 

 

평균차(I-J)

표준오차

유의확률

95% 신뢰구간

(I) 색상

(J) 색상

하한값

상한값

흰색

은색

-16.50(*)

1.95

.000

-22.47

-10.53

검정색

-7.25(*)

1.95

.023

-13.22

-1.28

은색

흰색

16.50(*)

1.95

.000

10.53

22.47

검정색

9.25(*)

1.95

.008

3.28

15.22

검정색

흰색

7.25(*)

1.95

.023

1.28

13.22

은색

-9.25(*)

1.95

.008

-15.22

-3.28

관측된 평균에 기초합니다.

* .05 수준에서 평균차는 유의합니다.

사후검정표에서는 어느 두 색상간에 구매빈도에서의 차이가 있는지를 알려줍니다. 각 평균차값에 따른 유의확률이으로 모두 유의미한 값이 나왔으므로 , ,,이며, 따라서 색상 흰색, 은색, 검정색에 따라 구매빈도는 서로 다르다고 결론지을 수 있습니다.

 

7.3 이원분산분석

 

지금까지는 하나의 독립변수와 종속변수간의 관계를 검정하는 데 이용되는 일원분산분석에 대해서 설명하였습니다. 그러나 실제에서는 하나의 독립변수보다는 둘 이상의 독립변수에 따른 종속변수와의 관계에 대해 더 많은 관심을 가지는 경우가 많습니다. 이와 같이 둘 이상의 독립변수와 종속변수간의 관계에 관해 분석하는 것을 이원분산분석(Two-Way ANOVA)라고 하며, 독립변수가 3인 경우에는 삼원분산분석(Three-way ANOVA)이라고 합니다. 이원분산분석에서는 독립변수가 종속변수에 미치는 주효과와 상호작용효과를 검정할 수 있는 이점이 있습니다. 주효과(main effect)라는 것은 한 독립변수의 변화가 결과변수에 미치는 영향에 관한 것이며, 상호작용효과(interaction effect)라는 것은 다른 독립변수의 변화에 따라 한 독립변수가 결과변수에 미치는 영향에 관한 것입니다.

한 회사에서는 회사업무에 관련하여 회사업무 향상을 위해서는 각 개인별 자아만족도와 관련이 있다고 생각하여 성별과 연령에 따른 자아만족도를 측정하고자 한다.

 

1) 가설설정

 

<연구가설> :

1. 성별에 따라 자아만족도에는 차이가 있다.

2. 연령에 따라 자아만족도에는 차이가 있다.

3. 성별과 연령간에는 서로 상호작용효과가 있다.

 

1.(영가설):          (대립가설):

2.(영가설):           (대립가설):

3.(영가설): 상호작용효과가 없다. (대립가설): 상호작용효과가 있다.


2) 유의수준설정

 

3) 검정통계량

 

이원분산분석도 일원분산분석과 마찬가지로 통계량 값이 사용됩니다. 통계량의 계산을 위해 분산분석이 먼저 수행되며, 이를 위해 독립변수 로 나누어진다고 가정합시다. 이를 통한 총변량은 다음과 같이 구성됩니다.

 

총변량 = 독립변수 에 의한 변량 + 독립변수 에 의한 변량

         + 두 독립변수에 의해 설명되지 않은 변량

계산식은 다음과 같습니다.

 

총변량() =

독립변수 에 의한 변량 () =

독립변수 에 의한 변량 () =

설명되지 않은 변량 () =


 

통계량의 계산은 위의 계산을 토대로 작성된 분산분석표를 이용하여 구할 수 있습니다.

 

Source

제곱합(SS)

자유도 df

제곱평균(MS)

F

독립변수

독립변수

Error

 

Total

 

 

 

계산된 통계량 값이 통계적으로 유의한 지를 보기 위해서는 조사자는 분포표에서 값의 임계치를 찾아 계산된 값과 비교하여 계산된 값이 임계치보다 큰 경우에는 영가설을 기각할 수 있습니다. 임계치 값은 의 자유도와 유의수준 값을 통해 분포표에서 찾으면 됩니다.

 

4) 실행하기

 

이원분산분석을 시작하기 위해 [예제 9-3]를 불러 다음과 같은 절차를 따라합니다.

 

분석(A)→일반선형모형(G)→일변량(U)

 

이 절차를 따르면 [그림 7.13]와 같은 대화상자가 나타납니다.

 

 

대화상자가 나타나면 왼쪽 변수목록 창에 있는 변수 중 종속변수를 종속변수(D)칸으로 독립변수를 모수요인(F)칸으로 옮깁니다. 그런 다음 다양한 옵션들을 선택해야 하는데 이전에 배운 무작위 블록디자인에 의한 일원분산분석에서 다루었으므로 여기서는 간단히만 설명하겠습니다.

 

① 모형(M)

 

모형에서는 완전요인모형과 사용자정의가 있는데 이전 장에서 배운 기억이 나시죠? 완전요인모형(A)에서는 분석결과에 두 독립변수의 주효과, 상호작용효과, 절편 등이 포함되는 것이고, 사용자정의(C)에서는 각 독립변수마다 원하는 효과를 사용자가 스스로 설정하는 것입니다.

여기서는 완전요인모형을 설정해도 되고, 사용자정의를 설정하려면 두 독립변인간에 상호작용으로 설정해 주면 됩니다.

② 사후분석(H)

 

사후분석에서는 연령에 대한 다중비교를 할 수 있으므로 연령에 대해서만 사후검증을 하도록 합니다. Tukey와 Scheffe를 설정하여 분석해 봅시다.

 

옵션(O)에서는 기술통계량만을 선택한 후 [계속]을 누른 다음 [확인]을 누르면 다음과 같은 결과창이 나타납니다.

 

-->개체-간 요인

 

 

변수값 설명

N

연령

1

20대

6

2

30대

6

3

40대 이상

6

성별

 

9

 

9

개체간 요인표에서는 연령 및 성별 별로 케이스 수가 나타나 있습니다.


-->기술통계량

종속변수: 자아만족

 

연령

성별

평균

표준편차

N

20대

4.100

.200

3

2.800

.265

3

합계

3.450

.742

6

30대

3.067

.252

3

2.133

.208

3

합계

2.600

.551

6

40대 이상

3.433

.208

3

2.500

.200

3

합계

2.967

.543

6

합계

3.533

.492

9

2.478

.349

9

합계

3.006

.683

18

연령과 성별에 따른 각 셀들의 평균과 표준편타가 나타나 있습니다.

 

-->개체-간 효과 검정

종속변수: 자아만족

 

소스

제 III 유형 제곱합

자유도

평균제곱

F

유의확률

수정 모형

7.329(a)

5

1.466

29.318

.000

절편

162.601

1

162.601

3252.011

.000

연령

2.181

2

1.091

21.811

.000

성별

5.014

1

5.014

100.278

.000

연령 * 성별

.134

2

6.722E-02

1.344

.297

오차

.600

12

5.000E-02

 

 

합계

170.530

18

 

 

 

수정 합계

7.929

17

 

 

 

a R 제곱 = .924 (수정된 R 제곱 = .893)

 

개체간 효과검정에서는 성별과 연령에 따른 자아만족도에 관한 주효과와 상호작용효과의 결과가 나타나 있습니다.

1. 연령에 대한 주효과를 보면 =21.811, 유의확률은 .000으로 (영가설): 는 유의수준 0.01에서 기각될 수 있습니다. 따라서 연령에 따른 자아만족도에는 차이가 있다고 결론지을 수 있습니다.

2. 성별에 대한 주효과를 보면 =100.278, 유의확률은 .000으로 (영가설): 를 유의수준 0.01에서 기각될 수 있습니다. 따라서 성별에 따른 자아만족도에는 차이가 있다고 결론지을 수 있습니다.

3. 상호작용효과를 보면 =1.344, 유의확률은 .297으로 (영가설): 상호작용효과가 없다는 기각될 수 없으므로 성별과 연령은 상호작용효과가 없는 것으로 결론지을 수 있습니다.

 

사후검정

연령

-->다중 비교

종속변수: 자아만족

 

 

평균차

(I-J)

표준

오차

유의

확률

95% 신뢰구간

 

(I) 연령

(J) 연령

하한값

상한값

Tukey HSD

20대

30대

.850(*)

.132

.000

.504

1.196

40대 이상

.483(*)

.132

.007

.137

.829

30대

20대

-.850(*)

.132

.000

-1.196

-.504

40대 이상

-.367(*)

.132

.037

-.713

-.020

40대 이상

20대

-.483(*)

.132

.007

-.829

-.137

30대

.367(*)

.132

.037

.020

.713

Scheffe

20대

30대

.850(*)

.132

.000

.488

1.212

40대 이상

.483(*)

.132

.009

.122

.845

30대

20대

-.850(*)

.132

.000

-1.212

-.488

40대 이상

-.367(*)

.132

.047

-.728

-.005

40대 이상

20대

-.483(*)

.132

.009

-.845

-.122

30대

.367(*)

.132

.047

.005

.728

관측된 평균에 기초합니다.

* .05 수준에서 평균차는 유의합니다.

 

사후검정 표에서는 연령에 관한 세 집단의 사후검증결과를 보여줍니다. 10대, 20대, 30대 모두는 비교해 본 결과 그 차이가 유의하게 나타났습니다. 유의확률 값을 살펴보면 Tukey의 값이 Scheffe값보다 작은 것을 알 수 있습니다. 이 결과는 Tukey가 Scheffe보다 보수적이라는 것을 알게 해주며, 셀의 크기가 같은 경우에는 Tukey 방법을 쓰는 것이 더 정밀하게 나온다는 것을 알 수 있습니다.

 

동일집단군

자아만족 -->

 

N

집단군

 

연령

1

2

3

Tukey HSD(a,b)

30대

6

2.600

 

 

40대 이상

6

 

2.967

 

20대

6

 

 

3.450

유의확률

 

1.000

1.000

1.000

Scheffe(a,b)

30대

6

2.600

 

 

40대 이상

6

 

2.967

 

20대

6

 

 

3.450

유의확률

 

1.000

1.000

1.000

 

동일집단군 표를 보면 연령에 따른 자아만족도에 관한 Tukey와 Scheffe의 집단결과치가 나타납니다. 집단 1, 2, 3에서 값들을 보면 다들 집단이 다르다는 것을 알 수 있습니다. 만일 집단 2와 3이 동일한 위치에 값이 나타나 있다면 집단2와 3은 동일한 집단군이라고 생각하시면 됩니다. 여기서는 동일한 위치에 있는 값이 없으므로 집단간에는 서로 동일하지 않다고 분석하시면 됩니다.

-->