8.2 다변량분산분석(MANOVA)


7장에서 보면 두 집단 이상의 평균을 비교하기 위해서는 ANOVA를 이용한다고 배웠습니다. ANOVA는 종속변수가 1개인 반면에 MANOVA는 종속변수가 2개인 경우세 집단평균들의 차이를 비교하는데 사용합니다. 독립변수는 명목척도이고 종속변수는 간격척도 이상으로 구성되어야 합니다.

 

<ANOVA와 MANOVA의 차이점>

① MANOVA는 종속변수의 조합에 대한 효과의 동시검정을 중요시합니다. 즉 대부분의 종속변수들은 서로 상관관계가 있기 때문입니다. 따라서 MANOVA는 ANOVA와는 달리 집단간의 결합된 차이를 밝혀낼 수 있어 집단간의 차이를 밝히는데 사용가능한 정보를 보다 많이 사용할 수 있습니다.

② MANOVA 설계의 특징은 종속변수가 벡터변수라는 점입니다.

③ ANOVA로 여러 개의 종속변수를 평가하려면, 여러번의 분석을 해야 하지만, MANOVA는 단 한번의 분석만을 하게 됩니다. 따라서 ANOVA로 분석하게 되면, 1종 오차의 확률이 커집니다.


<가정>

① 관측치가 서로 독립적이다.

② 각 집단의 분산과 공분산 행렬이 동일하다.

③ 모든 종속변수들은 다변량 정규분포를 따른다.

 

<분석절차>

① 먼저 종속변수 사이에서 상관관계가 있는지의 여부를 조사합니다. 상관관계가 없으면 ANOVA를 실시하고, 상관관계가 있으면, MANOVA를 실시합니다.

② 변수들의 기본가정인 다변량 정규분포성과 등분산성 등을 조사합니다. 

③ 모든 요인 수준의 평균 벡터들이 동일한지를 검정합니다.

④ 만일 모든 평균 벡터들이 같다는 영가설이 채택되면, 검정은 더 이상 진행되지 않고 거기서 끝이 납니다.

⑤ 만일 대립가설이 채택되면, 변수들을 개별적으로 조사하여 어떤 변수가 얼마나 다른가, 그리고 그 차이가 의미하는 것은 무엇인가를 규명해야 합니다.

 

학년에 따라 학습효과가 다른지를 조사하기 위해, 학년에 따라 수업태도, 학습태도, 학습만족도를 조사하기로 하였다.

 

1) 종속변수간의 상관관계 측정

 

(1) 가설설정

 

<연구문제> : 세 가지 학습효과(수업태도, 학습태도, 학습만족도)는 서로 차이가 있다.

(영가설) : 세 가지 학습효과는 차이가 없다.

(대립가설) : 세 가지 학습효과는 차이가 있다.

 

(2) 유의수준설정

(3) 실행방법


종속변수들 간의 상관관계를 알아보기 위해
[예제 10-2]를 불러 다음과 같은 절차를 따라합니다.

 

분석(A)→상관분석(C)→이변량 상관계수(B)

변수목록 칸에 있는 변수들 중 종속변수들을 변수(V)로 옮겨준 후 등간척도 이상이므로 Pearson의 상관계수를 설정해 준 후 [확인]을 누르면 다음과 같은 결과 창이 나타납니다.

-->상관계수

 

 

수업태도

학습태도

학습만족

수업태도

Pearson 상관계수

1.000

.753(**)

.665(**)

유의확률 (양쪽)

.

.000

.003

N

18

18

18

학습태도

Pearson 상관계수

.753(**)

1.000

.682(**)

유의확률 (양쪽)

.000

.

.002

N

18

18

18

학습만족

Pearson 상관계수

.665(**)

.682(**)

1.000

유의확률 (양쪽)

.003

.002

.

N

18

18

18

** 상관계수는 0.01 수준(양쪽)에서 유의합니다.

 

상관계수 표에서는 세 개의 종속변수들 간의 상관관계 정도를 나타내 줍니다. 이 표를 살펴보면, 세 개의 종속변수들은 모두 양의 상관관계가 있다는 것을 알 수 있습니다. 따라서 MANOVA에 의한 분석을 해야한다는 것을 알 수 있습니다.

 

2) 다변량 분산분석(MANOVA) 실행

 

다변량 분산분석을 실행하기 위해 다음과 같은 절차를 따릅니다.

 

분석(A)→일반선형모형(G)→다변량(U)

이 절차를 따르면 [그림 8.4]와 같은 대화상자가 나타납니다.

 

①, ② 왼쪽 변수목록 칸에 있는 변수들 중 종속변수를 종속변수(D)칸으로, 독립변수를 모수요인(F)칸으로 옮깁니다.


③ 모형(M)

기본으로 설정되어 있는 완정모형요인과 제 Ⅲ 유형으로 설정해 줍니다. 모형에 대한 내용은 분산분석에서 참고하세요.

 

④ 대비(N), 도표(T)

이 것은 기본설정 상태를 유지해 줍니다.

 

⑤ 사후분석(H)

[요인(F)]에 있는 변수를 클릭하여 오른쪽에 있는 [사후검정변수(P)]로 옮겨준 후 셀의 크기가 같으므로 Tukey 방법(T)를 선택해 줍니다.

 

⑥ 옵션(O)

옵션에서는 결과 창에 제시할 출력결과를 설정해 줍니다. 여기서는 기술통계량과 동질성검정만을 설정해 준 후 [계속]을 누릅니다.


 

이 과정이 끝난 후 [확인]을 누르면 다음과 같은 결과 창이 나타납니다.

-->개체-간 요인

 

 

N

학년

1

6

2

6

3

6

개체간 요인 표에서는 각 학년별로 사례수가 나타나 있습니다.


 

-->기술통계량

 

 

학년

평균

표준편차

N

수업태도

1

4.33

.82

6

2

1.67

.52

6

3

3.00

1.41

6

합계

3.00

1.46

18

학습태도

1

3.33

1.03

6

2

1.83

.75

6

3

3.00

1.10

6

합계

2.72

1.13

18

학습만족

1

2.67

.52

6

2

2.00

.63

6

3

2.50

.55

6

합계

2.39

.61

18

 

기술통계량 표에서는 독립변수에 따른 종속변수의 평균과 표준편차, 사례수가 제시되어 있습니다.

 

-->공분산행렬에 대한 Box의 동일성 검정(a)

 

Box의 M

16.478

F

.961

자유도1

12

자유도2

1090.385

유의확률

.484

여러 집단에서 종속변수의 관측 공분산행렬이 동일한 영가설을 검정합니다.

a 계획: Intercept+학년

동일성 검정 표에서는 세 집단의 공분산 행렬이 동일하다는 가정에 대한 검증결과가 제시되어 있습니다. 유의확률이 .484이므로 영가설(공분산행렬이 동일하다)을 기각하지 못하므로 공분산행렬의 동일성 가정에 문제가 없다고 결론지을 수 있습니다.


 

-->다변량 검정(c)

 

효과

F

가설 자유도

오차 자유도

유의확률

Intercept

Pillai의 트레이스

.957

95.908(a)

3.000

13.000

.000

Wilks의 람다

.043

95.908(a)

3.000

13.000

.000

Hotelling의 트레이스

22.133

95.908(a)

3.000

13.000

.000

Roy의 최대근

22.133

95.908(a)

3.000

13.000

.000

학년

Pillai의 트레이스

.679

2.396

6.000

28.000

.054

Wilks의 람다

.370

2.793(a)

6.000

26.000

.031

Hotelling의 트레이스

1.574

3.147

6.000

24.000

.020

Roy의 최대근

1.486

6.933(b)

3.000

14.000

.004

a 정확한 통계량

b 해당 유의수준에서 하한값을 발생하는 통계량은 F에서 상한값입니다.

c 계획: Intercept+학년

 

다변량 검증 표에서는 학년에 따른 다변량 검증 결과가 제시되어 있습니다. 유의확률을 보았을 때 Pillai의 람다에서만 유의하지 않을 뿐 다른 부분에서는 모두 기각할 수 있으므로 전반적으로 영가설(세 가지 학습효과는 차이가 없다)를 기각할 수 있습니다. 따라서 세 가지 학습효과는 차이가 있다고 결론지을 수 있습니다.

 

-->오차 분산의 동일성에 대한 Levene의 검정(a)

 

 

F

자유도1

자유도2

유의확률

수업태도

1.462

2

15

.263

학습태도

.185

2

15

.833

학습만족

.437

2

15

.654

여러 집단에서 종속변수의 오차 분산이 동일한 영가설을 검정합니다.

a 계획: Intercept+학년

오차분산의 동일성에 대한 Leveve의 검정 표에서는 종속변수들의 분산의 동질성 가정에 대한 검증결과가 나타나 있습니다. 각 종속변인의 유의확률이 모두 0.05이상으로 영가설을 기각하지 못하므로 집단의 등분산 가정에는 문제가 없다고 결론지을 수 있습니다.
 

-->개체-간 효과 검정

 

소스

종속변수

제 III 유형 제곱합

자유도

평균제곱

F

유의확률

수정 모형

수업태도

21.333(a)

2

10.667

10.909

.001

학습태도

7.444(b)

2

3.722

3.941

.042

학습만족

1.444(c)

2

.722

2.241

.141

Intercept

수업태도

162.000

1

162.000

165.682

.000

학습태도

133.389

1

133.389

141.235

.000

학습만족

102.722

1

102.722

318.793

.000

학년

수업태도

21.333

2

10.667

10.909

.001

학습태도

7.444

2

3.722

3.941

.042

학습만족

1.444

2

.722

2.241

.141

오차

수업태도

14.667

15

.978

 

 

학습태도

14.167

15

.944

 

 

학습만족

4.833

15

.322

 

 

합계

수업태도

198.000

18

 

 

 

학습태도

155.000

18

 

 

 

학습만족

109.000

18

 

 

 

수정 합계

수업태도

36.000

17

 

 

 

학습태도

21.611

17

 

 

 

학습만족

6.278

17

 

 

 

a R 제곱 = .593 (수정된 R 제곱 = .538)

b R 제곱 = .344 (수정된 R 제곱 = .257)

c R 제곱 = .230 (수정된 R 제곱 = .127)

 

개체-간 효과 검증 표에서는 학습효과에 대해 분석한 결과가 제시되어 있습니다. 이 표를 통해 다음과 같은 연구문제를 제기할 수 있습니다.

 

<연구문제>

1. 수업태도는 학년에 따라 동일하지 않다.

2. 학습태도는 학년에 따라 동일하지 않다.

3. 학습만족도는 학년에 따라 동일하지 않다.

 

위의 표에서 나온 결과에서 학년에 따른 수업태도의 유의확률은 .001으로 유의미한 값이 나왔으므로 영가설(수업태도는 학년에 따라 모두 동일하다. )을 기각하므로, 수업태도는 학년에 따라 동일하지 않다고 결론지을 수 있습니다.

학년에 따른 학습태도의 유의확률은 .042로 유의미한 값이 나왔으므로 영가설(학습태도는 학년에 따라 모두 동일하다)을 기각하므로, 학습태도는 학년에 따라 동일하지 않다고 결론지을 수 있습니다.

학년에 따른 학습만족도의 유의확률은 .141으로 유의미한 값이 아니므로 영가설(학습만족도는 학년에 따라 모두 동일하다)를 기각하지 못하므로, 학습만족도는 학년에 따라 모두 동일하다고 결론지을 수 있습니다.

 

마지막으로, 각각의 학습효과(수업태도, 학습태도, 학습만족도)의 값은 구체적으로 어느 집단과 차이가 있는지 알아보기 위해서는 사후검증 결과를 살펴보아야 합니다.

 

사후검정 / 학년/ -->다중 비교/ Tukey    HSD

 

 

평균차

(I-J)

표준

오차

유의

확률

95% 신뢰구간

종속변수

(I) 학년

(J) 학년

하한값

상한값

수업태도

1

2

2.67(*)

.57

.001

1.18

4.15

3

1.33

.57

.081

-.15

2.82

2

1

-2.67(*)

.57

.001

-4.15

-1.18

3

-1.33

.57

.081

-2.82

.15

3

1

-1.33

.57

.081

-2.82

.15

2

1.33

.57

.081

-.15

2.82

학습태도

1

2

1.50(*)

.56

.043

4.26E-02

2.96

3

.33

.56

.825

-1.12

1.79

2

1

-1.50(*)

.56

.043

-2.96

-4.26E-02

3

-1.17

.56

.128

-2.62

.29

3

1

-.33

.56

.825

-1.79

1.12

2

1.17

.56

.128

-.29

2.62

학습만족

1

2

.67

.33

.138

-.18

1.52

3

.17

.33

.868

-.68

1.02

2

1

-.67

.33

.138

-1.52

.18

3

-.50

.33

.307

-1.35

.35

3

1

-.17

.33

.868

-1.02

.68

2

.50

.33

.307

-.35

1.35

관측된 평균에 기초합니다.

* .05 수준에서 평균차는 유의합니다.

사후검정 표에서는 각 종속변수별로 어느 집단들 간에 차이가 있는지를 사후검증한 결과가 제시되어 있습니다.

수업태도는 학년1과 학년2 간에 유의미한 차이가 있는 것으로 나타나 있고, 학습태도도 학년1과 학년2 간에 유의미한 차이가 있는 것으로 나타나 있습니다.

학습만족도는 학년별로 유의미한 차이가 없는 것으로 나타나 있습니다.


 

동일집단군

동일집단군 분석에서는 각 종속변수값에 있어서 어느 두 집단간에 유의적인 차이가 없으면 동일집단군으로 분류됩니다.

-->수업태도

Tukey HSD

 

 

N

집단군

학년

 

1

2

2

6

1.67

 

3

6

3.00

3.00

1

6

 

4.33

유의확률

 

.081

.081

동일집단군의 그룹에 대한 평균이 표시됩니다.

유형 III 제곱합에 기초합니다

오차항은 평균제곱(오차) = .978입니다.

a 조화평균 표본 크기 6.000을(를) 사용합니다.

b 유의수준 = .05.

수업태도 표에서 유의확률을 보면 둘 다 유의미한 값이 아님을 알 수 있습니다. 따라서 집단 1과 2는 동일한 집단임을 알 수 있습니다.


 

-->학습태도

Tukey HSD

 

 

N

집단군

학년

 

1

2

2

6

1.83

 

3

6

3.00

3.00

1

6

 

3.33

유의확률

 

.128

.825

동일집단군의 그룹에 대한 평균이 표시됩니다.

유형 III 제곱합에 기초합니다

오차항은 평균제곱(오차) = .944입니다.

a 조화평균 표본 크기 6.000을(를) 사용합니다.

b 유의수준 = .05.

 

학습태도 표에서 유의확률을 보면 둘 다 유의미한 값이 아니므로 집단1과 집단2는 동일한 집단임을 알 수 있습니다.


 

-->학습만족

Tukey HSD

 

 

N

집단군

학년

1

2

6

2.00

3

6

2.50

1

6

2.67

유의확률

 

.138

동일집단군의 그룹에 대한 평균이 표시됩니다.

유형 III 제곱합에 기초합니다

오차항은 평균제곱(오차) = .322입니다.

a 조화평균 표본 크기 6.000을(를) 사용합니다.

b 유의수준 = .05.

-->학습만족 표에서 유의확률을 보면 학년1와 다른 학년간에 유의미한 값이 아니므로 세 집단이 모두 동일집단임을 알 수 있습니다. 그러나 세 가지 학습효과는 종합적으로 판단할 때  모두 동일하지는 않다고 할 수 있습니다.