본문바로가기(Skip to contents)

기초통계지식

본자료의 저작권은 새롬에게 있습니다. 무단으로 복제하여 상업적으로 사용시 법적인 처벌을 받을수 있습니다.

통계적 방법이란

사회과학을 연구하는데 있어서 이론 또는모형을 설정하고 이것을 과학적으로 검정하기 위해 경험적자료를 가지고 채택 또는기각을 결정 하여야하는데 통계적 방법은 바로 이 부분에서 쓰이고있다 여기에서 통계적방법은 크게 세가지 측면에서 도움을 주고 있는데 그 기본적인 원칙은 다음과같다.

첫째, 가급적적은 수의 변수로 보다 많은 현상을 설명 하고자 하는 간결성의 원칙,

둘째 하나의 현상에 영향을 미치는 개별적인 변수의 중요성 파악

셋째 표본으로 수집된 자료라하더라도 일반화와 추상화 과정을 거치면서 전체적인 수준의 이론으로 발전시켜 나가는 자료 축소 기제를 제공한다는것이다. 실증연구에서 주로 사용되는기초적인 통계 분석기법은 다음과같다.

신뢰도검증(Cronbach's α)

신뢰성이란비교가능한독립된측정방법에의해대상을측정하는경우결과가비슷하게나타나야한다는것을의미한다. 즉하나의변수를측정하기위해 3개의문항으로질문하였을때그세문항의결과가비슷해야한다는것이다. 신뢰도를검증하기위해서는척도가등간척도나비율척도, 이항척도이어야한다. 일반적으로신뢰도검증을하기위한문항으로는등간척도를주로쓰고있다.

척도의 종류

척도 정의 사례
명목척도 특성을 분류하거나 확인할 목적으로 숫자를 부여하여 측정하는 방법 당신의 성별은 무엇입니까?  ①여 ②남
서열척도 속성간의 순서관계를 밝혀주는 측정방법 귀하의 세제구입시 가장 중요하게 여기는 것의 순서를 기입해 주십시오
①가격( ) ②세척력( ) ③향기 ( ) ④비공해성(인체무해, 환경오염 무해) ( )
등간척도 속성에 대한 순위를 부여하되 순위 사이의 간격이 동일한 측정방법 평소에 환경문제를 심각하다고 느끼십니까?
①전혀 그렇지않다②별로 그렇지않다③그저 그렇다④대체로 그렇다⑤매우 그렇다
비율척도 측정값 사이의 비율계산이 가능한 척도. >귀하의 나이는 몇 세입니까? (  )세

빈도분석(FREQUENCY, DESCRIPTIVES)

빈도분석이란 변수값들이 이루는 분포의 특성을 알아보는데 이용된다. 분포의 특성은 평균값, 중앙값, 최빈값으로 나타내어지며, 빈도수, 비율, 표준편차, 분산등으로 표본의 분포를 알 수 있다.

<표 1> 조사대상자의 일반적 특성
변인 범주 빈도 백분율(%)
성별 118 57.3
88 42.7
연력 20대 80 38.8
30대 70 34.0
40대 12 5.8
50대 44 21.4

분산분석(T-TEST, ANOVA)

분산분석이란 2집단이상(독립변수)의 종속변수에 대한 평균값의 차이를 검증하는 데 이용되는 방법으로 2집단의 차이를 보고자 할 때는 T-TEST를 이용하여 t값으로 나타내고, 3집단(독립변수)이상의 차이를 보고자 할 때는 ANOVA를 이용한 F검증을 하게 된다.

<표 2> 분산분석의 사례
분석기법 사례
T-TEST 남녀(독립변수)간의 직무만족도(종속변수:등간척도 이상)의 차이, 남녀간의 백화점세일기간 중 구매 의욕의 차이 등
ANOVA 도시 규모(대,중,소)에 따른 임금수준의 차이, 도시규모에 따른 직무만족의 차이
<표 3> 사회인구학적 배경에 따른 직무만족도의 차이
변인범주 평균 표준편차 t값 또는 f값
성별 3.99 .56 6.35**
2.98 .76
도시규모 대도시 2.15 .53 5.25*
중도시 4.01 .88
소도시 3.21 .79

교차분석(CROSSTABS)

명목자료를 이용하여 두 변수간의 상호관련성을 알아 보고자 할 때 이용되는 기법으로 통계량으로는 χ2로 나타난다.
사례 : 도시크기(대,중,소)와 도시특성(상업도시,공업도시)간의 관련성 검증.
<표 4> 도시크기와 특성간의 관계
크기/특성 공업도시 상업도시 합계
대도시 5 5 10
중도시 7 3 10
소도시 3 7 10
합계 15 15 30
 χ2= 3.20      Sig.=.20

상관관계분석(CORRELATION)

상관관계란 변수들간의 관련성을 분석하기 위한 방법으로 하나의 변수가 다른 변수와 어느 정도 밀접한 관련성을 갖고 변화하는가를 알아보기 위해 이용된다. 이 기법을 이용하기 위해서는 두 변수가 등간척도와 비율척도로 측정되어야 한다.
사례 :도시인구와 대기오염도간의 상관관계, 나이와 몸무게와의 상관관계 등
<표 5> 도시크기와 대기오염간의 상관관계 * p<.05 ***p<.001
구분 대기오염도
도시인구 .5986***
도용인구 .1012
소득 .4225*

회귀분석(REGRESSION)

회귀분석이란 변수들간의 상호관계를 분석하고 특정변수(독립변수)의 변화로부터 다른 변수(종속변수)의 변화를 예측하기 위하여 사용된다. 종속변수에 영향을 미치는 변수를 규명하고 이들 변수들에 의해서 하나의 선형방정식을 도출하는데 이 회귀식이 종속변수를 어느 정도 예측해 줄 수 있으며 회귀식에 포함된 독립변수들 중에서 어느 변수가 가장 예측력이 높은지도 검증하게 된다. 다시 말해서, 회귀분석은 변수들간의 상호관련성을 분석하는 데 있어서 독립변수와 종속변수의 관련성의 강도와 독립변수의 값의 변화에 따른 종속변수의 값의 변화의 예측에 초점을 두게 된다.
사례 :직무만족에 영향을 미치는 요인 분석 - 종속변수(직무만족), 독립변수(직무자체, 급여, 승진, 복지시설 )
<표 6> 직무만족도에 미치는 영향
구분 회귀계수 T T의 유의도 R2
직무자체 .1018 .6512 2325 .63***
급여 .2390 6.029 .0000
승진 .3101 6.211 .0000
복수시설 ..1283 .3011 .1241
상수 6.3201 2.895 .0076
p<.001 회귀식: 직무만족도= 상수 + β1·직무자체 + β2·급여 + β3·승진 + β4·복지시설·β1:.0 β2:.2390 β3:.3101 β4:0
실전 논문통계 예제
...중략

조사연구

자료수집의 방법

① 면접법
전문가의 의견을 수집하거나 경험자의 경험담이 필요한 경우, 또는 심리학적으로 보다 상세한 자료가 요구되는 경우에 사용된다. 이 방법은 시간과 비용이 많이 들고 면접 전문가를 구하는 것이 어려운 점이 단점이다.

② 관찰법
연구자가 상황을 통제하거나 또는 자연스러운 상태에서 발생하는 상황들을 직접 관찰하고 그 변화의 정도를 기록하는 방식

③ 설문지법
사회과학 연구에서 가장 많이 사용되는 방법으로서 시간과 경비가 절감되는 장점이 있는 반면 설문개발의 기술적인 부분과 상당수준의 전문지식이 필요하다는 어려움이 있다.
설문지 작성시 유의할 점 몇 가지를 살펴보면 설문문항은 20∼30개 정도로 하고 구체적인 낱말사용과 응답방식이 연구목적과 사용할 분석방법과 조화를 이루어야 한다는 점, 그리고 대조적인 설문문항은 거리를 두어서 배치할 것과 기존 연구에서 사용한 설문을 응용하여 작성해도 좋다. 마지막으로 설문의 내용이 응답자와 조화를 이루어야 한다.

변수(변인, variable)

(1) 변수의 개념
연구의 대상이 되고 있는 일련의 개체(분석되는 단위)가 어떤 속성에 있어서 서로 구별될 수 있을 때 이러한 속성들을 변수라고 한다. 예를 들어 개인의 경우 성별, 연령, 학력, 종교, 생활수준 등과 같은 조건들이 개인을 구별해 주는 속성이 되는 것이다.

가설설정과 검정

(1) 가설의 의미
가설이란 실증적인 증명에 앞서 세우는 잠정적인 진술이며 나중에 논리적으로 검정될 수 있는 명제로 연구결과에 따라 기각이나 수정될 수 있다.
① 귀무가설(영가설) 통계량의 차이는 단지 우연의 법칙에서 나온 표본추출오차로 생긴 정도로 통계치가 제공하는 확률의 측면에서 평가하는 것, 즉 두 변수간의 관계가 없다 또는 차이가 없다는 부정적 형태로 진술하는 가설 (예, Ho : A 정당을 지지하는 유권자의 평균나이는 35세이다. 또는 Ho : μ = 35)
② 연구가설 통계량의 차이는 표본이 대표하는 모집단의 모수와 유의한 차이가 있다는 진술로 변수간의 관계나 차이를 긍정적인 형태로 진술하는 가설이다. 논리적 대안으로서 검정하고자 하는 현상에 관한 예측이며 대립가설, 대체가설 이라고도 한다. (예, H₁: μ ≠ 35)

(2) 가설검정 절차
가설검정이란 가설을 채택 또는 기각하는 절차를 말한다. 가설검정 절차는 다섯가지로 나눌 수 있다.
① 귀무가설(영가설)과 연구가설의 설정
일반적으로 현재까지 주장되어 온 것을 귀무가설로 정하고, 기존 상태로부터 새로운 변화 또는 효과가 존재한다는 주장을 연구가설로 정한다. 여기서 가설의 채택 또는 기각 대상은 귀무가설이다.
② 유의도 수준(sig, signigicant level)과 임계치의 결정 유의도 수준은α 또는 P(probability : 확률)로 표시한다. 유의수준 α와 가설을 채택하거나 기각시키는 판단기준인 임계치를 정한다. 유의도 수준은 보통 α=0.10 또는 p<0.10, α=0.05 또는 p<0.05, α=0.01 또는 p<0.01, α=0.001 또는 p<0.001로 나타낸다. 예를 들어 α=0.05 수준에서 p<0.05로 표기할 수 있는데 이것은 계산된 확률수준이 0.05보다 작으면 귀무가설(영가설)을 기각시킨다는 의미이다. 이때 통계적으로 유의하다라고 해석하고 만일 P<0.01이면 매우 유의하다라고 한다.
※ * P<.05
** P<.01
*** P<.001
따라서 p<.05 수준이면 통계적으로 유의적인 차이를 보인다는 의미이고, p>.05 수준이면 통계적으로 유의적인 차이를 보이지 않았다고 말한다.
③ 귀무가설의 채택영역과 기각영역 설정
④ 통계량의 계산
⑤ 통계량과 임계치의 비교 및 결론
맨위로