2. 데이터 편집과 변수정의 및 변경

2.1 데이터 입력 및 파일열기

 

1) 데이터 입력

 

데이터를 입력하는 방법으로는 셀에다 직접 입력하는 것과 아래한글 등의 워드프로세서에서 입력한 데이터를 불러오는 방법이 있습니다.

  아래의 설문지를 가지고 아래한글이나 MS워드에 코딩하는 방법은 첫째로 설문지를 가지고 안내책자를 만듭니다.

성별에서 남자는 1이고 여자는 2이므로 한칸이 필요하고, 연령도 4개의 보기 중에 하나만 고르면 되므로 한칸이 필요합니다.

이에 대한 안내책자를 만들어 코딩을 합니다.

코딩을 하게 되면 [그림 2.1]과 같은 결과가 나옵니다.



위의 설문지를 가지고 안내책자를 만듭니다. 성별에서 남자는 1이고 여자는 2이므로 한칸이 필요하고,

연령도 4개의 보기 중에 하나만 고르면 되므로 한칸이 필요합니다. 이에 대한 안내책자를 만들어 코딩을 합니다.

코딩을 하게 되면 [그림 2.1]과 같은 결과가 나옵니다. 코딩입력을 다 한 후 아스키(텍스트)문서로 저장을 해야 합니다.

파일메뉴에서 저장하기 밑에 있는 다른이름으로 저장하기를 선택하여 [그림 2.2]와 같이 아스키문서로 변환해야 합니다.

 

 

2) 데이터 파일 열기

SPSS 데이터 편집기 상에서 새로운 데이터 파일을 만들거나 기존의 파일을 불러올 수 있습니다. [그림 2.3] 화면은 다음의 절차를 따르면 됩니다.

 

파일(F)→열기(O)→데이터(A)

 

3) 아스키문서로 저장된 파일 열기(불러오기)

 

앞장에서 설명한 아스키문서로 작성된 데이터를 열 때 사용합니다. 대부분 SPSS 편집창에서 데이터를 입력하는 것보다 아스키문서로 입력하는 것이 편리하기 때문에 이런 방식으로 파일을 여는 방법을 알아야 합니다.

 

파일(F)→텍스트 데이터 읽기(R)

 

이 절차를 따르면 다음 [그림 2.4]와 같은 화면이 나타납니다. 파일에 있는 [예제 01]를 가지고 다음을 따라해 보세요.

 

우선 파일 형식을 텍스트(*.txt)로 설정해 준 후 원하는 아스키문서를 입력한 후 열기(O)를 누릅니다.

 


텍스트 파일이 사전 정의된 형식과 일치여부에서 사전에 정의한 적이 없으면   [? 아니오]에 클릭하고 다음을 누릅니다.


 

변수 배열에 대해 묻는 질문에서는 코딩을 할 때에 특수문자로 구분을 지어주었다면

[? 구분자에 의한 배열]에 클릭하고 구분을 지어주지 않았다면 [? 고정 너비로 배열]에 클릭을 합니다.

앞에서 코딩한 것은 구분을 지어주지 않은 것이므로 고정 너비로 배열에 클릭을 합니다.

변수 이름이 처음에 입력되어 있다면 [? 예]에 클릭하고 여기에서처럼 처음 설정하는 경우에는 [? 아니오]에 클릭을 합니다.

첫 번째 케이스의 시작은 1로 설정하고 몇 개의 줄이 한 케이스를 나타내는지에 대해서도 1로 설정합니다. 이와 같은 설정은 기본설정으로 되어 있으니 필요할 경우에만 설정을 바꾸면 됩니다.  만약 한 설문에 대해 두 줄로 코딩을 한 경우에는 2로 설정합니다.주의할것은 것은 아스키문서에서 코딩할 경우 한 설문에 대한 코딩은 한 줄로 해야 처리하기가 편리하다는 점입니다. 그러므로 아스키문서에서 용지설정이나 폰트설정을 통해 가급적 한 줄로 코딩을 하면 됩니다.

 

 

이 단계에서는 변수구분선을 설정해주어야 합니다. 각 변수마다 그 값 사이에 클릭을 해주면 구분선이 나타나고 구분선을 삭제하려면 변수구분선의 화살표를 클릭하거나 선 자체를 클릭한 채로 상자밖으로 끌어당기면 됩니다. 구분선 위치를 바꿀 경우에는 구분선을 클릭한 채로 원하는 위치로 끌어당기면 됩니다.


이 단계에서는 구분된 변수들의 변수이름을 설정해 줄 수 있습니다. 이 단계에서 설정해 주지 않더라도 데이터 편집기의 변수보기에서 설정해 줄 수 있으므로 여기서는 아이디만 설정해 주고 다음을 누릅니다.

 


 

파일 형식 저장 여부와 명령문 붙여넣기 여부를 설정한 후 마침을 누르면 최종적으로 데이터 파일이 열리게 됩니다.


2.2 변수정의하기


 

SPSS 10.0 데이터를 편집기로 불러들인 다음에는 데이터들에 대한 각각의 변수에 대한 정의를 해주어야 합니다. 변수를 정의하면 변수에 대해 쉽게 알아볼 수 있으며, 변수값 설정을 할 때 설명을 붙이기가 수월해 집니다. 변수정의를 해주기 위해서는 SPSS 데이터 편집기 창의 아래쪽에 있는 [변수보기] 창에서 해야 합니다.

변수정의 연습을 하기 위해 [예제 02] 파일을 열어 다음을 따라해 보세요.

1) 변수 이름 정의하기


변수 이름을 정의하려면 우선 이름칸에 자신이 원하는 이름을 넣으면 됩니다. [그림 2.10]에서와 같이 이름을 넣으시면 됩니다. 단, 변수명은 한글의 경우 4자까지, 영문의 경우는 8자까지만 가능합니다. 그러므로 간략한 변수명을 정해야 합니다.


2) 변수 유형 결정하기


변수의 유형을 결정하기 위해 유형칸을 클릭하면

버튼이 나오는데 그 버튼을 클릭하면 [그림 2.11]과 같은 대화상자가 나옵니다.

여기서 숫자형태로 입력되었는지, 문자형태로 입력되었는지 등을 설정해주고,

자리수와 소수점이하 자리수도 설정해 준 후 확인을 누릅니다.

소수점이하 자리수를 먼저 설정해 주고 나서 자리수를 설정해 주어야 합니다.

만일 변수마다 설정해주는 것이 동일하다면 [그림 2.12]와 같이 이전 변수칸에 오른쪽 마우스를 클릭하여 [복사]를 누른 후 복사하기를 원하는 칸을 블록 설정한 후 붙여넣기를 합니다.

 

3) 변수에 대해 설명하기

변수이름을 설정할 때 글자수에 제한이 있으므로 변수이름에 대한 보충설명이 있을 경우에 설명칸에 자세한 내용을 입력하면 됩니다. 여러분들도 [그림 2.13]과 같이 따라해 보세요.

 

4) 변수값 설명하기


각 문항에 대해서 1~5 범위 내에서 응답하게 하였으므로 이 응답숫자가 어떤 의미를 갖는지를 설명해 주어야 합니다. 그러므로 [그림 2.14]와 같이 [변수값]에는 응답숫자를 [변수값 설명]에는 그 숫자에 대한 설명을 입력합니다. 각 변수마다 변수값 설명이 같은 경우에는 변수유형에서처럼 이전 변수를 복사하여 원하는 칸을 블록 설정한 후 붙여넣기를 합니다.


5) 결측값 처리하기


데이터를 수집하다 보면 실수나 고의로 응답을 빠뜨리는 경우가 있는데 이를 위해 결측값 처리를 해주어야 합니다. 결측값이라는 것은 누락된 항목들에 대해 특정한 값을 주어 이를 표시하도록 하는 값입니다.

 

결측값은 보통 응답범위 내에 없는 숫자를 입력합니다. 예를들어 1~5까지가 응답범위라면 보통 1~5 사이의 숫자가 아닌 9를 결측값으로 설정해 줍니다. 응답범위가 두 자리 숫자로 구성된 경우에는 99로 설정해 줍니다.

결측값이 없으면 [?결측값 없음(N)]에 클릭하고 결측값이 있는 경우 이산형일 때는   [?이산형 결측값(D)]에 클릭을 합니다.


2.3 데이터 파일 형성


1) 새로운 데이터 파일 만들기


데이터 파일은 행, 열, 셀의 주요 요소로 구성됩니다.

?행(row): 각 행에 있는 값들은 해당 케이스의 변수값들을 나타냅니다.

?열(column): 각 열에 있는 값들은 해당 변수의 케이스값들을 나타냅니다.

?셀(cell): 행과 열이 교차하는 부분으로서 특정 케이스가 특정변수에 대해 응답한 값이 입력됩니다.


새로운 데이터 파일을 만들기 위해 데이터를 입력할 창을 만들어야 합니다.                      

파일(F)→새로 만들기(N)→데이터(A)

이런 과정을 실행하면 아무 것도 입력되지 않은 창이 나타나게 됩니다.

만약 이전에 데이터 편집기창에서 다른 데이터 파일을 사용하고 있었다가 저장하지 않은 상태에서 새로운

데이터 편집기창을 열게 되면 기존 데이터의 저장여부를 물어보게 됩니다.


(1) 변수삽입


변수를 추가적으로 삽입하고자 하는 경우에는 삽입을 하고자 하는 위치에 블록을 설정하고 데이터메뉴에 있는 [변수삽입]을 누르거나

도구모음에 있는 [변수삽입]아이콘(     )을 클릭합니다.


(2) 변수삭제

변수를 삭제하는 경우에는 삭제할 변수를 블록 설정한 후 편집메뉴에서 [지우기]를 누르거나 [Delete]키를 누릅니다.

또는 마우스 오른쪽을 클릭하여 [지우기]를 선택해도 됩니다.


(3) 케이스삽입


변수삽입과 마찬가지로 삽입하고자 하는 위치에 블록을 설정한 후 데이터메뉴에 있는 [케이스 삽입]를 누르거나

도구모음에 있는 [케이스삽입]아이콘(   )을 클릭합니다.


(4) 케이스삭제


삭제하고자 하는 케이스를 블록설정한 후 편집메뉴에서 [지우기]를 누르거나 [Delete]키를 누르거나 마우스 오른쪽을 클릭하여 [지우기]를 선택합니다.


(5) 변수 및 케이스 편집


케이스를 선택하고자 할 때에는 다음과 같은 방법으로 하면 됩니다.

?변수의 맨 처음 케이스로 이동할 때에는 [Ctrl]과 [↑]키를 동시에 누릅니다.

?변수의 맨 마지막 케이스로 이동할 때에는 [Ctrl]과 [↓]키를 동시에 누릅니다.

?케이스의 맨 처음 셀로 이동할 때에는 [Home]키를 누릅니다.

?케이스의 맨 마지막 셀로 이동할 때에는 [End]키를 누릅니다.

?한 케이스 전체를 선택할 때에는 [Shift]와 [SpaceBar]키를 동시에 누릅니다.

?한 변수 전체를 선택할 때에는 [Ctrl]과 {SpaceBar]키를 동시에 누릅니다.

?몇 개의 셀 블록을 설정할 때에는 [Shift]와 [→] 또는 [←] 또는 [↑] 또는 [↓]를 동시에 누릅니다.


선택된 케이스를 가지고 [복사] 또는 [잘라내기]를 한 후 자신이 원하는 곳에 [붙여넣기]를 하면 자신이 원하는 편집을 하게 됩니다.


(6) 케이스로 곧바로 이동


수백 개의 케이스를 수집했을 경우 방향키나 이동키로 하나의 케이스를 찾는 것은 상당히 번거롭습니다.

따라서 자신의 해당케이스로 곧바로 이동하기 위해서는 데이터메뉴에 있는 [케이스로 이동]를 누르면 [그림 2.16]과 같은 창이 나타납니다. 이 곳에 자신이 원하는 케이스 번호를 입력하면 해당 케이스로 쉽게 이동할 수 있습니다.


2) 파일 합치기


실제 설문지를 코딩하는 경우 보통 한 사람이 아닌 여러 사람들이 코딩을 하는 경우가 있습니다. 이런 경우 여러 코딩을 하나로 합하여 하나의 온전한 데이터 파일을 만들어야 합니다.


(1) 케이스 합치기


(1-1) 변수명을 동일하게 한 케이스 합치기


설문지가 200부가 있는 경우 두 사람이 100부씩 코딩을 한 경우 100부씩 한 코딩을 200부로 합쳐야 하는 것처럼 동일한 변수에 따른 여러 개의 케이스를 합쳐야 합니다. [예제 03-1][예제 03-2]의 파일을 불러 다음을 따라해 보세요.


① 데이터 편집기 창에서 [예제 03-1] 파일을 먼저 불러옵니다. 그런 다음 데이터 메뉴에서 [파일합치기]를 거쳐 [변수 추가]를 누릅니다.

              

데이터(D)→파일합치기(G)→케이스 추가(C)


② [그림 2.17]과 같은 화면이 나타나면 [예제 03-2]를 선택한 후 열기를 누릅니다.


③ 열기를 누르면 [그림 2.18]이 나타나는데 확인을 누르면 [그림 2.19]와 같이 케이스가 합쳐진 데이터가 나타납니다.

(1-2) 변수명을 다르게 한 케이스 합치기


서로 코딩을 하다보면 같은 변수라 하더라도 변수명을 다르게 할 수 있습니다. 이런 경우에는 [예제 03-1][예제 03-3] 파일을 가지고 실습해 봅시다.


① 우선 [예제 03-1]를 불러온 후 위와 동일한 방식으로 [예제 03-3]의 파일을 합치기를 실행하면 다음과 같은 대화상자가 나타납니다.


왼쪽의 대응되지 않은 변수(U)에는 6개의 변수가 있는데, 이들은 (*)표시와 (+)표시로 나누어져 있을 것입니다.

여기서 v1과 v4가 같은 변수이므로 이 둘을 같이 묶어야 하는데, 그러기 위해서는 v1을 클릭한 후

Ctrl

키를 누른 후 v4를 클릭하면 두 개의 변수가 선정되는데 선정되는 동시에 [대응(A)] 버튼이 나타납니다.

그 나타난 버튼을 클릭하면 이전에 선정된 변수가 대응이 되어 새로운 작업 데이터 파일의 변수(V)로 옮겨집니다.

이와 같은 방식으로 나머지 변수도 대응시켜 줍니다.

결과적으로 [그림 2.22]와 같은 결과 데이터가 나타납니다.

 

(2) 변수 합치기

 

(2-1) 변수명을 다르게 한 변수 합치기

 

케이스 합치기와는 달리 설문지의 일부씩을 가지고 코딩한 경우에 이와 같은 절차를 거칩니다. 예를 들어 총 6 문항을 가지고 코딩을 한 경우 두 명이서 세 문항씩 코딩을 하였다면, 그 두 코딩을 하나로 합쳐주어야 합니다. 이런 경우에도 이전에 사용한 [예제 03-1][예제 03-3] 파일을 가지고 실습해 봅시다.


① 데이터 편집기 창에서 [예제 03-1] 파일을 먼저 불러옵니다. 그런 다음 데이터 메뉴에서 [파일합치기]를 거쳐 [변수 추가]를 누릅니다.

              

데이터(D)→파일합치기(G)→변수 추가(V)


② [그림 2.17]과 같은 화면이 나타나면 [예제 03-3]를 선택한 후 열기를 누릅니다.


③ 현재 작업중인 데이터 파일의 경우는 (*)표시로, 새롭게 추가할 파일의 경우는 (+)로 나타나 있습니다. 문항별로 변수명을 다르게 하였으므로, 다른 설정을 해 줄 필요없이 [확인]을 누릅니다.



④ [그림 2.25]와 같은 결과 데이터가 나타납니다.


(2-2) 변수명을 동일하게 한 변수 합치기


만일 코딩을 하는데 있어서 다른 문항임에도 불구하고 같은 변수명으로 입력하였다면,

그 변수명을 변환해 준 후 파일을 합쳐야 합니다.

예를 들어 총 6문항을 가지고 코딩을 한 경우 두 명이서 한 사람은 1, 2, 3문항을 다른 사람은 4, 5, 6 문항을 코딩하였는데

둘 다 변수명을 v1, v2, v3으로 한 파일을 둘로 합쳐야할 때에는 4, 5, 6 문항을 입력한 사람의 변수명을 바꾸어 주어야 합니다. 그에 대한 방법을 알아 봅시다.

우선 [예제 03-1][예제 03-2] 파일을 가지고 실습해 봅시다.


① 데이터 편집기 창에서 [예제 03-1] 파일을 먼저 불러옵니다. 그런 다음 데이터 메뉴에서 [파일합치기]를 거쳐 [케이스 추가]를 누릅니다.

              

데이터(D)→파일합치기(G)→변수 추가(V)


② [그림 2.17]과 같은 화면이 나타나면 [예제 03-2]를 선택한 후 열기를 누릅니다.


③ 현재 작업중인 데이터 파일의 경우는 (*)표시로, 새롭게 추가할 파일의 경우는 (+)로 나타나 있습니다.

문항별로 변수명을 동일하게 하였으므로, 제외된 변수(E) 칸에 있는 변수들의 변수명을 바꾸어주어야 합니다. 변경하고자 하는 변수를 선택하여

이름 바꾸기(A) 버튼을 누르면 [v1 이름변경] 창이 뜹니다. 거기에 있는 [새 이름(N)]에 v4로 입력한 후 [계속]을 누릅니다. 변수 v2(+)와 v3(+)도 동일한 방식으로 합니다.

 


④ 변수명을 변경하고 난 후 변경된 변수를 모두 블록설정한 후

를 누르면 제외된 변수(E)에 있는 변수가 세로운 작업 데이터 파일(N)로 옮겨집니다.


⑤ 다 옮겨진 후 [확인]을 누르면 다음과 같은 결과 데이터가 나타납니다.

 

2.5 변수변환하기

2.6 입력에러 고치기