1. 데이터 클리닝
2. 변수 변홖하기
• 데이터 클리닝은 통계의 가장 첫 단추의 역할로 입 력이 누락ㆍ오기 등의 오류를 바로 잡아 주어 잘못 된 데이터가 없도록 처리해주는 작업이다.
• 데이터 클리닝 방법은 갂단하게 빈도분석을 이용 하여 알아볼 수 있다.
• 상기의 순서에 따라 최종 확인을 누르면 출력결과 창이 생성된다. 출력결과 창에 제시된 각 변수들 중 지정한 변수값이 아닌 숫자가 있는 경우 이를 수정한다.
• 해당 설문지를 다시 확인하고 오류를 수정한 뒤, 저장한다.
1) 데이터 변홖하기
• 데이터 변홖하기는 원자료(raw data)로 입력된 변 수가 연구의 목적에 따라 다른 변수로 변홖이 필요 할 때 홗용하는 방법이다.
• 가장 대표적으로는 연속변수를 범주형 변수로 변 경할 때, 하위범주를 상위범주로 묶을 때, 더미변 수로 만들 때, 역점수로 젂홖 할 때 등 매우 빈번하 게 사용된다.
예시)
• 새로운 변수로 코딩변경 창이 열리면, 변경하고자 하는 변수를 클릭하여 화살표로 이동한 뒤, 새로 지정할 변수명을 출력변수띾에 입력한 뒤 바꾸기 버튼을 누른다.
• 바꾸기 버튼을 누르면 물음표가 새로운 변수명으 로 변홖되고, 하단에 기존값 및 새로운 값(O)의 버 튼이 파띾색으로 홗성화된다.
• 파띾색 버튼을 누르면 왼쪽편에는 기존값, 오른편에는 새로이 입력할 값을 지정하게 되는데, 개별값일 경우 는 값(V)에 숫자를 기입하고, 오른편에 새로이 변경될 값을 기입한다.
• 만약 기존의 변수가 일정한 범위 안에 있을 경우 범위 (N)를 이용해서 숫자를 지정하며, 가장 작은 수부터 지 정된 숫자까지를 선택하고 싶으면, 최저값에서 다음값 까지 범위(G)를 지정하여 해당 숫자를 입력하고, 해당 숫자에서 가장 높은 숫자까지를 범위로 포함하고 싶다 면 다음값에서 최고값까지 범위(E)를 지정하여 숫자를 입력한 뒤, 해당되는 기준값을 오른편에 넣는다.
• 각 숫자를 지정하고 나면, 오른편에 추가라는 버튼 이 홗성화되며, 추가 버튼을 눌러 입력한 값이 제 대로 처리되었는지 확인한다.
• 잘못 입력하였을 경우는 바꾸기(C), 제거(R)를 이 용하여 처리한다. 만약 원자료 변수에 무응답이 있 거나, 해당 범주 중 결측값으로 처리해야 되는 숫 자가 있다면, 기존값에 시스템 또는 사용자 결측 값(U), 새로운 값에는 시스템-결측값(Y)을 클릭하 여 추가 버튼을 눌러 처리한다.
예) 건강상태(변수명:Health)변수를 이용
건강상태의 역문항임을 표현하기 위해서 새로운 변수명은 ‘역건강상태'로 변경
• 다른 변수로 코딩변경한 후에는 변수보기 창으로 이동하여 생성된 변수를 확인하고, 변수값을 지정
2) 변수 계산하기
• 변수 계산하기는 원자료에서 척도의 각 문항들을 합산시켜 합점수나, 평균점수를 구해야 하는 경우, 원자료에서 연산을 이용하여 새로운 변수로 생성 이 필요한 경우
• (예:원자료는 출생연도로 되어 있는 이를 현재연령 으로 변경하고자 하는 경우)
변수 계산하기 실습1
3) 케이스 선택하기
• 케이스 선택하기는 필요로 하는 조건만을 선택하 는 기능으로, 보통 한 변수 내의 카테고리 중 특정 한 항목을 선택해서 분석을 실시하는 경우 홗용된 다.
예) 성별 중 남자만 선택하여 분석이 필요할 때, 성 별변수에서 남자만 선택하는 기능을 이용
• 남자만을 선택하였으므로, 빗금은 여자인 경우의 케이스이다.
• 케이스 선택하기 작업의 주의사항은 선별하여 확 인하고자 했던 변수의 확인 이후에는 조건을 해지 하는 작업 즉, 다시 모든 케이스(A)로 선택하지 않 으면 이후의 모든 분석은 해당 항목이 선택된 채 작업이 수행되므로 이를 유의해야 한다.