변수 보기 화면 설명
데이터 입력 오류 체크
1) 전체 변수에 대한 빈도분석
일단 에러 체킹을 위해서는 전체 변수들에 대한 빈도 분석을 실행해야 함
1) 전체 변수에 대한 빈도분석
2) 에러 체킹 기본 – 범주의 범위 밖의 데이터
왼쪽의 두 표를 보면 첫 번째 표는 지역을 빈도 분석한 내용이고, 두 번째 표는 성별이다.
첫 번째 표는 범주의 틀을 벗어나 는 데이터가 없으나,
두 번째 표는 성별인데 설문지 범 주에 없는 4, 9, 11이라는 데이터가 보이는데 이것이 범주 밖의 데이터 이다.
간단하게 에러를 체킹하는 두 가지
방법 중 하나가 바로 범주 밖의 데
이터를 찾아내는 것이다.
2) 에러 체킹 기본 – 범주의 범위 밖의 데이터
앞 페이지에서 성별에서 4, 9, 11의 데이터가 에러이다. 이들 데이터를 찾기 위해서는 가장 쉬운 방법은 성별로 sorting을 하면 이러한 에러를 일으킨 변수의 ID를 쉽게 찾을 수 있다. 여기서 보면 ID가 104, 16, 56, 96 등이 에러인 것으로 판명되어 이들의 설문지를 찾아서 원래 데이터가 어떻게 입력되었는지 확인하여 에러를 수정하면 된다.
3) 에러 체킹 기본 – 가지치기 설문 응답 에러
결과표에서 서비스 인지
‘예’는 117, 아래
해당되는
항목의 총 빈도는
118로 다르다.
가지치기 설문에 의해서 Q1)에서 “예”라고 하면 다음 항목에 응답해야 하나 위에 ID 28은 오류가, 아래는 Id, 128.과 131은 ‘아니오’인데,
그 다음 항목에 응답을 하지 않아야 하는데 응답이 있는 오류가 있어,
이를 확인하고 데이터를 수정해야 함.
데이터 변환 _ 신규변수계산
신규생성변수
데이터 변환 _ 같은 변수로 코딩 변경
코딩변경의 예를 들어보자
현재 예제 데이터에는 연령이 20세에서 40세까지 이어져 있다.
연구자가 이 연령을 20~29세까지 한 그룹, 30~39세까지 한 그룹, 그리고 40~49세까지를 한 그룹 이렇게 총 3그룹으로 바꾸고자 한다면,
20~29세 à 20대 그룹
30~39세 à 30대 그룹
40~49세 à 40대 그룹
코딩변경의 예는 두 가지로 접근할 수 있음.
그 하나는 ‘같은 변수로 코딩변경’, 또 다른 하나는 ‘다른 편수로 코딩 변경’의 두 가지가 있음. 같은 코드로 변경하기를 예를 들어보자.
데이터 변환 _ 같은 변수로 코딩 변경
20~29세 à 20대 그룹
30~39세 à 30대 그룹
40~49세 à 40대 그룹
20~29세 à 20대 그룹 30~39세 à 30대 그룹 40~49세 à 40대 그룹
같은 변수로 변경한 값은 왼쪽 그 림에서 보듯이 ‘26’은 ‘1’, ‘32’는 ‘2’
로, ‘31’은 ‘2’로 변경된 것을 볼 수 있다. 하지만 변수는 ‘AGE’에서
‘AGE’로 같다. 이제 이전의 데이터 는 없어지고 새로운 값들로 변경되 었다. 이 의미는 이전 데이터는 이 미 변경되어 새로운 변수 값이 되 었다는 의미이고 이전 데이터로는 돌아갈 수 없음.
결론적으로 같은 변수로 하면 큰일남.