1. 그래프의 정의와 기능
- 그래프: 수집된 자료를 시각적으로 보다 쉽게 이해시키기 위하여 일목요연하게 표시한 그림
→ 자료가 지니고 있는 속성을 그림의 형태로 표현한 것
- 그래프의 기능
① 수집된 자료를 구성하는 수들이 어떤 값을 중심으로 모이는 경향과 흩어진 정도를 쉽게 분석
② 자료 속에 존재하는 집단 간의 차이 여부 쉽게 파악
③ 어떤 변수간에 연관성이 존재하는지를 쉽게 파악
2. 그래프 도식의 기본 원칙
- 일반적으로 그래프를 그릴 때 적용되는 규칙
① 독립변수는 x축에 종속변수는 y축에 그림
② x축, y축의 내용을 간결하고 명확한 단어로 표현 & 각 축의 측정단위 반드시 기입
③ x축, y축 길이 & x축, y축 전체를 적절한 간격으로 구분 → 자료가 지니고 있는 속성을 효율적으로 표현하기 위해
④ 그래프 해석을 용이하게 하기 위해 축 눈금의 단위를 10으로 함 → 자료에 따라 달라짐
→ 1, 2, 5, 10배수 사용이 좋고 3, 7, 9배수의 사용은 자료 해석을 어렵게 하지만 자료를 보고 결정할 것
3. 그래프의 종류
- 변수의 형태 및 그래프의 목적을 고려하여 작성
- 그래프의 종류: 막대그래프, 선 그래프, 히스토그램, 절선도표(도수분포다각형도표), 누가백분율도표
- 그래프는 자료의 속성을 설명하기 위하여 관찰된 변수들의 각 범주에 해당하는 백분율이나 도수를 나타냄 → 가로축은 변수나 범주의 이름 또는 범위가 표시, 세로축은 백분율이나 도수 표시
4. 막대그래프
- 변수가 질적변수일 때 사용 → 질적변수: 명명척도에 의하여 측정(서열변수 & 비서열변수)
- 막대그래프 도식 절차
① 자료가 지니고 있는 범주 열거(‘기타’, ‘무응답’이 있는 경우 유의)
② 각 범주에 해당하는 도수 및 백분율 계산
③ 가로축 및 세로축을 그리고 각 범주에 해당하는 백분율에 상응하는 막대 그림
④ 각 막대의 범주 이름 기록 및 가로축/세로축 단위 기록, 막대그래프에 제목 붙임
5. 선그래프
- 변수가 양적 비연속변수일 때 사용 → 양적변수: 수량으로 표시되는 변수 → 비연속변수: 특정 수치만 가질 수 있는 변수
- 선그래프 도식 절차
① 자료가 가지고 있는 모든 수를 열거하고 각 수에 해당하는 도수를 셈
② 각 수에 해당하는 도수를 총 사례 수로 나누어 %로 계산
③ 가로축과 세로축을 그린 후 각 수에 해당하는 %에 상응하는 선을 가로축과 수직이 되게 그림
④ 가로축과 세로축에 단위와 수를 기입하고 간결·명확한 제목을 붙임
- 선그래프를 그릴 때도 ‘기타’, ‘무응답’ 존재하나 선그래프는 양적 비연속 변수를 가지고 그리는 것이기 떄문에 이런 질적변수를 그래프 위에 나타내기는 용이하지 않음 → 그래프 위에 나타내지 않고 서술
6. 히스토그램
- 변수가 양적 연속변수일 때 사용
- 선그래프가 지니고 있는 취약점을 해결 하기 위해 사용 → 기술적으로 막대그래프와 선그래프의 복합체로 볼 수 있음
- 연속성을 위한 교정을 통해 양적 비연속변수를 양적 연속변수로 분류할 수 있음
- 연속성을 위한 교정값: 측정단위 또는 점수의 단위를 2로 나눈 값
- 히스토그램 도식 절차
① 연속성을 위한 교정값을 계산한 후 교정값에 의한 최고점수 와 최저점수의 정확한계 설정
② 변수의 범위 계산(범위 = 최고값의 상한계-최저값의 상한계)
③ 가로축을 적절한 수의 급간(8~12개)으로 나눔
→ 급간의 수가 정해지면 급간의 크기가 결정됨. 급간의 크기를 설정할 때 척도의 단위가 홀수이면 급간의 크기는 홀수/척도의 단위가 짝수이면 급간의 크기도 짝수로 설정
④ 급간의 수와 크기를 설정한 후 최저값의 하한계 값보다 측정단위 한단계 아래에서 급간 값 시작
→ 최저값의 하한계 값보다 측정단위 한단계 아래에서 급간 값을 시작하는 이유: 표본의 범위를 보다 모집단의 범위와 일치시키기 위해
⑤ 각 급간에 해당하는 도수를 세고 %를 계산한 후 히스토그램을 그림
⑥ 가로축/세로축의 이름과 단위, 히스토그램의 제목을 적음
- 집단비교가 어려운 단점
7. 절선도표(=도수분포다각형도표, 빈도분포다각형도표)
- 변수가 양적 연속변수일 때 사용
- 두 집단 이상의 비교를 위하여 사용
- 절선도표의 경우 도식화하는 방법이 히스토그램과 매우 비슷한데 도수를 세고 %를 계산하는 것 까지는 히스토그램과 동일하고 그 후 각 급의 중간값을 점으로 찍어 선으로 연결
- 절선도표 도식시 주의점
① 급간의 크기를 척도의 단위에 따라 달리하여야 함(척도의 단위가 홀수/짝수일 때 급간의 크기도 홀수/짝수로)
② 절선도표의 점들을 연결한 후 최저급간의 중간값을 나타낸 점과 최고급간의 중간값을 나타내는 점에서 가로축에 연결할 때 왼쪽 끝은 최저급간의 하한계에서 연결하고 오른쪽 끝은 최고값의 상한계에 연결
8. 누가백분율도표(=누가백분율곡선, 오자이브 곡선)와 누가도수표(=누가도수곡선)
- 특정 지점까지 누적된 도수나 백분율을 알고자 할 때 사용
- 누가백분율도표는 세로축이 백분율, 누가도수표는 세로축이 도수
- 누가백분율도표의 경우 도식화하는 방법이 히스토그램, 절선도표와 매우 비슷한데 도수를 세고 %를 계산하는 것 까지는 동일, 이후 각 급간까지 누적되니 백분율을 계산하여 각 급간의 상한계에 해당하는 부분에 점을 찍은 후 연결
9. 백분위수, 십분위수, 사분위수, 백분위 점수
- 백분위수: 얻어진 자료를 크기의 순서로 늘어놓아 100등분하는 값
- 십분위수: 제10백분위수
- 사분위수: 수집된 자료를 크기 순으로 배열하여 4등분한 값(제1사분위수=제25백분위수, 제2사분위수=제50백분위수, 제3사분위수=제75백분위수, 제4사분위수=제100백분위수)
- 백분위수는 교육평가에서 규준참조평가, 즉 상대비교평가를 실시할 때 흔히 쓰이는 변환점수의 일종
- 백분위 점수: 백분위수에 해당하는 원점수
10. 그래프 사용과 해석시 주의점
- 그래프 사용시 정보를 왜곡할 수 있는 문제점이 있음
- 그래프 해석시 주의점
① 그래프 도식의 일반 규칙 확인
② 세로축에 수를 부여할 때 적절한 수에서부터 출발하였으며 간격이 적절한지 확인
③ 막대의 폭이 동일한지 확인
④ 시각적인 차이와 변화에 관심을 두지 말고 실제적 차이와 변화에 관심을 두어 작성
출처: 성태제(1995). 「현대기초통계학 이해와 적용」. 제8판. 서울: 학지사
'공부 > 통계1' 카테고리의 다른 글
| 통계의 기본 개념과 법칙 (0) | 2022.03.16 |
|---|---|
| 과학과 통계 (0) | 2022.03.15 |