[스크랩] 기초통계2:통계량
-- 1-2. 대표값 즉, [그림 1-1]과 같이 우리는
|
|
-- 모집단으로부터 얻어진 n개의 관찰값들 얻어내야 할 것이다, 우리가 자료로 부터 얻어 내어야 하는 정보는 무엇인가.....이를 통계량이라고 한다.... 우리반의 학생들이 시험을 쳤다고 하자, 교사가 알고 싶은 가장 중요한 정보는 무엇인가?? 생각해보자..... (음! 우리반의 평균은 어느 수준에 있는가, 일등은 몇점인가 그럼 꽁지는?)....이런 것 아니겠는가 여기에서 평균이란 이 집단을 대표하는 값이다...이를 대표값(중심)이라고 한다 다음은 일등과 꽁지의 차이다...이를 흩어짐라고 한다
1. 우선 이들 n개의 값들을 대표하는 값은 어떤 값인가를 알아보기로 하자. 대표값을 얻는 방법으로 대체로 다음과 같은 세 가지 방법이 있다. |
|
-- 1-2-1 산술평균(mean, average) |
|
-- 평균이라는 것은 누구나 아는 개념으로 표본값들 n개를 합하여 합한 개수(n)로 나눈 것을
그러나 어떤 경우에는 단순한 평균값으로 그 자료들을 대표하는 평균으로 이 경우에는 학교의 규모(학생수)로써 가중치(weight)를 삼아 평균을 얻어야 할 것이다. -- 이러한 방법을 가중평균(weighted mean)이라고 부르며 구하는 식은 다음과 같다. |
--------- |
-- 가중평균을 사용해야 하는 대표적인 예는 물가지수 산출이다. 우리 나라에서는 개의 품목들을 |
-- [물가지수 산출 예] |
-- |
|
-- 쌀은 가격이 오르지 않았으므로 품목지수는 100, 사과는 가격이 두배가 되어 품목지수가 200등 그러나 품목별 지수들의 단순평균은- 현재의 물가를 나타내는 대표값으로서 의미가 없는 것이고 품목별 지수들을 가중평균 해야만 할 것이다. |
|
-- 이다. 즉, 물가수준이 기준년도 대비 1.4배 되었다고 말할 수 있다. |
|
-- 1-2-2 중위수(median) |
-- 중위수란 가장 가운데 위치한 값을 말한다. 즉, 자료들을 작은 것부터 순서대로 배열하여 가장 -- 가운데 위치한 값을 중위수라고 한다. 중위수의 장점은 극단값의 영향을 받지 않는다는 것이다. 왜냐하면 중위수를 구하는데는 |
|
-- 1-2-3 최빈수(mode) |
-- 최빈수는 가장 빈번히 얻어지는 값으로 대표값을 정하는 방법이다. 물론, 양적 자료(수량화된 예를 들어 승용차의 색상 중에서 대표값은 최빈수(가장 흔한 색)로써 얻어진다. 가장 중요한 대표값은 역시 평균이다. 그 이유는 뒤에서 차차 밝혀질 것이다. |