본문 바로가기
STATISTICS

통계의 기본 개념(1)

by 자유데이터 2018. 11. 14.
반응형

목차

통계의 기본개념
        1.통계학이란
        2.통계 기본 용어
        3.통계 기호
        4.기술통계와 추측통계
        5.추정과 가설검정
        6.확률
        7.확률분포



"통계학의 시작은 용어다."


1.통계학이란

집단의 특성(변수)에 대한 수적 자료(데이터)를 수집, 정리, 분석하고, 그 결과를 해석하는 이론과 방법을 체계화한 학문이다.
불확실한 상황에서 일어나는 자연현상이나 사회현상을 과학적으로 분석, 예측하는 분석도구로서 널리 사용한다.
21세기 정보화 시대에서 정보처리 수단으로서 통계적 방법의 중요성이 더욱 높아지고 있다.
통계학을 학습하는데에는 통계의 기본개념을 나타내는 용어를 정확히 이해하는 것이 중요하다.



2.통계 기본

관찰대상 : 모집단을 구성하는 개체 또는 설문조사표의 각 문항을 말한다. (변수를 구하기 전 단계이다.)
모집단 : 관찰대상이 모여있는 집단, 모집단을 알아야 개체를 알고 특성을 알아내어 변수를 찾아낼 수 있다.
변수(variable) : 연구자가 관찰하는 대상의 특성
관찰값(관측치 observed values) : 각 관찰대상으로부터 얻은 수치, 각 변수는 오직 하나의 관찰값만 가진다.
자료수집 : 변수의 관찰값을 얻는 일

변수는 구분 방법에 따라 여러가지로 나뉜다.(자세한 내용은 나중에 다루겠다.)
척도순준에 따라(점점 높은 척도) : 분류 변수 < 순서 변수 < 간격 변수 < 비율 변수
        척도가 높으면 고려할 사항이 많은 것.
측정방법에 따라 : 질적 변수, 양적 변수
연속성 여부에 따라 : 연속형 변수, 이산형 변수
여러 변수들 간의 관계 : 독립 변수(다른 변수의 영향을 받지 않음), 종속 변수(다른 변수의 영향을 받음)

모집단(population) : 관찰대상이 되는 모든 개체를 포함하는 집단을  말한다. 모집단은 명확해야 한다.
표본(sample) : 모집단의 일부로서, 전체(모집단)를 파악하기 위해 추출된 집단이다.

무작위로 표본을 추출해야 대표성 있는 표본을 얻을 수 있다. -> 확률표본(random sample)
모집단은 너무 커서 모든 개체를 관찰하기에는 노력, 경비, 시간 등이 많이 들고 모두 관찰할 수 없는 경우가 많기 때문에
모집단의 일부인 표본을 관찰해서 모집단에 대한 추론을 하게 된다.

통계량(statistic) : 표본의 특성을 수치로 나타낸 것으로 표본에 따라 값이 변하는 확률변수이다.
모수(parameter) : 모집단의 특성을 나타나는 기호 또는 수치이다. 대개 모수는 통계량으로 추정한다.



3.통계 기호

모수는 주로 그리스 문자와 대문자를 사용한다.
통계량은 주로 영어소문자를 사용하고 위에 바 표시가 있다.




4.기술통계(descriptive)와 추측통계(inferential statistics)
통계적 방법은 이 두 가지로 구분된다.


1)기술통계
(확률)표본으로부터 데이터(수적자료)를 수집한 다음 이 데이터를 정리(전처리, 정제..)하고 요약(집계..)하여 표본의 특성을 이해한다.
기본이지만 아주 중요한 개념이며 반복적으로 기술통계량을 구하는 연습을 해야한다.


2)추측통계
모집단의 일부인, 표본을 이용하여 모집단의 특성(변수)을 추론한다. 표본의 통계량을 이용하여,
모평균이나 모비율 추정, 신뢰구간의 추정, 가설검정, 분산분석, 회귀분석(인과률을 밝힌다.) 등의 방법으로 모집단에 대핸 추론한다.



5.추정(estimation)과 가설검정(hypothesis test)
모수에 대해 추론할때 이용하는 방법이다.


1)추정 
표본의 통계량으로 모집단의 모수를 미루어 짐작하는 것.
    -추정량(estimator) : 추정하기 위해 만든 통계량
    -추정값(estimate) : 추정량(estimator)의 값

(1)점추정
하나의 값으로 나타낸 것.

ex)
A고등학교의 남자 전체 100명(모집단)중에서 20명의 키(표본)를 뽑아낸다.  
표본의 평균키가 172cm를 가지고 전체 평균키를 172cm라고 추측하는것이 점추정이고, 
여기서 표본평균은 모평균의 점추정량이고 표본평균값은 점추정값이다.

(2)구간추정 
모수가 있을 것으로 추측되는 범위를 표시.


2)가설검정
모수가 어떤 특정한 값일 것이라고 미리 가정해 놓고 관찰한 표본을 통해 모수가 가정한 값과 다르다고 할만한 근거가 있는지를 검토한다.
다르다고 할 만한 충분한 근거가 없으면, 미리 가정한 값은 모수와 같다는 결론을 내린다. 
모수의 값으로 가정하는 것을 "가설을 세운다"고 말하며 이 가성을 "통계적 가설"이라 한다.


반응형

'STATISTICS' 카테고리의 다른 글

대표값(2)  (0) 2018.12.02
대표값(1)  (0) 2018.12.02
표본추출과 데이터수집(2)  (0) 2018.12.01
표본추출과 데이터수집(1)  (0) 2018.12.01
통계의 기본 개념(2)  (0) 2018.11.20

댓글