본문 바로가기
STATISTICS

통계의 기본 개념(2)

by 자유데이터 2018. 11. 20.
반응형
목차

통계의 기본개념
        1.통계학이란
        2.통계 기본 용어
        3.통계 기호
        4.기술통계와 추측통계
        5.추정과 가설검정
        6.확률
        7.확률분포




1.확률(probability)

같은 실험을 동일한 조건에서 무수히 많이 반복할때, 특정 결과가 나오는 비율

표본공간(sample space) : 실험에서 나타날 수 있는 모든 가능한 결과들의 집합
사건(event) : 표본공간의 일부분(부분집합)을 의미하며 실험결과를 말한다. (시행(trial)과 같은 의미)

확률변수(random variable) : 일정한 확률을 가지고 나타나는 사건(실험결과)에 수치를 부여한 변수를 말한다.
                                                  확률표본에서 관찰된 변수
    ex)동전의 앞이나올 확률과 뒤가 나올 확률은 1/2이다. 여기에 앞=1, 뒤=2 라는 수치를 부여하면 이 변수를 확률변수라 한다.
    -이산확률변수 : 특정한 수치만 취하는 확률변수(범주형 변수)
    -연속확률변수 ; 모든 실수값을 가질 수 있는 확률변수



2.확률분포 

확률 변수가 취할 수 있는 모든 확률을  그래프로 나타낸 것을 말한다.
즉, 각 확률변수를 x축에, 그 변수의 확률을 y축에 나타낸다.

확률변수를 무수히 많이 측정하여 확률분포로 나타내면 정규분포에 수렴한다.
즉, 분포가 대표본(표본이 30개 이상)일때 정규분포를 따른다고 할 수 있다. 
(대표본은 표본파트에서 자세히 다룬다.)

따라서, 정규분포를 고려하여 다음에 나올 확률을 예측할 수 있다.
그리고 통계량을 파악하여 통게적 의사결정을 내리는 기준을 제시한다.

확률분포의 종류는 다음과 같이 다양하다.



예시)
어떤 회사에 직원이 남아있을 확률분포

전혀 남아 있지 않을 확률 11.8%
1명 남을 확률 30.3%, 2명 남을 확률 32.4%
따라서, 0~2명 남을 확률이 94%


확률밀도함수(probability density function) : 확률분포를 만드는 함수식을 말한다.





반응형

'STATISTICS' 카테고리의 다른 글

대표값(2)  (0) 2018.12.02
대표값(1)  (0) 2018.12.02
표본추출과 데이터수집(2)  (0) 2018.12.01
표본추출과 데이터수집(1)  (0) 2018.12.01
통계의 기본 개념(1)  (3) 2018.11.14

댓글