본문 바로가기

STATISTICS10

시계열 분석 목차 시계열 분석 1.시계열 분석 개요 2.평활화 기법 3.정상성과 차분 4.시계열 모형 5.자기상관성과 부분 자기상관성 6.요소분해법 1.시계열 분석 개요 시계열 자료(time series data)는연도별, 분기별, 월별, 일별, 시간별 등 시간의 흐름에 따라 순서대로 관측되는 자료를 말한다. 시간 단위 외에도 사회적 변화나 환경적 변동요인을 기준으로 시계열자료를 구분하는 경우도 있다. 일반적으로 시계열 자료는 추세변동, 순환변동, 계절변동, 불규칙변동 요인으로 구성된다. 1)시계열 분석을 위한 기본 용어 (1)시점(time point) -어느 한 특정 점(순간) (2)적시성(timeliness) -언제 시행하느냐 (3)기간(period) -시점과 시점 사이의 거리 (4)시차(time lag) -'기.. 2019. 3. 8.
회귀분석 목차 회귀분석 1.회귀분석이란 2.회귀 모형 3.회귀분석 절차 4.오차와 잔차 비교 1.회귀분석이란(Regression Analysis) 1)회귀분석 두 변수의 관계를 회귀식으로 간단하게 설명하고, 한 변수로 다른 변수의 값을 추정하거나 예측한다. 2)회귀분석과 상관분석 회귀분석과 상관분석은 아주 밀접한 관계가 있다.상관분석: 변수들이 함께 변화하는 정도를 알려준다.회귀분석: 변수들 사이의 원인과 결과를 설명해준다. 3)회귀 방정식원인(x)에 의해 결정된 결과(y)에 대한 방정식 x: 원인이 되는 변수(=독립 변수=설명 변수=예측 변수)y: 결과가 되는 변수(=종속 변수=반응 변수=결과 변수) 두 변수 간에 상관관계가 높으면,독립변수는 종속변수를 더 잘 설명할 수 있고, 독립변수 값으로 종속변수 값을 정.. 2019. 3. 7.
가설 검정(2) 목차 가설검정 1.가설검정이란 2.귀무가설과 대립가설 3.오류 4.유의수준과 검정력 5.검정통계량과 기각값 6.기각역과 채택역 7.양측검정과 단측검정 8.유의확률 5.검정통계량과 기각값 1)검정통계량(test statistics)통계적 가설을 검정할 목적으로 사용되는 통계량통계적 결론을 내릴 때 근거가 되는 통계량 기호: 귀무가설을 기각시킬지 채택시킬지의 용도로 사용한다.기각값을 기준으로 정한다. 2)기각값(critical value)귀무가설을 기각하는 기준값연구자가 정한 유의수준 확률에 따른 값기호: t 유의수준과 자유도(df)를 가지고 확률분포표를 통해 해당하는 값(y값)을 찾는다.그 y값에 해당하는 x값이 기각값이고 임계값이라고도 한다. *주의* 그래프에서 검정통계량, 기각값은 x값이다. (유의수준.. 2019. 2. 27.
가설 검정(1) 목차 가설검정 1.가설검정이란 2.귀무가설과 대립가설 3.오류 4.유의수준과 검정력 5.검정통계량과 기각값 6.기각역과 채택역 7.양측검정과 단측검정 8.유의확률 1.가설검정이란추측통계에서 모수값을 미리 가정하고, 표본의 통계량과 일치하는 지를 검정하는 통계적 절차를 말한다. 1)목적 모수와 통계량의 차이가 참인지 우연인지를 판정하기 위함즉, 모수를 추론할때 가설검정을 한다.모수에 대한 추론은 1.추정 2.가설검정 으로 한다.(통계의 기본개념 5번을 참고하자) 2)가설을 세운다. 모수의 값을 가정한다는 의미이 가설을 통계적 가설(statistically hypothesis)라 한다.통계적 가설은 귀무가설과 대립가설이 있고 맞다고 판정되면 채택, 아니면 기각한다. 2.귀무가설과 대립가설 1)귀무가설(nul.. 2019. 2. 27.
대표값(2) 목차 대표값 1.대표값이란 2.산술평균 3.중앙값 4.최빈값 5.기하평균 6.조화평균 7.대표값들 관계 7.대표값들 관계 분포(Distribution): 확률변수의 확률분포 1)정규분포대표값을 중심으로 좌우대칭을 이루는 종모양의 연속확률분포 변수의 분포가 정규분포할때, 모든 대표값들은 일치한다. (모두 그래프 중앙이다.)정규분포에서 면적은 확률을 의미한다. 2)오른쪽 꼬리 분포오른쪽에 긴 꼬리를 가지고 왼쪽으로 치우친 분포최빈값 < 중앙값 < 산술평균조화평균 < 기하평균 < 산술평균 3)왼쪽 꼬리 분포왼쪽에 긴 꼬리를 가지고 오른쪽으로 치우친 분포산술평균 < 중앙값 < 최빈값산술평균 < 기하평균 < 조화평균 **피어슨의 관계식변수가 정규분포하지 않을때,의 식을 따른다. 4)장단점 -산술평균, 기하평균, .. 2018. 12. 2.
대표값(1) 목차 대표값 1.대표값이란 2.산술평균 3.중앙값 4.최빈값 5.기하평균 6.조화평균 7.대표값들 관계 1.대표값이란=해당변수를 대변하는 값=중심경향값(Central Tendency Value)=위치의 통계량 1)의미와 종류 대표값은 중심값이라고도 하며, 데이터(변수)의 집중경향을 나타내는 통계적 수치이다.데이터가 정규분포할때, 모든 대표값들은 일치한다.정규분포 : 정상적인 분포기술통계에서 중요한 역할이며, 산술평균은 추측통계에서 매우 중요하다. 종류: 산술평균, 중앙값, 최빈값, 기하평균, 조화평균 2)목적확률표본으로부터 수집한 데이터를 도수분포표나 그래프로 정리한 후,대표값을 기준으로, 관찰값들이 얼마나 흩어져 있는지를 표현하는 산포도를 구할 수 있다. 2.산술평균(mean)개체의 관찰값을 모두 합하.. 2018. 12. 2.
표본추출과 데이터수집(2) 목차 표본추출과 데이터수집 1.전수조사와 표본조사 2.확률표본 3.확률표본추출 4.변수 5.유의숫자 4.변수 변수는 구분하는 방법에 따라 분류할 수 있다.훗날, 데이터 분석할때 필요한 중요한 개념이다. 1)척도에 따른 구분 높은 수준의 척도에서 낮은 수준의 척도로 바꿀 수 있다.척도의 수준이 높다 : 척도에 의해 얻는 수치(관찰값)가 많은 정보를 제공한다는 것을 말한다. (1)분류척도(norminal scale): 분류 변수(명목 변수): 단순히 분류가 가능한 변수이다.: 우열이나 크고 작음을 비교할 수 없다. (2)순서척도(ordinal scale): 순서 변수: 특성에 우열이나 크고 작음이 있다.: 두 관찰값을 빼거나 합하는 것은 아무런 의미가 없다. (3)간격척도(interval scale): 간격.. 2018. 12. 1.
표본추출과 데이터수집(1) 목차 표본추출과 데이터수집 1.전수조사와 표본조사 2.확률표본 3.확률표본추출 4.변수 5.유의숫자 1.전수조사와 표본조사 모집단에서 추출한 확률표본으로부터, 확률표본은 모집단을 대표한다. 표본은 반드시 무작위로 추출한다.유의표본일 경우 결과 값이 편향된 값으로 나온다. 1)전수조사(complete survey)대상 모집단에서 모든 개체를 관찰하여, 모집단의 특성을 파악하는 방법 관찰 비용과 시간이 많이 들고 정확성이 떨어진다. 무한 모집단은 현실적으로 불가능하다.이 한계를 극복하기 위해, 표본조사를 한다. 2)표본조사(sample survey)모집단에서 추출한 추출단위를 관찰하여, 모집단에 대해 추론하는 통계적 방법 이때 표본은 '확률표본'이어야 한다.확률표본은 랜덤(완전확률화)으로 추출된 표본을 말한.. 2018. 12. 1.
통계의 기본 개념(2) 목차 통계의 기본개념 1.통계학이란 2.통계 기본 용어 3.통계 기호 4.기술통계와 추측통계 5.추정과 가설검정 6.확률 7.확률분포 1.확률(probability) 같은 실험을 동일한 조건에서 무수히 많이 반복할때, 특정 결과가 나오는 비율 표본공간(sample space) : 실험에서 나타날 수 있는 모든 가능한 결과들의 집합사건(event) : 표본공간의 일부분(부분집합)을 의미하며 실험결과를 말한다. (시행(trial)과 같은 의미) 확률변수(random variable) : 일정한 확률을 가지고 나타나는 사건(실험결과)에 수치를 부여한 변수를 말한다. 확률표본에서 관찰된 변수 ex)동전의 앞이나올 확률과 뒤가 나올 확률은 1/2이다. 여기에 앞=1, 뒤=2 라는 수치를 부여하면 이 변수를 확률변.. 2018. 11. 20.
통계의 기본 개념(1) 목차 통계의 기본개념 1.통계학이란 2.통계 기본 용어 3.통계 기호 4.기술통계와 추측통계 5.추정과 가설검정 6.확률 7.확률분포 "통계학의 시작은 용어다." 1.통계학이란 집단의 특성(변수)에 대한 수적 자료(데이터)를 수집, 정리, 분석하고, 그 결과를 해석하는 이론과 방법을 체계화한 학문이다.불확실한 상황에서 일어나는 자연현상이나 사회현상을 과학적으로 분석, 예측하는 분석도구로서 널리 사용한다.21세기 정보화 시대에서 정보처리 수단으로서 통계적 방법의 중요성이 더욱 높아지고 있다.통계학을 학습하는데에는 통계의 기본개념을 나타내는 용어를 정확히 이해하는 것이 중요하다. 2.통계 기본 관찰대상 : 모집단을 구성하는 개체 또는 설문조사표의 각 문항을 말한다. (변수를 구하기 전 단계이다.)모집단 : .. 2018. 11. 14.