본문 바로가기

통계 이야기

분산의 마법 어떤 현상이나 사실에 대해 그 것이 가지고 있는 본래의 그 무엇인가를 발견해 내기 위해 자료를 수집하고 분석한다. 데이타(data)의 홍수속에 살고 있는 이 시대에 그 data가 갖는 속성 중에 평균과 분산이라는 것이 있고 그 와 형태는 다르지만 분산의 자녀격인 표준편차라는 것이 있다. 잠깐 여기서 평균과 분산 그리고 표준편차에 대해 들여다보자. 평균(average, mean)평균이라는 개념은 산술평균, 기하평균, 조화평균 등이 있는데 이 중에 보통 평균이라 하면 산술평균을 의미한다. 분산(Variance)이란 하나의 변수가 갖는 평균에서의 흐트러짐의 정도라 정의할 수 있다. 확률변수 X의 분산 (variance) 또는 X의 확률분포의 분산은 g(X)=(X−μ)의 평균으로 나타내고 Var(X) 또는 σ2.. 더보기
모집단과 표본 통계(Statistics)라는 것은 '어떤 현상을 종합적으로 한눈에 알아보기 쉽게 일정한 체계에 따라 숫자로 나타냄. 또는 그런 것'이라고 표준국어대사전에 정의되어 있다(https://stdict.korean.go.kr/m/search/searchView.do) . 국립국어원 표준국어대사전 stdict.korean.go.kr 쉽게 말하면 농부가 벼, 고구마, 양파, 마늘, 고추농사를 한다고 하자. 해마다 종류마다 들어가는 종자의 양과 수확되어질 양을 미리 예측 가능하다. 반대로 올 해 쌀 100가마를 수확하기 위해서는 논 몇 마지기에 모 몇 판을 심어야 될지를 계산한다. 이러한 계산이 가능한 것은 어찌보면 수학의 공이라 할 수 있다. 그렇다. 수학적으로 계산해서 몇 포기 심어 몇 가마 수확했다는 것은 산.. 더보기
IPA분석과 ISA분석 Martilla와 James(1977)에 의해 처음으로 시작된 분석방법이 IPA(Importance-Performance Analysis)이다. 마케팅 분야에서 특정 회사의 제품에 대한 고객의 만족도를 파악하기 위하여 성과 개념의 성취도(performance)를 대신하여 만족도(satisfaction) 개념을 통한 ISA(Importance-Satisfaction Analysis)분석이 폭넓게 활용되었으며, 행정, 사회복지 그리고 정책 분야에서 만족도와 중요도를 측정하기 위하여 널리 활용되고 있다(김경대·이규환, 2015; 양영철 외, 2016). IPA 방법은 일반적으로 평균값을 기준으로 4사분면의 매트릭스 분석기법이다. 그런데 평균값을 통하여 만족도와 중요도를 측정할 경우 만족도의 평균을 기준으로 4.. 더보기
마음을 표현하는 수, 변수 오늘은 변수에 대한 이야기를 하고자 한다. 변수(variable)란 한자로는 變數라고 하고 常數(Constant)와 대조되는 말로 쓰인다. 다른 표현으로는 고정된 수, 즉 상수가 아닌 고정되지 않는 수를 일컫는 변수를 알아 무엇을 한다는 말인가? 고정되지 않는 수, 다시 말하면 미지수(未知數), 알 수 없이 항상 변하고 변할 수 있는 수이기에 이 변화 가능한 수에서 무엇인가를 찾아낸다는 것이 쉬운 일은 아닐 듯 하다. 변수는 변하는 수이지만 변할 수 있기에 자연과학의 범주가 아닌 사회과학, 인문학, 철학, 심리학 등의 연구주제에 대한 측정가능성을 높여줌과 동시에 예측가능한 방법론이 나오기 시작했으니 이 어찌 고마운 수가 아니겠는가? 상수라는 개념도 어찌보면 고정된 수라고 만 할 수 있겠는가? 더 깊이 들.. 더보기
공분산에 대해 상관분석은 두 변수 간에 어떤 선형적 관계를 가지는지를 분석하는 기법으로 상관계수를 이용하여 측정한다. 상관분석을 이해하기에 그 기초가 되는 분산과 공분산에 대해 알아보자. 평균(E, μ)이라는 개념의 설명은 생략하기로 하자. 우선 분산(Variance)은 1개의 ‘확률변수가 갖는 평균과 그 평균에서 벗어난 개개 원소들의 흐트러짐의 정도’를 의미하고 공분산(Covariance, Cov)은 2개의 확률변수의 상관 정도’를 나타내는 값이다. 위 그림 (a)는 양의 상관관계, (b)는 음의 상관관계, (c)는 무상관을 보여준다. 분산이란 하나의 변수가 갖는 평균에서의 흐트러짐의 정도라 정의할 수 있다. 확률변수 X의 분산(variance) 또는 X의 확률분포의 분산은 g(X)=(X−μ)의 평균으로 나타내고 V.. 더보기