알고리즘/통계학 2

평균, 기댓값, 분산, 기대효용

1. 평균과 기댓값 '평균' '기댓값'은, 아마도 통계에서 가장 먼저 접하고 가장 많이 쓰이는 용어일 것이다. 그럼에도 불구하고, 종종 "평균과 기댓값이 같은 건가?"라는 질문을 받으면, 헷갈린다. 확실히 알아보도록 하자. 예전에는, '기대값'으로 표기했으나, 이제는 '기댓값'이 맞다. 2008년부터, 수학 용어들도 표준 맞춤법의 사이시옷 규칙에 맞게 표기되도록 교과서가 개정되었기 때문. 같은 이유로 '최댓값' '최솟값' '대푯값' '근삿값' '절댓값' '함숫값' 등이 맞는 표기. 평균 (산술)평균은, 어떤 자료가 있을 때, 이 자료를 대표하는 값 중의 하나로, 모든 자료값을 더한 것을 자료의 개수로 나눈 값이다. N개의 자료가 있고, i번째 자료의 값을 xi라고 할 때, 평균 m(mean)은 다음과 같..

귀무가설, 가설검정, 1종오류, 2종오류, 검정력

계속해서 헷갈리거나 잊어버리는 개념이 귀무가설 관련 내용이다. "귀무가설을 기각했으므로.." "1종오류가 5% 이기에..." 이런 글을 갑자기 접하면... 생각의 흐름이 멈춰버린다. '확실히' 알아보자. 귀무가설(歸無假說), 키무카세쯔(帰無仮説), 零假设 영어로는 'a null hypothesis' 이다. hypothesis는 '가설'이라는 뜻이니깐 명확한데, null은? null은 '아무것도 없는; 아무가치 없는; 무효의' 등의 의미로, 어쨌든 '없는' 이란 성격을 가진 단어이다. 프로그래밍에서도 어떤 변수에 대해 초기값을 설정하지 않으면, 그 상태는 '의미 있는 값을 가지지 않는 = 의미 없는 쓰레기 데이터를 가질 수 있는' 널(null) 상태가 된다. 근데, 이런 'null'을 왜 '귀무(歸無)'라..