머신러닝/통계

통계 - DOF(자유도)

aiemag 2021. 3. 26. 21:25
반응형

통계 표본에서 자주 다루는 용어인 DOF(Degrees Of Freedom, 자유도)에 대해 정리합니다.

 


DOF(Degrees Of Freedom)

Definition

통계적 추정을 할 때 표본자료 중 모집단에 대한 정보를 주는 독립적인 자료의 수를 말함.

 

크기가 n인 표본의 관측값(x1,x2,...,xn)의 자유도는 n-1이다.

 

표본 분산 S2=1n1i=1n(XiX)2 에 대해, X=1ni=1nXi 임.

 

여기서 X는 모집단의 평균μ의 추정치이기 때문에 자유도는 1 적은 n-1이 됨.

 

 

E[S2]=E[1n1i=1n(XiX)2]

 

=1n1E[i=1n(XiX)2]

 

=1n1E[i=1n((Xiμ)+(μX))2]

 

=1n1E[i=1n((Xiμ)2+2(Xiμ)(μX)+(μX)2)]

 

=1n1E[i=1n(Xiμ)2+i=1n2(Xiμ)(μX)+i=1n(μX)2]

 

=1n1E[i=1n(Xiμ)2+2(Xμ)n(μX)+n(μX)2]

 

=1n1E[i=1n(Xiμ)2n(Xμ)2]

 

이 때,

 

E[(Xiμ)2]=σ2

 

E[(Xμ)2]=V[X]=σ2n

 

자 이제 다시 정리하면

 

1n1E[i=1n(Xiμ)2n(Xμ)2]=1n1i=1nE[(Xiμ)2]n(E[(Xμ)2])

=1n1(nσ2nσ2n)=σ2

 

따라서 표본분산의 기댓값이 모분산이라고 할 수 있음, 그래서 n-1을 분모에 사용.

 

E(S2)=σ2

 

S2=1n1i=1n(XiX)2

 

 


역학에서의 DOF

Definition

어떤 물체의 상태를 표시할 수 있는 최소한의 독립된 변수의 수를 말함.

 

Mobility라고도 함.

 


Reference

ko.wikipedia.org/wiki/%EC%9E%90%EC%9C%A0%EB%8F%84_(%ED%86%B5%EA%B3%84%ED%95%99)

ko.wikipedia.org/wiki/%EC%9E%90%EC%9C%A0%EB%8F%84_(%EC%97%AD%ED%95%99)

angeloyeo.github.io/2020/03/23/sample_variance.html

 

반응형

'머신러닝 > 통계' 카테고리의 다른 글

통계 - T test  (0) 2021.03.26
통계 - Expectation E(X)  (0) 2021.03.24
통계 - Likelihood  (0) 2021.03.24
통계 - Statistical Estimation  (0) 2021.03.20
통계 - Random Variable, Probability Distribution, PDF, CDF, PMF, CMF  (0) 2021.03.13