분석 측정에서의 통계학, 표준 편차와 F Test

과학/분석화학 2016. 4. 6. 01:25

저번 글에서도 알 수 있다시피, 실험과 계산에 대해서 포스팅을 하였다

실험은 측정과 샘플링부터 무게와 부피를 측정하기 위한 실험도구들과 읽는 법, 계산에서 신뢰 구간에 포함되는 유효 숫자로 오차를 최대한 줄이는 것에 대해 설명하였다

이번에는 통계학에 대해 포스팅을 할 것인데 지금까지 했던 내용들은 introduction 이라고 생각하면 된다

통계학은 첫번째로 정상 잣대를 판별하는 것이며 두번째로 모집단으로 전체 집단의 대표성으로 통계를 이해하는 것이다

이들은 표본 샘플이 많을수록 가우스 분포(Gauss Distribution)이 증가하게 되며 근접하게 된다면 전체 집단을 대표할 수 있게 된다는 것이다

예시로 오늘은 2016년 4월 6일인데 정확히 다음 주이면 2016년 4월 13일로 국회위원을 선거하는 총선이 실시되어진다

여기에서 여당인 새누리당이 몇퍼센트의 지지도를 가지는지, 야당인 더불어 민주당, 국민의당 혹은 타 정치 집단들의 지지도를 측정하는데에 어떻게 이 지지도를 분석하였는지는 이 통계학에 있다

모집단으로 여론조사를 실시하여 여론조사에 응한 당 지지자들을 샘플로 통해 전체집단의 대표성을 가질 수 있을 만큼의 샘플을 가지게하는 것이다

이런 통계학은 의료보건분야와 환경과 먹거리에도 사용되어지는데 의료 보건 분야에서는 진단 측정과 의약품 품질이 예시가 있다

해당 먹거리, 환경, 진단과 측정, 의약품에 대한 품질이 정상 범주에 벗어나는가, 들어오는가를 판단하는 잣대이며 보편적으로 95%를 신뢰 범주로 하지만, 디테일하게 살펴야하는 진단과 측정에서는 99%를 신뢰 범주로 갖는 것이 대부분이다

이러한 디테일은 신뢰 범주에 있어 Critical Range로 변함으로써 주의해야한다

통계에 들어가기 전, 측정의 오차에 대해서 설명해본다

통계적 방법론의 필요성으로 모든 가능한 오차를 측정할 수 있다는 것이 고려되어야 분석결과를 신뢰할 수 있다

오차를 측정한다는 건 신뢰도가 있는 오차까지만 이라는 것이다, 참값은 신만이 아는 것이라고 생각하면 된다

필요성으로 또한 검정곡선(Calibration Curve)이 일상적으로 적용된는 점, 그리고 측정이 반복된 후에는 통계적인 자료를 이용하며 가설에 근거하여 표본추출을 하고 테스트 하는 것으로 품질 보중 결과 확보에 필수적이다

사진상에서는 무한한 데이터를 기반으로한 모집단의 표준편차 그래프이다

일반적인 유한한 데이터에서의 가우스 분포에서는 분포의 중앙이 평균(Mean or Average

)이라 하며 x̅, 무한한 데이터에서는 모집단 평균(Population mean)이라 하며 μ (뮤, mu)라 쓴다

또한 유한한 데이터에서의 분포의 폭, 분산의 척도를 나타내는 것은 표준편차(Standard Deviation)이라고 하며 s, 무한한 데이터에서는 모집단 표준편차(Population Standard Deviation) 이라고하며 σ(시그마, sigma) 라 쓴다

표준편차에서 (n-1)은 자유도(degrees of freedoms) 라고 한다

또한, 표준 편차의 제곱(s^2)는 가변도(Variance)라고 한다

이렇게 얻어낸 표준편차로 F 시험(F Test)를 하여 95%의 신뢰도로 신뢰할 수 있는지 없는지 가설을 검증해 낼 수 있다(Hypothesis Test)

F 테스트란 실험적 부정확함이 있을때, 두 실험간의 측정에 있어 평균값들이 통계적으로 다른지 확인하는 방법이다

이는 원래의 기기와 대체된 기기의 측정 가변도(Variance)의 비율을 확인하여 비교하는 것이다 F test=s1^2/s2^2 로 표시하며 표준값이 분모, 측정값이 분자이다

이 F Test 값과 자유도(n-1)로 F test 계산값과 F tset 표값을 비교하여 Significant 와 Not Significant인지 알 수 있다

95% 신뢰 수준에서의 F = s1^2/s2^2 (s1과 s2의 자유도) 의 임계값 표

(이미지 출처 : https://metrology.files.wordpress.com/2009/09/fdist95.gif)

만약 F Test 계산값이 F Test 표값보다 작다면 ( F 계산값<F 표값) not Significant(Not S)이며 그 반대는 Significant (S) 이다

다음 글은 F Test 를 통한 신뢰구간, Student의 T, T Test 그리고 Grubbs 시험, 교정 곡선에 대한 글을 쓸 것이다

분석 측정에서의 통계학, Grubbs 시험과 최소 제곱법 (0)	2016.04.06
분석 측정에서의 통계학, 신뢰 구간과 T Test (0)	2016.04.06
수학적 소도구, 유효 숫자와 오차, 정밀도와 정확도, 그리고 불확정성 (0)	2016.03.26
분석화학에 쓰이는 실험 도구들 (1)	2016.03.26
분석 저울, 전자식 저울과 기계식 저울 (0)	2016.03.26

작은 블로거

생명과학, 화학에 대해 공부하는 블로그

티스토리툴바