국민의 더 안전하고 건강한 삶을 위한
건강기능식품 플랫폼

  • 통합검색
  • 인정현황
  • 내게맞는실험법
  • 기능지표성분분석법
  • top

인지능력개선

인체적용시험

제목 통계
구분 인지능력향상 링크 인체적용시험 설계
내용

1. 통계 추론

1) 모집단과 표본

- 모집단은 연구자가 연구대상으로 하는 모든 개체들의 집합으로 최종적으로 관심을 가지는 집단이다. 

- 표본은 모집단의 성질을 파악하기 위하여 선택된 모집단의 일부로 표본으로부터 얻은 결과로 모집단의 성질을 추론하게 된다. 그러므로 표본을 선택하기 전 모집단의 범위를 명확하게 명시하여야 하며 표본은 모집단의 성질이 잘 반영되고 편의를 보이지 않도록 추출하여야 한다. 

 

2) 모수와 통계량

- 모수는 모집단의 특징을 나타내는 척도로 이를 추정하고 이의 성질을 파악하는 것이 통계분석의 목표이다. 

- 모수를 추정하기 위하여 표본으로부터 계산한 값을 통계량이라고 한다. 모든 통계분석을 통계량으로부터 시작되며 이를 통하여 모수의 성질을 파악하게 된다. 

 

3) 가설검정

- 가설검정은 알려지지 않은 모수에 대한 주장이나 추측이 옳고 그름을 판단하는 과정으로 통계적 가설검정을 위해 귀무가설과 대립가설을 세우게 된다. 

- 귀무가설은 대체로 기존의 학설이나 주장으로 연구자가 기각하고자 하는 가설이 된다. 

- 대립가설은 연구자가 입증하고자 하는 가설, 즉 기존의 학설이나 주장에 반대되는 가설이다. 모든 통계적 가설검정은 귀무가설이 사실이라는 가정 하에서 이루어진다. 

 

4) 검정의 종류검정의 종류는 크게 다음의 세 가지로 나눌 수 있다. 

 

ㄱ.  차이검정

시험군과 대조군에서 건강기능식품의 기능차이가 있는지를 보기 위한 검정으로 μt를 시험군에서의 기능성 평가변수의 평균값, μo를 대조군에서의 기능성 평가변수의 평균값이라 할 때 차이검정에 대한 귀무가설 H0과 H1 대립가설 은 다음과 같다. 


 

ㄴ. 비열등성/우월성

비열등성/우월성 검정은 시험군의 효과가 대조군보다 열등하지 않다/우월하다를 보이는 검정으로 귀무가설과 대립가설은 다음과 같다. 


여기서 δ>0이면 δ는 우월성에 대한 마진(superiority margin)으로 시험군의 효과가 대조군보다 δ만큼 더 우월하다는 것을 보이는 우월성 검정이 된다. 만약 δ<0이면 δ는 비열등성에 대한 마진(non-inferiority margin)으로 시험군의 효과가 대조군보다 δ만큼은 떨어지지 않는다는 것을 보이는 비열등성 검정이 된다. 

 

ㄷ. 동등성

동등성 검정은 시험군과 대조군의 효과 차이가 동등하다는 것을 보이는 검정으로 귀무가설과 대립가설은 다음과 같다.

 

여기서 δ는 동등성에 대한 마진(equivalence margin)으로 시험군과 대조군의 효과 차이가 δ보다 작은지를 보이는 동등성 검정이다. 즉, δ만큼의 차이는 동등한 것으로 인정하고 δ이상의 차이는 동등하지 않은 것으로 보는 것이다.

 

4) 검정의 결론

- 귀무가설과 대립가설을 세운 후 적절한 검정방법을 통하여 두 가설 중 하나를 선택하게 된다.

-  모든 검정은 귀무가설이 사실이라는 가정하에서 이루어지므로 항상 귀무가설을 중심으로 표현을 하게 된다. 즉, “귀무가설을 기각한다”, 혹은 “귀무가설을 기각하지 못한다” 중 하나를 선택하게 되는 것이다. 

-  “귀무가설을 채택한다” 라는 표현 대신 “귀무가설을 기각하지 못한다” 라는 표현을 사용하는 이유는 가설검정을 하는 목적이 귀무가설을 기각하고 연구자의 새로운 주장이 맞다는 것을 보이기 위함이므로 지금까지 얻은 자료는 귀무가설을 기각하기에 충분하지 못하므로 지금은 귀무가설을 기각하지 못하지만 추후 더 많은 자료(증거)를 확보하면 귀무가설을 기각할 수 있을 것이라는 의미를 함축하고 있는 것이다. 

 

5) 오류

- 가설검정 시 발생할 수 있는 두 가지 오류는 H0가 참일 때 H0를 기각하게 되는 것과 H0가 거짓임에도 불구하고 H0를 기각하지 못하는 경우이다. 

- 첫 번째의 오류를 제 1종 오류, 두 번째의 오류를 제 2종 오류라고 한다. 

- 제 1종 오류는 잘못된 판단으로 인하여 기존의 학설이나 주장을 새로운 학설로 바꾸는 심각한 오류로 모든 가설검정에서는 유의수준이라는 한계를 두어 제 1종 오류가 유의수준을 넘지 않도록 조절한다. 

- 제 2종 오류는 인체적용시험을 시작하기 전 피험자수를 통하여 조절하게 된다. 

 

6) 유의확률(p-value)

- 유의확률은 주어진 자료에서 귀무가설이 기각될 수 있는 최소의 유의수준으로 자료로부터 얻어진 통계량이 귀무가설하의 분포를 따를 가능성을 계산한 것이다. 

- 그러므로 유의확률이 크다는 것은 얻어진 통계량이 귀무가설하의 분포를 따를 가능성이 크다는 이야기로 주어진 자료는 귀무가설하의 분포를 잘 설명하고 있으므로 이때는 귀무가설을 기각할 수 없게 된다. 

- 그러나 유의확률이 작다는 것은 귀무가설하의 분포를 따를 가능성이 작다는 뜻으로 귀무가설 하의 분포를 잘 설명하지 못하고 있으므로 이때는 귀무가설을 기각하게 되는 것이다. 

 

2. 변수의 종류

1) 변수는 크게 연속형 변수와 범주형 변수로 나눌 수 있다. 

- 연속형 변수는 혈압, 혈당량, 체중 등의 실수값을 갖는 변수를 말하며

- 범주형 변수는 생사여부, 질병발생여부, 흡연여부 등 두 가지 범주 중 하나의 값을 갖는 변수를 말한다. 이러한 변수의 형태에 따라 자료의 요약 방법이 달라진다. 

2) 변수가 통계분석에서 가지는 의미에 따라 독립변수와 종속변수로 나눌 수 있다. 

- 독립변수는 연구자가 결과의 변화를 관찰하기 위해 이용하는 변수로 설명변수, 예측변수라고도 불린다. 

-  종속변수는 인체적용시험의 결과를 나타내는 변수로 관심대상이 되는 변수이다. 이는 반응변수라고도 불린다. 독립변수와 종속변수의 종류와 형태에 따라 통계분석방법이 달라지게 된다. 

 

3. 자료 요약

1) 연속형 변수

연속형 변수의 경우 중심에 대한 척도, 퍼짐에 대한 척도 등으로 자료를 요약하게 된다. 

 

ㄱ. 자료의 중심에 관한 척도

- 평균 : 자료값들의 합을 총 표본수로 나눈 것

- 최빈값 : 가장 자주 나오는 자료값- 중앙값 : 크기순서로 정리된 자료값들 중 가장 가운데에 위치한 값

 

ㄴ. 자료의 위치에 관한 척도

- 100p번째 백분위값 : 크기순서대로 정리된 자료값들에서 적어도 100p%의 자료값들이 이 값 이하이며 또 적어도 100(1-p)%의 자료값들이 이 값 이상인 값

- 사분위값 : 25의 배수가 되는 백분위값 

 제1사분위값 : 25번째 백분위값  

 제2사분위값 : 50번째 백분위값, 중앙값  

 제3사분위값 : 75번째 백분위값

 

ㄷ. 자료의 퍼짐에 관한 척도

- 범위 : 최대값 - 최소값

- 분산 : 평균으로부터의 편차 제곱합을 표본수-1로 나눈 것

- 표준편차 : 분산의 제곱근

- 사분위범위 : 제3사분위값 - 제1사분위값

 

2) 범주형 변수  

범주형 변수는 각 범주의 빈도, 분율(%) 등을 구하여 빈도표의 형태로 정리한다. 

 

4. 변수의 종류에 따른 통계분석방법 및 해석 

 

 

종속변수형태

독립변수형태

모수적 통계분석방법

비모수적 통계분석방법

연속형

범주형(2범주)

이표본 t-test

Wilcoxon rank sum test

Mann-Whitney U test

연속형

범주형(3이상 범주)

분산분석

Kruskal-Wallis test

범주형

범주형

Chi-square test

 

연속형

연속형

회귀분석, 상관분석

Spearman`s correlation

연속형

연속형 + 범주형

공분산분석

 

범주형(2범주)

연속형 + 범주형

로지스틱 회귀분석

 

 

1) 이표본 t 검정

- 시험군과 대조군, 두 군의 평균을 비교하는 데에 쓰이는 검정으로 

- 각 집단의 해당변수가  정규분포를 따른다는 가정 하에서 시행하는 검정으로 검정통계량은 다음과 같다.

  

2) 짝지어진 t 검정

- 하나의 모집단에서 두 가지 다른 조건하에서 자료를 얻은 경우 두 독립적인 모집단이 아닌 짝지어진 표본이 된다. 

- 이 경우에는 피험자에 대하여 각각 두 조건 하에서의 변수 값의 차이를 구하여 이 차이가 0인지에 대한 검정을 하게 된다. 이때의 검정통계량은 다음과 같다.


    

3) 분산분석

- 세 군 이상의 군간 비교에 쓰이는 검정으로 각 군의 평균이 같은지 다른지를 검정하게 된다. 

- 이때의 검정통계량은 다음과 같다.


 

4) 카이제곱검정

- 서로 독립적인 두 범주형 변수의 연관성을 알아보기 위한 검정

- 두 변수가 서로 독립이라는 가정 하에서 각 범주의 기대도수를 구하고 실제 자료와 차이가 얼마나 있는지를 검정통계량으로 사용한다. 


5) McNemar 검정

- 동일 모집단으로부터 같은 특성을 사전/사후와 같이 두 번 측정한 경우 이 두 번 결과의 연관성을 알아보기 위한 검정으로 특성은 유/무와 같이 두 가지 중 하나로 나타낼 수 있는 특성이어야 한다.

- 위의 카이제곱검정과는 다른 형태의 검정통계량을 사용한다. 자료의 형태와 그에 따른 검정통계량은 다음과 같다. 

 

 사후

사전

a

b

c

d

 


 

6) Pearson 상관계수

- 두 연속형 변수의 선형관계를 알아보기 위한 값으로 -1과 1사이의 값을 갖는다. 

- -1에 가까우면 두 연속형 변수는 음의 상관관계를 갖고 이는 한 변수의 값이 증가함에 따라 다른 변수의 값이 감소함을 의미한다. 

- 1에 가까우면 양의 상관관계를 갖는다고 하고 이는 한 변수의 값이 증가함에 따라 다른 변수의 값도 함께 증가함을 의미한다. 

- 0에 가까우면 두 변수는 상관관계가 없음을 의미한다. 단 p-value<0.05인 경우에만 산출된 상관계수가 유의하다고 해석하여야 한다.

 

7) 회귀분석

- 관심이 있는 반응변수(y)를 설명변수(x)들의 직선관계로 설명하는 분석법으로 설명변수가 하나인 경우 y=a+bx 형태의 함수식으로 나타내는 것이다. 

- b는 x가 한 단위 증가할 때 y의 변화량을 나타내는 것으로 b의 부호가 양수이면 x와 y는 양의 상관관계를, b의 부호가 음수이면 x와 y는 음의 상관관계를 갖는 것이다. 

- x가 y를 설명하는데에 영향을 미치지 못한다면 b는 0에 가까운 값을 갖게 된다. 

- 결정계수는 반응변수의 총 변동 중 회귀직선으로 설명할 수 있는 부분의 비율을 나타내는 것으로 설명변수가 하나인 경우 결정계수는 반응변수와 설명변수간의 상관계수를 제곱한 값이 된다. 

 

8) 공분산분석

- 공분산분석은 회귀분석과 분산분석을 합쳐놓은 형태로 회귀분석에서 범주형인 설명변수가 있는 경우가 된다. 

 

9) 반복측정자료분석

- 여러 군 내에서 시간에 따라 얻어진 자료에 대하여 각 군별로 시간에 따른 변화 추이를 비교하고자 할 때 사용하는 분석으로 위에서 설명한 일원분산분석보다 좀 더 복잡한 형태의 분산분석이 된다. 

 

5. 인체적용시험 자료의 통계 분석 시 고려사항

1) 분석군 

- 인체적용시험에 참여할 연구대상자는 인체적용시험계획서에 명확하게 명시되어 있어야 하며 통계분석은 이에 따라 분석대상자가 정해지게 된다. 현재 인체적용시험에서 주로 고려되고 있는 분석군은 ITT 군과 PP 군이다.

- ITT(intention to treat): 인체적용시험 진행에 관계없이 인체적용시험 초기에 선정되어 무작위 배정을 받은 상태를 그대로 유지한 분석군으로 중도에 탈락한 대상자도 모두 분석에 포함된다. 

- PP(per protocol): 인체적용시험 진행상황을 고려하여 인체적용시험계획서에 제시되어 있는 절차를 모두 마친 대상자만을 선정한 분석군 

 

2) Missing data 처리

- 인체적용시험을 진행하다 보면 결측치가 생기게 된다. 이는 통계분석시 편향을 일으키는 원인이 된다. 그러므로 인체적용시험 진행 시 가능한 결측치를 최소화 하도록 노력하여야 한다. 

- 결측치가 발생한 경우를 대비하여 결측치를 포함하여 분석하는 방법을 사전에 인체적용시험계획서에 제시하여야 한다. 결측값을 처리하는 다양한 방법들이 있으며 이에 따라 분석결과는 달라질 수 있으므로 이를 충분히 검토하여야 한다. 

- LOCF(last observation carried forward): 각 개체 내의 결측치를 마지막 관찰값으로 대체하는 방법으로 인체적용시험에서 가장 흔하게 사용되는 방법이다. 그러나 최근의 연구결과들은 이 방법의 문제점들을 밝히고 있다. 

- Complete case analysis: 모든 변수들이 관측된 개체들만 이용하여 분석하는 방법으로 상당부분의 자료 누락이 있을 수 있으며 특히 결측치가 많은 경우는 비효율적이 된다. 

- Likelihood-based method: 결측치를 고려한 우도를 찾아 이를 최대화 하는 추정치로 결측치를 대체하는 방법이다.

- Imputation: 결측값을 얻어진 값들과 통계모형을 이용하여 추정, 이를 대체하는 방법으로 이를 추정하는 다양한 방법들이 개발되어 있다.   

 

3) Outlier처리

- 이상치가 있는 경우 분석 결과에 큰 영향을 미칠 수 있으므로 이에 대한 신중한 검토가 필요하다. 

- 먼저 이상치에 대한 정의는 통계적인 관점 뿐 아니라 임상적 관점에서도 논의되어야 하며 이에 대한 기준 및 처리방법 또한 인체적용시험계획서에 제시되어야 한다. ​ 

 

참고문헌
목록보기
제목 링크 인체적용시험 설계
실험재료
필요장비 및 소모품
 
필요시약
 
실험방법
실험결과 예
결과해석
참고문헌
첨부파일
목록보기