통계/실험 설계

7. 직교 대비는 왜 하는 걸까?

hyebing_KIM 2024. 11. 14. 11:31

학부생이 공부하는 과정을 담은 것이라 뇌피셜이 많습니다. 참고만 부탁드립니다!

 

두괄식으로 말하자면 

 

직교대비는

 

1.  각 대비에 대해 가설검정을 진행할 수 있다.

2.  처리제곱합을 대비제곱합으로 분해하여 어떤 대비의 영향력이 큰지 확인할 수 있다.

 

위 두가지 장점을 활용하기 위해 실시한다.

 

 

직교 대비를 하는 이유

 

SST(sum of squared treatment = 처리제곱합)은 카이제곱 (df =2 ) 를 따른다.

이는 대비 제곱합으로 나뉘게 되고 (C1, C2 의 제곱 합) 각각 카이제곱 (df = 1)을 따른다.

 

이는 곧 검정통계량 F분포를 따르게 만들 수 있고 이에 따라 가설검정을 진행할 수 있게 된다.

 

그니까

 

처리제곱합은 각 처리 중 하나라도 효과가 유의미한 처리가 있는지 확인하는거고

대비제곱합은 그 처리 중 어떤 처리가 유의미한지 확인하는 과정이다.

 

t-test를 여러번 할 필요 없이 간단하게..!?

 

그럼 이제 노가다를 줄여주는 (직교)대비제곱합에 대해 알아보자.

 

 우선 대비들의 직교 여부를 판단하기 위해 다음과 같은 flow chart를 따른다.

두 대비가 직교 대비임을 확인하는 수식

 

1. 평균인지 아닌지 따지고

 

2. 균형자료인지 불균형자료인지 따지고

 

직교여부를 확인하는 수식을 결정할 수 있다.

 

만약 k개의 처리가 있을 경우, k-1개의 대비가 서로 직교한다면 

 

SST는 k-1개의 대비제곱합으로 표현이 가능하다.

 

 

이하는 평균에 대한 균형, 불균형 자료에 대한 예시다. 

평균? 에서 라이언을 따라가면 된다!

 

 

그중에서도, 균형자료인지 불균형자료인지에 따라 대비제곱합의 각 term을 계산하는 방식이 달라지는데 살펴보자.

 

우선 불균형자료에 대해서 알아보자.

 

불균형 자료를 사랑하는 라이언

 

ni =/ n

계산식이 다음과 같다. 뭔가 직교대비를 위한 조건에서, di대신 ci를 넣는 느낌이다.

 

그런데 불균형자료가 그렇듯 ni 때문에 계산이 힘들다. 심지어 분모에 있어서 더더욱 계산이 매우 복잡하다.

 

그렇다면 균형자료는 어떨까?

 

라이언을 따라가보자.

 

ni = n

 

근데 사실 n이 같은 경우엔 평균을 낼 때 같은 n으로 나누기 때문에

 

summation 밖으로 n을 빼는 것이 굉장히 수월하다.

 

그럼 굳이 복잡한 평균식을 안 쓰고 식 변형(n을 곱함)을 통해서 새로운 대비 D를 만들 수 있음.

 

그리고 D에 대한 대비제곱합을 만들고(이는 위 수식에서 보다싶이 평균 NO!) , 곱했던 n을 나눠주기만 하면 대비제곱합 완성

 

계산상, 저런 변화가 있었다.

 

음 사실 크게 중요한 내용은 아닌듯 싶음..

 

결론적으로는

 

ANOVA 이후, 사후검정을 직교대비로 만들면 쉽게할 수 있다는 그런 결론인 것 같다.