통계/실험 설계

09. 완전확률화블록설계와 균형불완비블록설계

hyebing_KIM 2024. 11. 21. 01:43

 

학부생이 공부하고 생각한 내용을 정리하는 블로그라 정확하지 않을 수 있으니 참고만 부탁드립니다!


안녕하세요 통계를 좋아하는 김혜빙입니다.

 

오늘은 블록설계에 대해서 알아보겠습니다. 

 

우선 블록이 무엇인지 알아봅시다.

 

실험을 설계하고 수행하는 과정은 다음과 같습니다. 

기본적으로 실험은 "실험단위" 에 "처리" 를 배치하고 반응값을 확인하는 과정입니다.

 

예를 들어 밭에 A,B,C,D 라는 회사의 비료를 뿌렸을 때 수확하는 콩의 개수를 비교하고 싶습니다.

 

처리는 A, B, C, D가 됩니다.

 

따라서 밭은 각 처리를 배치하기 위해 일단 4등분을 내야합니다.

그럼 A, B, C, D를 각각 1, 2, 3, 4라는 실험단위에 배치하면 되겠군요.

 

이때 1, 2, 3, 4라는 실험 단위가 동일할수도 있지만 다를 수 있기 때문에

최대한 객관성을 보장하기 위해 RANDOMIZATION을 진행합니다.

(즉 실험에 영향을 줄 수 있는 factors가 명확하지 않으므로 Uncontrollable 한 상황입니다.)

 

이때 밭에 정말 어이없게도 정부에서 저희 밭을 망치기 위해서 초대형 선풍기를 서쪽에 설치했다고 합시다.

 

초대형 선풍기

 

실험을 설계하는 입장에서 초대형 선풍기의 바람은 수확될 콩의 개수에 영향을 미칠 것 같습니다.

 

그렇다면 바람의 세기가 강한 구역과 약한 구역으로 나누어서 따로 데이터를 분석하면 좋겠군요. 

구역 분할

이것이 "블럭" 의 개념입니다.

 

"바람의 세기" 라는 factor가 명확하게 response variable에 영향을 미칠 것으로 생각했고 (명확한 요인)

 

원인이 명확하니 이를 하나의 변수로 취급하여 모델링 할 수 있게 됩니다. 

 

따라서 "바람의 세기" 는 Controllable factor 입니다. (변수 = factor 로 취급한다는 측면에서)

 

정리를 하자면

 

원인이 명확하다 -> 변수로 취급 가능하다 -> controllable factor -> blocking

원인이 명확하지 않다 -> 변수로 취급 불가능하다 -> uncontrollable factor -> randomization

 

이정도 흐름으로 해석 가능했습니다.

 

사실 원인이 명확하더라도, 자의적으로 변수로 취급하지 않으면 randomization을 하는게 맞습니다.

 

위 내용을 정리하면 다음과 같습니다.