통계 잘 하시는 분??
음... 지금 자료가 2X2X2 분할표 구조를 갖고 있어서, 이걸 분석하고 있는데 구조는 다음과 같다. 요인 A가 2수준(1과 2), 요인 B도 2수준(1과 2)이고, 변수 3은 이 결과로서 나타나는 결과가 Yes / No로 나타나는 각각의 사례 수인데(그러니까 두 요인에 의해 이항분포의 모수가 변하는지 보고 싶은 형태다), 이걸 몇 개의 집단에 대해서 각각 실시를 했다.
각각의 집단에서 얻은 결과를 대상으로 검정을 실시했을 때는, 요인 B와 변수 3과의 상관관계만 유의미한 것으로 나타나는데, 각각의 집단에서 얻은 결과를 모두 합쳐서 검정을 실시하면 요인 A와 변수 3, 요인 B와 변수 3의 상관관계가 유의미한 것으로 나타난다. 이게 보고 싶었던 결과이기도 하고, 처음에는 샘플 수가 늘어나면서 약했던 상관관계가 눈에 보이게 된 건가 싶었는데, 생각을 해 보니까 점점 이게 그런 게 아니라 Simpson's paradox같은거다.
의심은 가는데 어떻게 확인을 해 보아야 할 지 난감해서(2X2 분할표에서는 확인하는 법을 알겠는데, 아시다시피 2X2X2 분할표라는 게 워낙 난감해서... 결국에는 각 집단을 요인 C로 놓고 2X2X2Xn 분할표로 처리해야 할 것 같은데, 이게 되는감?) 이렇게 질문!
혹시 범주형 자료분석 잘 하시는 분 있으면 도와주시길!
Posted by 충원