독립 변수의 범위를 제한함에 따라 회귀 계수의 표본오차가 증가함을 보았습니다. 하지만 만약 데이터가 굉장히 많다면 독립 변수의 범위가 제한되어 있음에도 굉장히 정확하게 회귀 계수를 추정할 수 있습니다. 위의 그래프에서 왼쪽은 표본의 독립변수의 범위가 굉장히 제한되어 있지만 표본의 크기를 50, 500, 5000으로 증가함에 따라 추정된 회귀선의 정확성이 높아지고 있음을 볼 수 있습니다. R source par(mfcol=c(3,2)) x index #======= Small Data : samplesize 50 index=which(x_pop>55-2*5 & x_pop index #======= Sampling, range restriction index=which(x_pop>55-2*1 & x_pop ..
차기작 : R을 배우자
2014. 1. 5. 10:54
다중 회귀 분석시 표본의 최소 크기
다중 회귀 분석에 필요한 표본의 크기에 대해서는 의견이 분분합니다. 독립변수의 개수를 k라고 할 때, 어떤 사람은 15k를 요구하기도 하고, 40+k를 최소로 생각하는 학자도 있습니다(Howell, 2002).Tabachnick and Fidell(1996)에 따르면,다른 학자는 각각의 독립변수의 회귀계수의 유의미성을 검증하기 위해서104+k를 요구합니다. 어떤 기준을 선택해야 할지 잘 모를 경우에는 여러 기준의 최대값을 사용하기 바랍니다. /Understanding and Using Advanced Statistics(Jeremy Foster et al., 2006)
차기작 : R을 배우자
2013. 12. 28. 21:17