우선 다중회귀의 문제점의 하나는 Panel Data 분석 우선 다중회귀의 문제점의 하나는,통제변수에 포함되지 않은 변수가 예측변수와 상관을 가지고 있을 경우,예측변수의 회귀계수에 영향을 미친다는 것입니다. 예를 들어, 원래 모집단의 회귀식이()일 때, 과 의 상관계수가 0.7이라면, 를 측정하기 않고 으로 회귀분석을 하면로 추정이 됩니다.(좀 더 알기 쉽게, 과 의 상관계수가 1이라고 가정한다면,로 추정됩니다. ) 이것은 과 의 높은 상관에도 를 측정하지 않았기 때문에 생기는 문제입니다. 만약 우리가 을 반복측정하고,만약 가 시간에 따라 변하지 않는 변수일 경우,이런 문제를 해결할 수 있습니다. 예를 들어, 원래 모집단의 회귀식이()라고 해봅시다. ( 여기서 주목해야 할 점은 위의 계수와 변수에서 sub..
집단별로 함수 적용하기1. 벡터(집단을 알려주는 벡터를 사용) v = 1:12 # 자료 g = c(rep(1,9), rep(2,3) # 집단 소속을 알려주는 벡터 # c(rep(1,9), rep(2,3))=c(1,1,1,1,1,1,1,1,1,2,2,2) tapply(v, INDEX = g, FUN=sum)# 집단 별로 구성원에 대해 sum을 적용 g2 = c(rep("M",9), rep("F",3)) # 또다른 벡터 : 집단 소속을 알려줌. tapply(v, INDEX = g2, FUN=mean) # g2에 따라 결정된 집단별로 구성원에 대해 mean을 적용 2. 매트릭스(행 또는 열별로 함수 적용) m=matrix(1:12, nrow=3) apply(m, FUN=mean, 1) # 같은 행끼리 appl..