모집단 : 3차원 그래프(회귀평면 ) 표본 크기 50의 표본에 의한 회귀평면 추정(독립변수 간의 상관관계가 없을 때)표본의 와 추정된 회귀평면 표본의 과 에 큰 상관이 없다면 추정된 회귀평면은 상당히 정확합니다. 표본 크기 50의 표본에 의한 회귀평면 추정(독립변수 간에 높은 상관이 있을 때)표본의 와 추정된 회귀평면 과 의 상관이 커짐에 따라 추정된 회귀평면의 정확성이 매우 떨어짐을 알 수 있습니다. 그리고 이렇게 표본 회귀계수의 오차가 커지는 것은 1차 회귀식의 추정에서 독립변수의 범위가 제한되는 것과 비슷한 이유임을 그래프에서 알 수가 있습니다. 과 가 큰 상관을 보일 경우에 특정한 방향에서 자료를 보면 모든 자료가 한정된 범위 안에 분포되어 있습니다. 아래의 R 코드는모집단에서 그리고 크기 50의..
독립 변수의 범위를 제한함에 따라 생기는 회귀계수의 표집오차 증가 독립 변수의 범위를 제한함에 따라 생기는 회귀계수의 표본오차 증가 그래프 순서1 32 4 그래프 1) 모집단 , 그래프 2)이제 이 모집단에 표본크기 50의 표본을 추출하여 회귀계수를 추정해 봅시다. 표본은 추출할 때마다 달라지겠지만, 회귀선의 95% 신뢰구간은 다음의 그래프와 비슷합니다. 그래프 3)하지만 표본 추출시 독립변수의 범위를 로 제한한다면(표본크기: 50), 회귀선의 95% 신뢰구간은 다음과 같이 넓어집니다. 그래프 4)그리고 독립변수의 범위를 더욱 제한하여, 의 범위가 되게 한다면(표본크기: 50), 회귀선의 95% 신뢰구간은 다음과 같이 변화합니다. 이제 회귀선의 기울기에 대해서 양수인지 음수인지도 정확하지 않네요. 다음 ..
몬티 홀 문제에서의 확률과 신뢰구간에서의 확률을 비교해봅시다. 95%-신뢰구간에서 95%를 확률로 볼 수 없다고 말했습니다. 왜냐하면 모평균은 신뢰구간 안에 존재하던지, 존재하지 않던지 둘 중 하나이기 때문입니다. 그렇다면 몬티 홀 문제에서도 마찬가지 아닐까요? 카드를 바꾸면, 자동차를 선택 하던지, 그렇지 않던지 둘 중의 하나이지, 확률이 개입될 여지가 없습니다. 그렇다면 몬티 홀 문제에서 확률이 1/3에서 2/3에서 높아지는 것은 무슨 의미일까요? 그것은 우리가 두 가지 전략을 비교했을 때를 생각할 수 있습니다. 과 을 비교했을 때, 첫 번째 전략에서 자동차를 고를 확률은 2/3이고, 두 번째 전략에서 자동차를 고를 확률은 1/3입니다. 하지만 당면한 선택에서는 확률이 올라간다고 하긴 어렵겠죠. 왜냐..