집단별로 함수 적용하기1. 벡터(집단을 알려주는 벡터를 사용) v = 1:12 # 자료 g = c(rep(1,9), rep(2,3) # 집단 소속을 알려주는 벡터 # c(rep(1,9), rep(2,3))=c(1,1,1,1,1,1,1,1,1,2,2,2) tapply(v, INDEX = g, FUN=sum)# 집단 별로 구성원에 대해 sum을 적용 g2 = c(rep("M",9), rep("F",3)) # 또다른 벡터 : 집단 소속을 알려줌. tapply(v, INDEX = g2, FUN=mean) # g2에 따라 결정된 집단별로 구성원에 대해 mean을 적용 2. 매트릭스(행 또는 열별로 함수 적용) m=matrix(1:12, nrow=3) apply(m, FUN=mean, 1) # 같은 행끼리 appl..
사후비교 혹은 다중비교를 자세히 설명한 우리나라 통계학 책은 찾아보기 힘듭니다.흔히 다중비교는 분산분석 F-검정 결과가 유의미해야만 실시한다고 생각하지만,꼭 그런 것은 아닙니다. 다중비교는 다중비교 자체로 단독으로 실시할 수 있습니다. 다중비교에서 가장 중요한 것은 오류율입니다. 흔히 다중성이라고 불리는, 여러 검증을 한꺼번에 실시하면서 전체적인 오류율이 증가하는 문제점이 있습니다. 이에 따라 다중비교에서는 오류율을 적정한 수준으로 통제해야 할 필요가 생깁니다. 오류율은 크게 약한 계통적 오류율, 강한 계통적 오류율, 그리고 거짓발견율로 구분해 볼 수 있고, 여러가지 검정 방법도 이렇게 통제하는 오류율에 따라 구분할 수 있다. 여기서 오류율은 영가설이 참일 때 오류율을 말하는 거죠. 그에 반해 Walle..
다음은 책 의 의 도입부로, 자료의 퍼진 정도를 나타내는 분산을 계산할 때, 왜 제곱을 하는지에 대한 내용이다. 주어진 값들의 퍼짐 정도를 나타내는 분산variance은 다음과 같이 구한다. 분산은 평균과 각 값의 차이를 제곱한 값들의 평균이다. 처음 분산을 배웠을때, 왜 제곱을 해야 하는지 의아했을 것이다. 물론 편차( ; 각 값에서 평균을뺀 값)를 모두 더하면 항상 0이 되므로, 편차의 평균은 항상 0이다. 그렇기에 편차의 제곱의 평균을 구한다고 설명할 수도 있지만 어딘지 꺼림직하다. 편차의 절대값(절대편차absolute deviation)을 평균할 수도 있지 않은가? 각 값과 평균의 편차의절대값을 평균한 값을 평균절대편차average absolute deviation라 하고 식은 다음과 같다.(AA..
지은이 : 김권현펴낸이 : 박문규펴낸곳 : 경문사ISBN 978-89-6105-710-3 알라딘Yes24교보문고경문사인터파크반디앤루니스 차례들어가기: 몬티 홀 문제: 이 책의 목적인 “이해하기”에 대한 예시수학이란 무엇인가?수학을 하는 방법컴퓨터의 활용 확률과 분포이산확률변수의 분포 표현하기확률 “밀도” 함수 이해하기확률밀도함수: 적분하면 확률이 된다확률질량함수와 확률밀도함수의 차이정규분포의 확률밀도함수 이해하기컴퓨터 대수학 시스템의 활용: 정규분포를 따르는 두 확률변수의 합의 분포두 정규분포의 합두 정규분포의 합: Sage의 활용 모분포와 표본분포왜 평균절대편차 대신 표준편차를 쓸까? 왜 중앙값이 아니라 평균인가?분포: 모분포 vs 표본분포위치측도와 산포측도: 정규분포와 라플라스 분포의 경우표본이 주어..