(개정판!)R로 하는 빅데이터 분석: 데이터 전처리와 시각화 제목 : R로 하는 빅데이터 분석(개정판) | 출판사 : 숨은원리 지음 : 김권현 / 가격 : 25,000원 / 판형 : 176x250 쪽수 : 344쪽 / 발행일 : 2020년 1월 14일 / ISBN : 979-11-960144-9-0(93000) 이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법..
ggplot2: 들어가기package:ggplot2의 gg는 Grammar of Graphics의 약자이다. ggplot2는 Wilkinson 등(2005의 The grammar of Graphics라는 책의 내용을 바탕으로 Wickham이 만든 패키지이다. Wickham은 ggplot2를 소개하기 위해 책 ggplot2를 쓰기도 했다.시각화의 원리라고 할 수 있는 Grammar of Graphics는 자료 시각화의 핵심을 다음의 기본 3 요소로 정리하였다.data : 무엇을 시각화할 것인가?geom : 무엇으로 시각화할 것인가? 예) 점, 선, 막대 등aesthetics : 어떤 시각적 특성(visual attributes)를 사용할 것인가?위치(x, y), 크기(size), 모양(shape), 색깔(..
R로 하는 빅데이터 분석: 데이터 전처리와 시각화제목 : R로 하는 빅데이터 분석 | 출판사 : 숨은원리지음 : 김권현 / 가격 : 25,000원 / 판형 : 175×250쪽수 : 326쪽 / 발행일 : 2019년 3월 1일 / ISBN : 979-11-960144-7-6(93000)이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 ..
RICI History RICI History Sumeun Publishing x zeroone.ai 2018년 7월 6일 최근에 중고서점에서 `짐 로저스의 상품시장에 투자하라’ 1를 사서 읽고 있다. 첫 번째 장을 읽고 있는 현시점에서, 그리고 미중 무역 전쟁의 여파로 추락하고 있는 주식시장에서, 상품시장에 대안이 될 수 있을까라는 의문이 들었다. 가장 우선 가격을 보자! 로저스가 만들었다는 RICI(Rogers International Commodity Index)을 인터넷에서 검색하니, http://www.rogersrawmaterials.com 에서 지수 자료를 얻을 수 있었다. 2 1998년부터의 자료를 읽어서 그래프를 그려보자! 먼저 필요한 패키지를 불어들이고, library(dplyr) li..
2018년 1학기에 R을 활용하여 통계 분석 프로그래밍 강좌를 맡게 되었습니다. 강의 내용은 크게, 1. R 기본 문법, 2. 데이터 전처리 3. 데이터 시각화 4. 통계 분석 으로 구성될 예정입니다. 그리하여 알맞은 교재를 살펴보게 되었습니다. 고려 대상 교재는 국립중앙도서관에서 쉽게 찾을 수 있는 다음의 5권이었습니다. 1. R라뷰2. R로 배우는 데이터 분석 기본기 데이터 시각화3. R 프로그래밍 기초 & 활용4. R 프로그래밍5. 쉽게 배우는 R 데이터 분석 먼저 R 그래픽스에 대해 어떤 내용을 다루고 있는지 확인합니다. (#은 개인적인 소감입니다) 확인 내용분석 방법: 어떤 명령어를 쓰는가?분석 데이터: 어떤 데이터를 쓰는가?1. R라뷰plot(), barplot(), hist(), pie(),..
GRSM(Graded Rating Scale Model) or also-unknown-as RS-GRM(Rating Scale-Graded Response Model) can be fitted by only a couple of softwares. I implemented the fitting in R package mirt(Chalmers, 2012). You can set itemtype="grsmIRT" for it. The only tricky thing that remains is that mirt automatically adjust the response categories so that the difference between the response categories to be 1. He..
Sorry, folks. It's written in Korean. To anyone who wants to translate, You're welcomed!To anyone who wants to cooperate with me for a new R book, please leave a message.To anyone who's confused with anything about R, please let me know what they are and why you are confused.I'll try to explain as easy as possible!
PerFit 패키지의 lz, lzstar는 응답의 비정상 여부를 판단하는 Person-fit statistics를 계산해 준다. 문제는 lz, lzstar는 ltm::ltm 함수를 기본으로 하는데 이 ltm은 parameter에 범위를 지정할 수가 없다. 따라서 mirt로 fit한 결과를 활용하여 lz, lzstar를 구하는 방법을 생각해보았다.R package PerFit has functions like lz and lzstar which return person fit statistics. The problem is that these functions are based on ltm::ltm but ltm::ltm can set bounds on parameters which is easily in..
RSM은 library mirt로 적합할 수 없다. 내가 하나 만들까 했는데 library TAM으로 가능하다. 추정방법도 MML으로 mirt와 동일하다.RSM(Rating Scale Model) can not be fitted through library mirt. So I considered implementing it in the library myself but library TAM already implemented it. The estimation method is MML, the same as mirt. mirt의 simdata를 활용하여 data를 생성한 후, TAM으로 적합하려 했는데, mirt와 TAM은 계수 표현 방법이 살짝 다르다.For testing, I thought of gen..
나에게 표가 하나 있다. 예전에 만들었는데, 그 때는 평균과 표준편차를 한 테이블에 넣으려고 애를 썼던 기억이 있다. 이제 세월이 흘러 평균과 괄호 안의 표준편차를 분리해야 할 일이 생겼다. 인생의 아이러니란!I have a table. I created it several months ago and I remember trying to come up with a way to put means and sds in one table. Now I have to seperate those two, means and sds that are inside the parentheses. Time flies! 표다. Here's the table. norm extreme inv.ext straight random-un..