cast를 할때 measure 변수가 여러개 있으면?
수원시에 대해서만 지역, 월, 시간, 전체통행전체
party..ctree
install.packages('party')
require(party)
tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)
plot(tr1)
install.packages('party')
require(party)
tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)
plot(tr1)
ggtr1 <- ggtr
ggtr1$is_ku <- ""
ggtr1$is_ku <- ifelse(nchar(as.character(ggtr1$지역)) <12, "sigun",
"ku")
# str_sub() in stringr package
install.packages('stringr')
require(stringr)
ggtr1$is_ku <- ifelse( str_sub(ggtr1$지역,-1,-1)=="시" , "sigun", "ku")
darea06 <- sqldf('select 지역, 월, 시간, 전체통행전체 from ggtr1 where
is_ku="sigun" and (시간 <> "일합계" and 시간 <> "12시간") ')
tr2<- ctree(darea06$전체통행전체 ~ darea06$월+ darea06$시간 + darea06$
지역, data=darea06, controls=ctree_control(maxdepth = 3))
plot(tr2)
#-------[ 조금 다듬어진 버전 ] ------------
#====================
수원시에 대해서만 지역, 월, 시간, 전체통행전체
darea05 <- sqldf('select 월, 시간, 전체통행전체 from ggtr where 지역="
경기도 수원시" and (시간 <> "일합계" and 시간 <> "12시간") ')
install.packages('party')
require(party)
tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)
plot(tr1)
ggtr1 <- ggtr
ggtr1$is_ku <- ""
ggtr1$is_ku <- ifelse(nchar(as.character(ggtr1$지역)) <12, "sigun", "ku")
# str_sub() in stringr package
install.packages('stringr')
require(stringr)
ggtr1$is_ku <- ifelse( str_sub(ggtr1$지역,-1,-1)=="시" , "sigun", "ku")
ggtr1$지역 <- as.character(ggtr1$지역)
ggtr1$is_ku <- ifelse( substr(ggtr1$지역,nchar(ggtr1$지역),
nchar(ggtr1$지역)) =="구" , "ku", "sigun")
ggtr00tmp <- sqldf('select is_ku, count(*) as cnt from ggtr1 group by is_ku')
# 구가 제대로 구분되었는지를 확인 (무작위 표본 활용)
ggtr1smp<- ggtr1[sample(1:nrow(ggtr1), 20, replace=FALSE),c('지역','is_ku')]
ggtr2 <- ggtr1[which(ggtr1$is_ku=="sigun"),]
unique(ggtr2$지역)
darea06 <- sqldf('select 지역, 월, 시간, 전체통행전체 from ggtr2 where is_ku ="sigun" and (시간 <> "일합계" and 시간 <> "12시간") ')
darea07 <- sqldf('select 지역, count(*) as cnt from darea06 group by 지역 ')
darea06$지역 <- gsub("경기도 ", "", darea06$지역)
tr2<- ctree(darea06$전체통행전체 ~ darea06$월+ darea06$시간 + as.factor(darea06$지역), data=darea06, controls=ctree_control(maxdepth = 3, minbucket=300))
plot(tr2)
#-----------------
tile()
'R 데이터 분석' 카테고리의 다른 글
0630 파트 2 (0) | 2015.06.30 |
---|---|
[R and SQL] [0630 ...................] (0) | 2015.06.30 |
Reshape 샘플 (0) | 2015.06.29 |
경기도 버스 : 경기도교통정보센터 (0) | 2015.06.29 |
GT apple samsung applications (0) | 2015.06.29 |