>RE::VISION CRM

R 데이터 분석

추가 0629

YONG_X 2015. 6. 29. 16:50

cast를 할때 measure 변수가 여러개 있으면?


수원시에 대해서만 지역, 월, 시간, 전체통행전체


party..ctree

install.packages('party')

require(party)

tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)

plot(tr1)



install.packages('party')

require(party)

tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)

plot(tr1)


ggtr1 <- ggtr

ggtr1$is_ku <- ""

ggtr1$is_ku <- ifelse(nchar(as.character(ggtr1$지역)) <12, "sigun", 


"ku")


# str_sub() in stringr package

install.packages('stringr')

require(stringr)

ggtr1$is_ku <- ifelse( str_sub(ggtr1$지역,-1,-1)=="시"  , "sigun", "ku")



darea06 <- sqldf('select 지역, 월, 시간, 전체통행전체 from ggtr1 where 


 is_ku="sigun" and (시간 <> "일합계" and 시간 <> "12시간") ')


tr2<- ctree(darea06$전체통행전체 ~ darea06$월+ darea06$시간 + darea06$


지역, data=darea06, controls=ctree_control(maxdepth = 3))

plot(tr2)


#-------[ 조금 다듬어진 버전 ] ------------


#====================


수원시에 대해서만 지역, 월, 시간, 전체통행전체

darea05 <- sqldf('select 월, 시간, 전체통행전체 from ggtr where 지역="


경기도 수원시" and (시간 <> "일합계" and 시간 <> "12시간") ')


install.packages('party')

require(party)

tr1<- ctree(darea05$전체통행전체~darea05$월+ darea05$시간)

plot(tr1)


ggtr1 <- ggtr

ggtr1$is_ku <- ""

ggtr1$is_ku <- ifelse(nchar(as.character(ggtr1$지역)) <12, "sigun", "ku")


# str_sub() in stringr package

install.packages('stringr')

require(stringr)

ggtr1$is_ku <- ifelse( str_sub(ggtr1$지역,-1,-1)=="시"  , "sigun", "ku")


ggtr1$지역 <- as.character(ggtr1$지역)

ggtr1$is_ku <- ifelse( substr(ggtr1$지역,nchar(ggtr1$지역), 

nchar(ggtr1$지역)) =="구" , "ku", "sigun")


ggtr00tmp <-  sqldf('select is_ku, count(*) as cnt from ggtr1 group by is_ku')


# 구가 제대로 구분되었는지를 확인 (무작위 표본 활용)

ggtr1smp<- ggtr1[sample(1:nrow(ggtr1), 20, replace=FALSE),c('지역','is_ku')]


ggtr2 <- ggtr1[which(ggtr1$is_ku=="sigun"),]

unique(ggtr2$지역)



darea06 <- sqldf('select 지역, 월, 시간, 전체통행전체 from ggtr2 where is_ku ="sigun" and (시간 <> "일합계" and 시간 <> "12시간") ')


darea07 <- sqldf('select 지역, count(*) as cnt from darea06 group by 지역 ')


darea06$지역 <- gsub("경기도 ", "", darea06$지역)


tr2<- ctree(darea06$전체통행전체 ~ darea06$월+ darea06$시간 + as.factor(darea06$지역), data=darea06, controls=ctree_control(maxdepth = 3, minbucket=300))


plot(tr2)


#-----------------

tile()


# 타일 계산
quantile(applesam$apple, c(.20, .50, 

.80)) 

quantile(applesam$apple, c(0, .2, .4, 

.6, .8, 1)) 

quantile(applesam$apple, c(0, .2, .4, 

.6, .8, .85,.91, .92, .93, 1)) 

seqa <- c(1:100)/100
plot(quantile(applesam$apple, seqa ), 

type="l" )


'R 데이터 분석' 카테고리의 다른 글

0630 파트 2  (0) 2015.06.30
[R and SQL] [0630 ...................]  (0) 2015.06.30
Reshape 샘플  (0) 2015.06.29
경기도 버스 : 경기도교통정보센터  (0) 2015.06.29
GT apple samsung applications  (0) 2015.06.29