#---------------------------
# [ 1 ] 멀티클래스 타겟 변수를 바이너리 타겟 변수로 변경
# ifelse() 함수사용
# Data : KBO
attach(k6)
k6$is_strong_team <- 0
# ds, hh, nx 세팀을 강팀으로 여기는 플래그 변수 생성
k6$is_strong_team <- ifelse(team== 'ds' | team == 'hh' | team == 'nx' , 1, 0 )
head(k6)
#=====================
# [2] Count distinct value
# aggregate에서 sum, mean은 있어도 단순한 count 함수는 없으니
# 다른 방법도 있으나 좀 더 간단하게 처리하기 위해 table() 함수를 활용하는 예제
# sqldf를 사용해서 count(distinct columa ) .... 형식으로 처리하는 것과 같은 결과
dummyData = rep(c(1,2, 2, 2), 25)
> table(dummyData)
dummyData
1 2
25 75
#or another presentation of the same data
> as.data.frame(table(dummyData))
dummyData Freq
1 1 25
2 2 75
# aggregate 함수를 그대로 사용하고자 한다면 사용자정의함수를 활용
aggregate(order_no ~ name, myvec, function(x) length(unique(x)))
'R 데이터 분석' 카테고리의 다른 글
[R 데이터 분석] 데이터 긁어오기 (Scraping ) (0) | 2015.06.09 |
---|---|
[R분석] 장바구니 분석 (0) | 2015.05.12 |
[R 데이터분석] SQLDF 에서 특정 문자열 포함 문자열 선택 Like 기능 사용법 (0) | 2015.02.24 |
[R 데이터분석] (0) | 2014.12.21 |
[마트SAS] SQL 레벨001 (0) | 2014.12.13 |