728x90
주어진 데이터에서 20세 이상의 데이터 추출한 후, 'f1'컬럼을 결측치를 최빈값으로 채운 후,
f1 컬럼의 여-존슨과 박스콕스 변환 값을 구하고, 두 값의 차이를 절대값으로 구한다음 모두 더해 소수점 둘째 자리까지 출력(반올림)하시오
library(dplyr)
library(caret)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df1<-df%>%filter(age>=20)
%>%mutate(pre_f1=ifelse(is.na(f1),as.numeric(names(which.max(table(f1)))),f1))
yeo<-preProcess(df1,c("YeoJohnson","scale","center"))
bxcx<-preProcess(df1,c("BoxCox","scale","center"))
tr_y<-(predict(yeo,df1))$pre_f1
tr_b<-(predict(bxcx,df1))$pre_f1
round(sum(abs(tr_y-tr_b)),2)
#정답 : 0.6
암기
preProcess(전체데이터프레임,method)
method=("BoxCox", "YeoJohnson", "expoTrans", "center", "scale", "range")
'R > 빅분기 실기(독학)' 카테고리의 다른 글
R 빅데이터분석기사 실기 작업형1(상위,하위 10개) 12일차 빅분기 독학 (0) | 2022.12.18 |
---|---|
R 빅데이터분석기사 실기 작업형1(상위,하위5%) 11일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(z-score 표준화) 9일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(누적합,보간) 8일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1 독학(조건2개이상 인덱싱후 값 대체) 7일차 빅분기 (0) | 2022.12.18 |