DataScience
article thumbnail
728x90

basic1.csv
0.00MB

주어진 데이터에서 'f5'컬럼을 표준화(Standardization (Z-score Normalization))하고 그 중앙값을 구하시오

library(dplyr)
df<-read.csv('../input/bigdatacertificationkr/basic1.csv')
df$scale_f5<-scale(df$f5)
ans<-median(df$scale_f5,na.rm=T)
cat(ans)

#정답 : 0.2593133

 

 

caret패키지 내 preProcess함수도 가능하다. preProcess함수를 이용하면 min-max scale도 가능함.

library(dplyr)
library(caret)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
a<-preProcess(df,c("center","scale"))
ans<-df%>%mutate(pre_f5=(predict(a,df))$f5)
median(ans$pre_f5)

# 0.2593133

 

암기

library(caret)

preProcess(전체데이터프레임, "range")   # min-max scale

preProcess(전체데이터프레임, c("center","scale"))  #z-score scale

profile

DataScience

@Ninestar

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!