R/빅분기 실기(독학)
R 빅데이터분석기사 실기 작업형1(분산) 16일차 빅분기 독학
yimstar9
2022. 12. 18. 18:09
반응형
주어진 데이터 셋에서 f2가 0값인 데이터를 age를 기준으로 오름차순 정렬하고 앞에서 부터 20개의 데이터를 추출한 후 f1 결측치(최소값)를 채우기 전과 후의 분산 차이를 계산하시오 (소수점 둘째 자리까지)
library(dplyr)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df%>%filter(f2==0)
%>%arrange(age)
%>%slice(1:20)
%>%mutate(pre_f1=coalesce(f1,min(f1,na.rm=T)))
%>%summarise(diff=var(f1,na.rm=T)-var(pre_f1))
%>%round(2)
#정답 : 38.44
암기
var(컬럼,na.rm=T) #분산, 결측치 제거
