DataScience
article thumbnail
728x90

basic1.csv
0.00MB

주어진 데이터 셋에서 f2가 0값인 데이터를 age를 기준으로 오름차순 정렬하고 앞에서 부터 20개의 데이터를 추출한 후 f1 결측치(최소값)를 채우기 전과 후의 분산 차이를 계산하시오 (소수점 둘째 자리까지)

library(dplyr)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df%>%filter(f2==0)
	%>%arrange(age)
    %>%slice(1:20)
    %>%mutate(pre_f1=coalesce(f1,min(f1,na.rm=T)))
    %>%summarise(diff=var(f1,na.rm=T)-var(pre_f1))
    %>%round(2)
   
#정답 : 38.44

 

암기

var(컬럼,na.rm=T)  #분산, 결측치 제거

profile

DataScience

@Ninestar

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!