728x90
주어진 데이터 셋에서 f2가 0값인 데이터를 age를 기준으로 오름차순 정렬하고 앞에서 부터 20개의 데이터를 추출한 후 f1 결측치(최소값)를 채우기 전과 후의 분산 차이를 계산하시오 (소수점 둘째 자리까지)
library(dplyr)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df%>%filter(f2==0)
%>%arrange(age)
%>%slice(1:20)
%>%mutate(pre_f1=coalesce(f1,min(f1,na.rm=T)))
%>%summarise(diff=var(f1,na.rm=T)-var(pre_f1))
%>%round(2)
#정답 : 38.44
암기
var(컬럼,na.rm=T) #분산, 결측치 제거
'R > 빅분기 실기(독학)' 카테고리의 다른 글
R 빅데이터분석기사 실기 작업형1(시계열 주말,평일) 18일차 빅분기 독학 (0) | 2022.12.18 |
---|---|
R 빅데이터분석기사 실기 작업형1(시계열데이터) 17일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(slice) 15일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(2개조건 상위값) 14일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(상관관계) 13일차 빅분기 독학 (5) | 2022.12.18 |