728x90
주어진 데이터 셋에서 age컬럼 상위 20개의 데이터를 구한 다음 f1의 결측치를 중앙값으로 채운다. 그리고 f4가 ISFJ와 f5가 20 이상인 f1의 평균값을 출력하시오!
library(dplyr)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df %>% arrange(-age)
%>% slice(1:20)
%>% mutate(pre_f1=ifelse(is.na(f1),median(f1,na.rm=T),f1))
%>% filter(f4=='ISFJ' & f5>=20)
%>% summarise(value=mean(pre_f1))
#정답 : 73.875
암기
slice(data, from, to)
#데이터 프레임의 행(row) 선별 by position
slice(data1, 6:10)
#6:10 행
'R > 빅분기 실기(독학)' 카테고리의 다른 글
R 빅데이터분석기사 실기 작업형1(시계열데이터) 17일차 빅분기 독학 (0) | 2022.12.18 |
---|---|
R 빅데이터분석기사 실기 작업형1(분산) 16일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(2개조건 상위값) 14일차 빅분기 독학 (0) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(상관관계) 13일차 빅분기 독학 (5) | 2022.12.18 |
R 빅데이터분석기사 실기 작업형1(상위,하위 10개) 12일차 빅분기 독학 (0) | 2022.12.18 |