DataScience
article thumbnail
728x90

basic1.csv
0.00MB

 

주어진 데이터 셋에서 age컬럼 상위 20개의 데이터를 구한 다음 f1의 결측치를 중앙값으로 채운다. 그리고 f4가 ISFJ와 f5가 20 이상인 f1의 평균값을 출력하시오!

library(dplyr)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
df %>% arrange(-age) 
	%>% slice(1:20)
    %>% mutate(pre_f1=ifelse(is.na(f1),median(f1,na.rm=T),f1)) 
    %>% filter(f4=='ISFJ' & f5>=20)
    %>% summarise(value=mean(pre_f1))
    
#정답 : 73.875

 

암기

slice(data, from, to)

#데이터 프레임의 행(row) 선별 by position

slice(data1, 6:10)

#6:10 행

profile

DataScience

@Ninestar

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!