R/빅분기 실기(독학)
R 빅데이터분석기사 실기 작업형1(누적합,보간) 8일차 빅분기 독학
Ninestar
2022. 12. 18. 06:11
반응형
주어진 데이터 셋에서 'f2' 컬럼이 1인 조건에 해당하는 데이터의 'f1'컬럼 누적합을 계산한다.
이때 발생하는 누적합 결측치는 바로 뒤의 값을 채우고, 누적합의 평균값을 출력한다.
(단, 결측치 바로 뒤의 값이 없으면 다음에 나오는 값을 채워넣는다)
library(dplyr)
library(zoo)
df=read.csv('../input/bigdatacertificationkr/basic1.csv')
ans<-df%>%filter(f2==1)
%>%summarise(cumsum=cumsum(coalesce(f1, 0)) + f1*0)
%>%mutate(pre_f1 = na.locf(cumsum,fromLast=T))
%>%select(pre_f1)
%>%sapply(mean)
print(ans)
#정답 : 980.3784
암기
library(zoo)
na.locf(object, fromLast=FALSE) #결측값을 이전 행의 값으로 대체
# fromLast = TRUE : NA를 다음 행 값으로 치환
coalesce함수:결측값을 대체하는 함수
https://statisticsglobe.com/r-coalesce-function-dplyr-package
