DataScience
article thumbnail
728x90

basic1.csv
0.00MB

 

나이 구간 나누기
basic1 데이터 중 'age'컬럼 이상치를 제거하고, 동일한 개수로 나이 순으로 3그룹으로 나눈 뒤 각 그룹의 중앙값을 더하시오(이상치는 음수(0포함), 소수점 값)

library(dplyr)
library(ggplot2)
df<-read.csv('../input/bigdatacertificationkr/basic1.csv')
ans<-df%>%filter((age*10)%%10==0&age>0)
        %>%mutate(pre_age=cut_number(age,3))
        %>%group_by(pre_age)
        %>%summarise(m=median(age))
		%>%summarise(ans=sum(m))
cat(ans$ans)

# 정답 : 165

 

암기

library(ggplot2)

 

cut_number(x, n = NULL, ...)

Arguments

x : numeric vector

n : number of intervals to create

Examples

table(cut_number(runif(1000), n = 10))

 

 

 

profile

DataScience

@Ninestar

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!