DataScience
article thumbnail
728x90

basic1.csv
0.00MB

1.  

2. 나이 구간 나누기 basic1 데이터 중 'age'컬럼 이상치를 제거하고, 동일한 개수로 나이 순으로 3그룹으로 나눈 뒤 각 그룹의 중앙값을 더하시오(이상치는 음수(0포함), 소수점 값)

<r />
library(dplyr) library(ggplot2) df<-read.csv('../input/bigdatacertificationkr/basic1.csv') ans<-df%>%filter((age*10)%%10==0&age>0) %>%mutate(pre_age=cut_number(age,3)) %>%group_by(pre_age) %>%summarise(m=median(age)) %>%summarise(ans=sum(m)) cat(ans$ans) # 정답 : 165

 

3. 암기

library(ggplot2)

 

cut_number(x, n = NULL, ...)

Arguments

x : numeric vector

n : number of intervals to create

Examples

table(cut_number(runif(1000), n = 10))

 

 

 

profile

DataScience

@Ninestar

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!