DataScience
article thumbnail
Error in sum(List) : invalid ‘type’ (list) of argument, sum()
R 2022. 12. 14. 13:34

리스트 만들어주고 List %에서도 데이터프레임 컬럼 내용인데 summarise(sum(컬럼명))을 해도 에러가 났다. ​ ​ unlist로 리스트를 벡터로 변환해주니 sum이 제대로 작동한다.

Error in parse_repo_spec(repo) : Invalid git repo specification: 'ggbiplot'
R 2022. 12. 14. 13:32

install.packages("devtools") library(devtools) install_github("ggbiplot","vqv") ​ > install_github("ggbiplot", "vqv") Error in parse_repo_spec(repo) : Invalid git repo specification: 'ggbiplot' ​ devtools 패키지 설치후 github로 ggbiplot 패키지 설치하려니 에러가 뜬다. ​ install_github("vqv/ggbiplot") 이렇게 수정하고 실행하니 설치가 잘됨 > install_github("vqv/ggbiplot") Downloading GitHub repo vqv/ggbiplot@HEAD v checking for file '..

article thumbnail
R 구간 범주화, 변수 리코딩
R 2022. 12. 14. 13:31

mutate(): 변수 리코딩(re-coding) ​ 범주형 변수의 수준 간소화​ ​ case_when():cut, ifelse와 비슷한 기능을 한다. %>% mutate( 새로운컬럼명 = case_when( 변수 %in% c("원하는 값1", "원하는 값2", "원하는 값3") ~ "참 리턴값", TRUE ~ "거짓 리턴값" ) ) ​ ​ 연속형 변수-> 범주형 변수 df%>%mutate(education2=case_when( education == 1 ~"대졸", education == 2 ~"고졸", education == 3 ~"중졸" )) df%>%mutate(새로운컬럼명=case_when( 변수 == 비교값 ~"리턴값", 변수 == 비교값 ~"리턴값", 변수 == 비교값 ~"리턴값", TRUE..

article thumbnail
tie가 있어 정확한 p값을 계산할 수 없습니다
R 2022. 12. 14. 13:28

wilcox.test를 하다보니 warning message가 거슬려서 찾아보니 ​ wilcoxon signed rank test는 샘플값을 정렬(sort)한 다음에 중앙값(median)을 가지고 검정통계량을 계산하는데요.동일한 정렬순서의 값이 있으면 통계량과 p-value가 정확하지않을수 있다는 뜻입니다. 샘플 수가 작으면 문제가 될수 있으며, 샘플 사이즈가 크면 무시하셔도 대세에 지장은 없습니다.

article thumbnail
논문 읽는법
영상처리/논문 2022. 12. 14. 05:32

Introduction : 여러분이 이 포스팅을 볼 시점에는 아마도 이 분야의 선구자이신 앤드류응 교수님을 이미 알고 계실 것이며 그분이 해주실 ML/DL 커리어에 대한 조언에 관심이 있을 것입니다. 강의 영상을 직접 보시면 더 많고 유익한 내용이 있습니다만, 간단히 정리드리기 위해 이 포스팅을 작성했습니다. 앤드류응 교수님의 이번 어드바이스에는 크게 두가지가 있습니다. 1. 연구 논문 읽는 법 : 딥러닝계의 새로운 토픽을 마스터하기 위해 앤드류응 교수님이 사용하시는 효과적인 논문읽기 방법입니다. 2. ML/DL 커리어에 대한 조언 논문읽기 : 효과적이고 빠르게 논문을 읽는 방법입니다. 여러분이 ML/DL 시스템이나 프로젝트를 재미로 하든 분야 최고가 되기 위해 하든, 딥러닝에 발을 담근 사람으로서 논문..

article thumbnail
파이썬 pandas columns 인덱스삭제(컬럼명이 같을 경우)
파이썬/파이썬 기초 2022. 12. 14. 01:39

(10,4)데이터프레임 만들어서 컬럼명을 b,a,a,d로 설정 import pandas as pd import numpy as np np.random.seed(1234) data = pd.DataFrame(np.random.randn(10, 4)) data.columns=['b','a','a','d'] print(data) data.drop(labels=['a'], axis=1) import pandas as pd import numpy as np np.random.seed(1234) data = pd.DataFrame(np.random.randn(10, 4)) data.columns=['b','a','a','d'] print(data) 인덱스 첫번째 'a'를 지우고싶어서 컬럼인덱스로 1로 접근했는데 결..