언어 선택 (R vs Python) 둘다 기본적으로 할 수 있는 상황에서 선택 고민만 3일은 했습니다. 데이터포럼 카페에서도 저와 같은 사람이 많았고 대부분의 댓글들이 시험용은 R 업무,범용성은 파이썬이라고 했습니다. 저는 둘다 기초는 있었기 때문에 공식 예제문제를 두 언어로 풀어봤습니다. 여러 사람들이 말했듯이 시험용으론 R이 편하다 느껴졌고 dplyr 덕분에 난이도도 조금 더 쉽다고 느껴졌습니다. 시험환경(구름IDE)에서 R은 에러가 어디서 발생했는지 메시지가 안뜬다는 치명적인 단점이 있지만 '준비한대로 실수만 안하면 되지' 하며 제 자신을 믿고 쭉 R로 연습했습니다. 공식 예제 문제 : https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%..
9월초부터 11월말까지 매일 공부했습니다. 시험순서(빅분기필기-ADsP-빅분기실기) 시험이 한달 간격으로 있어서 준비하기 좋았습니다. 전공은 로봇공학으로 통계쪽 지식은 전혀 없는 상태였고 프로그래밍 언어는 C,C++만 주로 했었습니다. 10월 1일 빅분기 필기 9월 초부터 빅분기 필기를 공부하며 파이썬과 R 기초를 공부했습니다. 파이썬과 R은 C언어를 알고있으니 쉬운편이였는데 빅분기 내용은 대부분이 처음보는 내용이여서 외우는데 꽤 고생좀 했습니다. 시험 전날까지 파이썬, R은 하루에 3시간 정도씩 해서 끝냈고, 빅분기는 1~2시간 정도씩 공부했습니다. 필기 내용을 100% 이해(이해하려고 유툽영상, 정리된 내용 찾아 따로 공부 했으나 50%정도 밖에 이해를 못했습니다)는 하지 못한채 단순히 외우기만 ..
퇴근후딴짓님 유튜브 주소 https://www.youtube.com/@ai-study Kaggle주소 https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr 유투버(퇴근후딴짓)님의 kaggle입니다. 혼자 공부하기에 너무 정리가 잘되어 있어서 추천드립니다. 여기서 진행했던 스터디 그룹도 도움이 매우 많이 됐습니다. kaggle 회원가입후 로그인을 하세요 > View more을 누르고 스크롤 조금 아래로 내리면 > 본인이 선택한 언어를 클릭해줍니다. > 본인이 이 문제 코드를 작성한적이 있으면 Edit My Copy이라고 뜨고 없으면 Copy&Edit가 뜹니다. 클릭해줍니다. > 기존 작성되어있는 코드는 주석처리하시고 새로 작성..
단답형 구글에서 개발 하였으며, 방대한 양의 데이터를 신속하게 처리하는 분산 병렬 데이터 처리 기술은? 맵리듀스 데이터 내부에 데이터 구조에 대한 메타정보를 갖고 있기 때문에 어떤 형태를 가진 데이터인지 파악하는 것이 중요한 데이터 형식은 무엇인가 반정형데이터 소수 클래스의 데이터를 복제 또는 생성하여 데이터의 비율을 맞추는 방법으로 정보가 손실되지 않는다는 장점이 있으나, 과적합을 초래 할 수 있다. 과대표집 데이터의 전부 또는 일부분을 대체값(공백, 노이즈 등)으로 변환하는 비식별화 방법 / 개인의 사생활 침해를 방지하고 통계 응답자의 비밀사항은 보호하면서 통계자료의 유용성을 최대한 확보할 수 있는 데이터변환 방법은? 데이터마스킹 예측 10 20 30 40 실제 9 18 32 44 rm..