DataScience
article thumbnail
빅데이터분석기사 5회 실기 합격 후기 빅분기
자격증/빅분기 실기 2022. 12. 16. 22:34

언어 선택 (R vs Python) 둘다 기본적으로 할 수 있는 상황에서 선택 고민만 3일은 했습니다. 데이터포럼 카페에서도 저와 같은 사람이 많았고 대부분의 댓글들이 시험용은 R 업무,범용성은 파이썬이라고 했습니다. 저는 둘다 기초는 있었기 때문에 공식 예제문제를 두 언어로 풀어봤습니다. 여러 사람들이 말했듯이 시험용으론 R이 편하다 느껴졌고 dplyr 덕분에 난이도도 조금 더 쉽다고 느껴졌습니다. 시험환경(구름IDE)에서 R은 에러가 어디서 발생했는지 메시지가 안뜬다는 치명적인 단점이 있지만 '준비한대로 실수만 안하면 되지' 하며 제 자신을 믿고 쭉 R로 연습했습니다. 공식 예제 문제 : https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%..

article thumbnail
빅데이터분석기사, ADsP 독학으로 2개월만에 고득점 합격
자격증/빅분기 실기 2022. 12. 12. 12:07

9월초부터 11월말까지 매일 공부했습니다. 시험순서(빅분기필기-ADsP-빅분기실기) 시험이 한달 간격으로 있어서 준비하기 좋았습니다. 전공은 로봇공학으로 통계쪽 지식은 전혀 없는 상태였고 프로그래밍 언어는 C,C++만 주로 했었습니다. ​ 10월 1일 빅분기 필기 9월 초부터 빅분기 필기를 공부하며 파이썬과 R 기초를 공부했습니다. 파이썬과 R은 C언어를 알고있으니 쉬운편이였는데 빅분기 내용은 대부분이 처음보는 내용이여서 외우는데 꽤 고생좀 했습니다. 시험 전날까지 파이썬, R은 하루에 3시간 정도씩 해서 끝냈고, 빅분기는 1~2시간 정도씩 공부했습니다. 필기 내용을 100% 이해(이해하려고 유툽영상, 정리된 내용 찾아 따로 공부 했으나 50%정도 밖에 이해를 못했습니다)는 하지 못한채 단순히 외우기만 ..

article thumbnail
kaggle로 공부법(독학)
자격증/빅분기 실기 2022. 12. 12. 12:02

퇴근후딴짓님 유튜브 주소 https://www.youtube.com/@ai-study Kaggle주소 https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr ​ 유투버(퇴근후딴짓)님의 kaggle입니다. 혼자 공부하기에 너무 정리가 잘되어 있어서 추천드립니다. 여기서 진행했던 스터디 그룹도 도움이 매우 많이 됐습니다. ​ kaggle 회원가입후 로그인을 하세요 > View more을 누르고 스크롤 조금 아래로 내리면 ​ > 본인이 선택한 언어를 클릭해줍니다. ​ > 본인이 이 문제 코드를 작성한적이 있으면 Edit My Copy이라고 뜨고 없으면 Copy&Edit가 뜹니다. 클릭해줍니다. ​ > 기존 작성되어있는 코드는 주석처리하시고 새로 작성..

빅분기 실기 5회 후기 및 복원문제,가답안
자격증/빅분기 실기 2022. 12. 12. 12:00

단답형 구글에서 개발 하였으며, 방대한 양의 데이터를 신속하게 처리하는 분산 병렬 데이터 처리 기술은? 맵리듀스 ​ 데이터 내부에 데이터 구조에 대한 메타정보를 갖고 있기 때문에 어떤 형태를 가진 데이터인지 파악하는 것이 중요한 데이터 형식은 무엇인가 반정형데이터 ​ 소수 클래스의 데이터를 복제 또는 생성하여 데이터의 비율을 맞추는 방법으로 정보가 손실되지 않는다는 장점이 있으나, 과적합을 초래 할 수 있다. 과대표집 ​ 데이터의 전부 또는 일부분을 대체값(공백, 노이즈 등)으로 변환하는 비식별화 방법 / 개인의 사생활 침해를 방지하고 통계 응답자의 비밀사항은 보호하면서 통계자료의 유용성을 최대한 확보할 수 있는 데이터변환 방법은? 데이터마스킹 ​ 예측 10 20 30 40 실제 9 18 32 44 rm..