[머신러닝]

제 6회 빅데이터분석기사 자격증 취득 후기

" " 2023. 8. 24. 17:54

안녕하세요. 뒤늦게 작성하는 빅데이터분석기사 자격증 취득 후기입니다.

 

저는 빅데이터분석기사 취득을 목표로 관련 자격증인 ADSP를 먼저 취득하고 빅데이터분석기사를 준비하였는데요, 

기본적으로 빅데이터분석기사 필기와 ADSP는 상당 부분 겹치는 것들이 많아 어떻게 보면 ADSP를 취득하면 빅데이터분석기사 필기를 상대적으로 수월하게 취득할 수 있다는 이점이 있지만 지금 생각하면 굳이?라는 생각이 들긴 합니다.

 

ADSP 가 ADP 를 취득하기 위한 요건이기 때문에 ADP를 최종목표로 하신다면 ADSP -> 빅분기 -> ADP 순이 맞겠지만 ADP 취득을 목표하지 않으시는 분들이라면 굳이 ADSP를 먼저 공부할 필요가 있을까 싶습니다. 

 

개인적으로 ADSP 는 의미가 그렇게 크지도 않고 시험의 퀄리티 자체도 높지 않아 빅데이터분석기사 필기로 바로 시작하는 게 더 좋은 선택인 것 같아요. 수험료도 자격증 수준에 비해 너무 높게 책정되어 있다고 생각합니다..ㅎ

 

 

1. 빅데이터분석기사 (필기)

ADSP를 먼저 취득하긴 했지만 취득 후 몇 달이 지난 뒤에 빅분기 필기를 준비하였기 때문에 ADSP 때 공부했던 것이 머리에 남아있지는 않았습니다. 다른 후기들을 보니 책 한 권 구매해서 기출문제만 다 풀어보고 들어가면 무난하게 통과할 수 있다고 하여 책을 먼저 구매하였습니다.

 

 

저는 예문에듀의 "빅데이터분석기사 필기 한 권 완성" 도서를 구매하였고 책 전체를 한 번씩만 풀고 오답노트만 작성하여 시험장에 들어갔습니다. 이 책이 기출문제도 다 수록되어 있었고 자체로 제작한 모의고사 같은 게 많았어서 해당 책으로 선택하였고 잘한 선택인 것 같아요. 기출이 많이 없는 시험이기 때문에 이렇게라도 많은 문제를 만나보고 들어가는 게 중요한 것 같습니다.

 

이전 후기들과 달리 기출문제는 거의 도움이 되지 않았던 것 같고 완전히 다른 개념의 문제나, 도서의 이론 부분에는 없던 것들이 꽤 많이 나왔습니다. 그래서 기존에 머신러닝, 통계학 관련해서 공부했던 것이 도움이 조금 되었고 그런 거 없이 책에서 나온 것들만 가지고 풀었다면 조금 간당간당 하지 않았을까 싶습니다.

 

개인적으로 3, 4과목이 가장 어렵게 나왔던 것 같은데 특히 모델링 부분에서 아예 처음듣는 모델들이 나온다거나 하는 것들이 있어서 조금 폭넓게 공부해 가는 게 안전하게 합격하는 길인 것 같아요.

 

머신러닝, 통계학 관련해서 기본적인 지식을 갖고 있는 상태에서 3주정도 여유롭게 잡고 공부했습니다. 참고하시면 될 것 같아요.

 

3. 빅데이터 분석기사 (실기)

사실 이번에 말이 많았던 회차인지라 합격자 비율이 나왔는지는 모르겠지만 아마 조금 높지 않을까 예상합니다. 3 유형에서 문제출제 오류가 있어서 전원정답 처리가 있었고요, 해당 문제는 R로 풀면 조금 쉽게 풀린다고 하던데 저는 python으로 응시하여서 손도 못 대고 나왔었습니다.

 

가장 먼저 2과목은 다항분류로 나왔었는데 사실 2과목은 어렵지 않게 풀었습니다. 기본적으로 회귀, 분류 중에 하나로 문제가 나오는 게 확실하기 때문에 기본적으로 회귀, 분류가 나왔을 때 어떤 식으로 코드를 작성할지 가이드라인만 잡고 들어가면 어렵지 않게 40점을 받을 수 있습니다. 

 

다만, 회차가 거듭할수록 난이도를 올리기 쉬운 것도 2과목 인 것 같아요. 그래서 다음 회차에서 어떤식으로 나올지 한번 지켜봐야 할 것 같습니다.

 

1과목 같은 경우에도 이번에 문제를 해석하기가 어렵다는 논란이 있었는데 저도 그렇게 느끼긴 했지만 개인적으로 문제가 잘못되었다 수준의 경우는 아니었던 것 같구요 데이터마님에서 1과목 관련해서 문제를 많이 풀었었는데 공부하면서 기출문제들보다 많이 난이도가 높다고 생각했지만 꾸준히 문제를 풀었던 것이 도움이 되었던 것 같구요 천천히 문제만 잘 이해하면 어렵지 않게 해결할 수 있는 부분인 것 같습니다.

 

3과목은 이번에 새로 바뀐 부분인데, 기존에 단답형으로 10문제 나오던 것을 통계관련한 문제들로 바꿨습니다. 개인적으로 필기, 실기가 나눠져 있는 자격증인만큼 실기에서는 단답형보단 이번에 바뀐 것처럼 100% 실기로 가는게 더 좋은 자격증이라고 생각해서 긍정적인 부분 같습니다. 다만, 사전에 python에서 어떤 라이브러리를 사용할 수 있는지 공지가 있는데 거기에 포함되지 않은 라이브러리를 사용해서 푸는 문제가 나와서 전원정답 처리된 문제가 하나 있어서 역시 다음 시험에서도 해당 공지를 잘 살펴보고 포함된 라이브러리에 대해 학습하는 게 중요한 것 같습니다.

 

그런데 제 기억상으로는 해당 리스트에 Selenium (자동화 도구), beautifulsoup (크롤링) 등의 시험에서 내는게 가능한지 의문이 되는 라이브러리들도 포함이 되어있던 것 같은데 왜 그렇게 해놨는지는 잘 모르겠네요. 혹시 나중에 진짜 관련해서 문제를 내려고 하는 건지.. 모르겠지만 그럴 확률은 낮지 않나 생각됩니다.

 

실기는 유튜브 에듀아토즈로 주로 공부했고, 무료 강의 (대구빅데이터활용센터 등) 도 많이 도움이 되었습니다. 에듀아토즈는 엄청 세세하게 나눠져있고 강의 양도 엄청나게 방대해서 전부 듣지는 못했고 파이썬 기초부분은 패스하고 2과목을 위주로만 들었습니다. 파이썬에 대한 기본적인 이해가 부족한 단계라면 돈을 내고 에듀아토즈를 이용해서 기초부터 공부하는 것이 많이 도움 될 것 같아요.

 

저는 데이터를 전처리하는 1과목이나 2과목의 초반 단계는 어느 정도 경험이 있어서 어느 정도 수월한 부분이 있었고 머신러닝 코드 작성하는 부분은 유튜브 강의를 많이 참고하였습니다. 다만, 통계검정은 파이썬보단 r 로 통계검정을 많이 했었어서 기본적인 것부터 학습이 필요했고 이번에 개정이 된 부분이라 자료가 많이 없기도 하여서 조금 어려운 부분이 있었던 것 같아요. 

 

NGS 데이터를 분석하는 입장에서 머신러닝을 제가 일하는 분야에 얼마나 적용할 수 있을지는 조금 생각해 봐야할 부분이겠습니다만, 완전 컴퓨터 쪽으로 전공도 아니기 때문에 제가 직접 코드를 짜거나 프로그램을 만들 수 있을 거란 생각은 별로 하고 있지 않습니다.

 

다만, 마이크로바이옴 데이터도 빅데이터에 포함된다고 생각하기에 꾸준히 해당 분야에서 나오는 논문이나 자료들을 따라가면서 작성된 코드를 리뷰하거나 하는 데에 기본적인 머신러닝이나 딥러닝에 대한 코드는 알아두면 분명히 도움이 될 것이라고 생각했기에 시작하였고 잘 마무리된 것 같습니다. 

 

이후 ADP 까지는 생각이 없기에 이번에 배운 것들을 잘 정리해서 나중에 꼭 써먹을 수 있도록 하는게 지금으로선 가장 좋을 것 같습니다.

 

다들 꼭 자격증 취득하시기 바랍니다!