안녕하세요. 빅데이터분석기사 취득 이후에, 실제 데이터를 가지고 꼭 한번 분석하는 시간을 가져야겠다는 생각을 했었는데요. 시중에 나와있는 머신러닝 모델을 학습시키기에 최적화된 데이터들이 아닌 실제 발생하는 데이터를 가지고 해보고 싶다는 생각이 있었습니다. 다만, 제가 개인적으로 몇천개의 데이터를 모을 수는 없기에 연구실에서 맡고 있는 과제들에서 해볼만한 데이터가 있나 살펴보던 중 괜찮은 데이터셋이 있어서 그걸 가지고 머신러닝 모델을 만들고 있습니다. 국가과제 데이터여서 데이터에 대한 세부사항을 설명하기보다는, 전체적인 데이터의 특성만 설명하고 실제 어떻게 모델을 만들었으며 모델의 성능과 성능을 향상시키기 위해 어떻게 하고 있는지 기록하면서 아직 이 분야에 초보자이기에 고수분들의 피드백도 받고자 포스팅합니..