결과적으로 해커톤 1에서의 실수를 다시 한번 저지름.
처음에 input data 를 불러오고, 표시하고, 가공하는 것부터 스스로 해야한다.
baseline 에서 한 방식은 사실 나에게 복잡하고 어려워서 눈에 들어오지 않는다.
이 과정을 통해 데이터를 밀고 당겨서 내가 핸들링하고 있다는 강한 확신을 가진 후, 모델을 분석, 교체 해야한다.
이게 안되면 baseline의 틀 안에 갇혀버리고, 의존성에서 벗어나지 못하고 코딩의 폭이 줄어든다.
데이터 경진대회를 시작하면, 처음에는 무조건 EDA 부터 시작하자.
1.EDA - 데이터 불러오기, 환경설정(코랩), 띄워보기, 분포확인, 전처리
2.baseline 학습 : 모델/데이터흐름/파이프라인/데이터shape/작성자의 목적, 철학
3.나만의 직관/전략/방향성/철학/모델/파이프라인 세우기
4.baseline 에서 조금씩 수정하면 내 전략을 입힌다.
5.테스트
6.5를 기반으로 3,4 수정
7.6을 반복하기
8.만족할만한 성과 + 제출
+ 직관적으로 떠오르는 아이디어가 있으면 언어로 표현하여 잘 정리하고, 바로 적용할 수 있도록 해보자
+ 주도적으로 해야한다. 조원들이 알아서 잘 해주겠지.. 이런 무임승차 마인드는 버리자
+ 거의 모든 줄에 print 를 찍어서 shape 및 전체 흐름을 한 눈에 정리하고 시작하자
+ 앞으로 계속 대회에 출전해서 데이터경진대회 시작 후 멘붕과 방황의 기간을 줄이자.