본문으로 바로가기

aiffel_dacon_해빙예측대회 배운것들

category 카테고리 없음 2021. 4. 4. 02:58

결과적으로 해커톤 1에서의 실수를 다시 한번 저지름.

처음에 input data 를 불러오고, 표시하고, 가공하는 것부터 스스로 해야한다.

baseline 에서 한 방식은 사실 나에게 복잡하고 어려워서 눈에 들어오지 않는다.

이 과정을 통해 데이터를 밀고 당겨서 내가 핸들링하고 있다는 강한 확신을 가진 후, 모델을 분석, 교체 해야한다.

이게 안되면 baseline의 틀 안에 갇혀버리고, 의존성에서 벗어나지 못하고 코딩의 폭이 줄어든다.

데이터 경진대회를 시작하면, 처음에는 무조건 EDA 부터 시작하자.

 

1.EDA - 데이터 불러오기, 환경설정(코랩), 띄워보기, 분포확인, 전처리

2.baseline 학습 : 모델/데이터흐름/파이프라인/데이터shape/작성자의 목적, 철학

3.나만의 직관/전략/방향성/철학/모델/파이프라인 세우기

4.baseline 에서 조금씩 수정하면 내 전략을 입힌다.

5.테스트

6.5를 기반으로 3,4 수정

7.6을 반복하기

8.만족할만한 성과 + 제출

 

 

+ 직관적으로 떠오르는 아이디어가 있으면 언어로 표현하여 잘 정리하고, 바로 적용할 수 있도록 해보자

+ 주도적으로 해야한다. 조원들이 알아서 잘 해주겠지.. 이런 무임승차 마인드는 버리자

+ 거의 모든 줄에 print 를 찍어서 shape 및 전체 흐름을 한 눈에 정리하고 시작하자

+ 앞으로 계속 대회에 출전해서 데이터경진대회 시작 후 멘붕과 방황의 기간을 줄이자.