본문으로 바로가기

dacon_해빙예측대회 baseline 정리

category 카테고리 없음 2021. 4. 4. 03:03

1.대회 개요

 

1)링크

- dacon.io/competitions/official/235706/overview/description/

2)목적

- 1978년부터 2018년까지 40년간 매달 북극 빙하 사진(40*12, 482장)으로, 2019, 2020년 북극 빙하사진을 예측해보기

3)데이터

- 1달마다 주어진 데이터 파일은 해빙농도(0~250), 북극점, 해안선마스크, 육지 마스크, 결측값 5개 채널로 구성됨.

- 데이터 형식 : .npy 형식, 1채널 이미지(448*304)가 1d array(136,192*1) 형태로 되어있음. 변형해서 써야함.

- 평가는 f1 score 는 5~50% 사이 픽셀만 이용하여 계산함.

                       

 

2.baseline 정리

 

1)링크

 - dacon.io/competitions/official/235706/codeshare/2426?page=1&dtype=recent

2)파이프라인

segmentation UNet 구조 + 시계열 예측

 - encoder(mobilenetv2)

 - decoder(conv2dtranpose)

 - image time-series 분석(convlstm2d)

 

 

3.data shape flow

 

1)input data(482, 5, 448, 304, 1)의 image를 zero-padding 하여 image resize(448*304 => 448*320)

  - 이유는 차원축소(1/2)를 5번 하기에, 32의 배수로 맞춰야 복원했을때 dim 맞음

2)train/val/test dataset 나누기 : 326, 108, 48

3)encoder

 - (448, 320, 1) - (224, 160, 32) - (112, 80, 24) - (56, 40, 80) - (28, 20, 192) - (14, 10, 320)

4)decoder(역순으로 보면 됨)

 - (448, 320, 1) - (224, 160, 96) - (112, 80, 64) - (56, 40, 128) - (28, 20, 256) - (14, 10, 320)

5)concatenate(3,4), 직접 print 찍은 숫자

 - (448, 320, 1) - (224, 160, 128) - (112, 80, 208) - (56, 40, 320) - (28, 20, 832) - (14, 10, )

6)convlstm2d

 - (14, 10, 320) - (14, 10, 256)

 

 

4.적용한 것들

 

1)encoder : efficientnetb4 적용함

2)decoder : upsample, pix2pix 적용 못함

3)time-series 분석 : image 를 input으로 받는 rnn/transformer 기반 알고리즘 다양하게 적용 못함.

4)optimizer : adambelief 적용함, cyclic learning rate 는 이제 기본인듯.

5)data augmentation : albumentation 적용 못함

 

 

5.적용해보고 싶은 것들

 

opencv 의 contour 등 여러 함수들을 적용해보고 싶다

encoding 하여 여러 채널의 작은 이미지들로 차원 축소시켰는데, 결국 1-dim scalar data(기온)으로 축소할 수있는 방법?

시계열 분석의 다양한 기법들을 공부해보자.

 

 

6.느낀점들

 

아직 실력이 존나 부족하구나. 아직 스스로 처음부터 끝까지 뭔가를 할 준비가 전혀 되어있지 않구나.

대회 참여 기간이 길어지면, 자연스럽게 처음의 흥미와 동기부여는 떨어지게 되어있다. 이를 유지하는 것도 중요하고, 능력이다.

baseline은 처음에 참고하여 이해만 하고, 변수명 등 모든 것들을 새 파일에 새롭게 처음부터 코딩해야한다.

데이터를 마음껏 주무를 수 있어야 뭔가 아이디어가 떠올라도 바로 적용이 가능하다.

팀장/팀원들에게 폐 끼치지 않도록 더 많은 시간을 쏟았어야한다.

적용 가능한 아이디어와 불가능한 아이디어를 구분해서 적용 가능한 아이디어 위주에 집중해야한다.