1.대회 개요
1)링크
- dacon.io/competitions/official/235706/overview/description/
2)목적
- 1978년부터 2018년까지 40년간 매달 북극 빙하 사진(40*12, 482장)으로, 2019, 2020년 북극 빙하사진을 예측해보기
3)데이터
- 1달마다 주어진 데이터 파일은 해빙농도(0~250), 북극점, 해안선마스크, 육지 마스크, 결측값 5개 채널로 구성됨.
- 데이터 형식 : .npy 형식, 1채널 이미지(448*304)가 1d array(136,192*1) 형태로 되어있음. 변형해서 써야함.
- 평가는 f1 score 는 5~50% 사이 픽셀만 이용하여 계산함.
2.baseline 정리
1)링크
- dacon.io/competitions/official/235706/codeshare/2426?page=1&dtype=recent
2)파이프라인
segmentation UNet 구조 + 시계열 예측
- encoder(mobilenetv2)
- decoder(conv2dtranpose)
- image time-series 분석(convlstm2d)
3.data shape flow
1)input data(482, 5, 448, 304, 1)의 image를 zero-padding 하여 image resize(448*304 => 448*320)
- 이유는 차원축소(1/2)를 5번 하기에, 32의 배수로 맞춰야 복원했을때 dim 맞음
2)train/val/test dataset 나누기 : 326, 108, 48
3)encoder
- (448, 320, 1) - (224, 160, 32) - (112, 80, 24) - (56, 40, 80) - (28, 20, 192) - (14, 10, 320)
4)decoder(역순으로 보면 됨)
- (448, 320, 1) - (224, 160, 96) - (112, 80, 64) - (56, 40, 128) - (28, 20, 256) - (14, 10, 320)
5)concatenate(3,4), 직접 print 찍은 숫자
- (448, 320, 1) - (224, 160, 128) - (112, 80, 208) - (56, 40, 320) - (28, 20, 832) - (14, 10, )
6)convlstm2d
- (14, 10, 320) - (14, 10, 256)
4.적용한 것들
1)encoder : efficientnetb4 적용함
2)decoder : upsample, pix2pix 적용 못함
3)time-series 분석 : image 를 input으로 받는 rnn/transformer 기반 알고리즘 다양하게 적용 못함.
4)optimizer : adambelief 적용함, cyclic learning rate 는 이제 기본인듯.
5)data augmentation : albumentation 적용 못함
5.적용해보고 싶은 것들
opencv 의 contour 등 여러 함수들을 적용해보고 싶다
encoding 하여 여러 채널의 작은 이미지들로 차원 축소시켰는데, 결국 1-dim scalar data(기온)으로 축소할 수있는 방법?
시계열 분석의 다양한 기법들을 공부해보자.
6.느낀점들
아직 실력이 존나 부족하구나. 아직 스스로 처음부터 끝까지 뭔가를 할 준비가 전혀 되어있지 않구나.
대회 참여 기간이 길어지면, 자연스럽게 처음의 흥미와 동기부여는 떨어지게 되어있다. 이를 유지하는 것도 중요하고, 능력이다.
baseline은 처음에 참고하여 이해만 하고, 변수명 등 모든 것들을 새 파일에 새롭게 처음부터 코딩해야한다.
데이터를 마음껏 주무를 수 있어야 뭔가 아이디어가 떠올라도 바로 적용이 가능하다.
팀장/팀원들에게 폐 끼치지 않도록 더 많은 시간을 쏟았어야한다.
적용 가능한 아이디어와 불가능한 아이디어를 구분해서 적용 가능한 아이디어 위주에 집중해야한다.