본문으로 바로가기

1.데이터

학습 데이터 셋(문장들) : "이 영화를 끝까지 본다는 것은 너무나도 힘든 일이며.. "

라벨링(긍/부정) : 0(부정)

 

2.문장 =>> vector, 워드 임베딩(word embedding) : 

1) 원-핫 벡터(0/1) : 단어("점심") => 원핫 벡터([0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ...])

2) 임베딩 벡터(실수) : 단어("안녕") => 임베딩 벡터([0.9123, 0.746, 0.178 ....])