본문으로 바로가기

lecture2 분류와 유사성

category AIFFEL 대전/CS231N 2021. 1. 3. 04:15

1.Classification/분류

 

1)분류란 무엇인가?

 

유사하고 비슷한 것끼리 묶고, 상이하고 다른 것끼리는 나누는 것

유사하다는 것은?

사전적 의미 : 형)성격, 모습 등이 비슷하다. 

 

A와 B가 유사하다

 > A와 B의 속성이 비슷하다. 

 > 유사하다 vs 같다 는 유의해야함

 > A 전체와 B 전체를 비교할 수는 없다.

 

결국은, 

 > 속성(feature) : 어떤 속성을 기준으로 유사하다/아니다를 결정하느냐, 

 > 유사도(similarity) : 얼마나 유사해야 유사하다고 할 수 있는가

    유사한 정도를 수치로 표현할 수 있는가

    전제는 100% 유사한 것, 100% 다른 것은 존재하지 않는다. 결국 1~99% 정도의 차이

    유사하다/아니다의 경계(threshold)를 어떻게 정하느냐

 

2)유사도(simliarity) vs 거리(distance)

 > 비슷하다 = 유사성이 높다 = 거리 값이 작다 https://brunch.co.kr/@gimmesilver/39

 

 > 유사도를 어떻게 계산하는가?

  + 유사도의 종류 : 유클라디안 거리, 맨하탄 거리, 민코스키, 코사인, 마할라노비스, 자카드, 피어슨 등등 

  + 참고할 블로그/사이트들이 참 많다. 

https://goofcode.github.io/similarity-measure 유클라디안, 맨하탄, 민코스키, 코사인

https://m.blog.naver.com/PostView.nhn?blogId=cjh226&logNo=220810613028&proxyReferer=https:%2F%2Fwww.google.com%2F 유클라디안, 마할라노비스, 민코스키, 코사인, 

https://wikidocs.net/24654 유클라디안, 자카드

https://www.fun-coding.org/recommend_basic3.html 평균제곱차이, 코사인, 피어슨

 

 

2.이미지

'AIFFEL 대전 > CS231N' 카테고리의 다른 글

K-NearestNeighbor  (0) 2021.01.05
lecture2 linear classifier  (0) 2021.01.03
lecture2 이미지 분류의 어려움, 과거의 방식  (0) 2021.01.03
lecture2 preview, keyword  (0) 2021.01.02
lecture3 preview, keyword  (0) 2021.01.02