1.Classification/분류
1)분류란 무엇인가?
유사하고 비슷한 것끼리 묶고, 상이하고 다른 것끼리는 나누는 것
유사하다는 것은?
사전적 의미 : 형)성격, 모습 등이 비슷하다.
A와 B가 유사하다
> A와 B의 속성이 비슷하다.
> 유사하다 vs 같다 는 유의해야함
> A 전체와 B 전체를 비교할 수는 없다.
결국은,
> 속성(feature) : 어떤 속성을 기준으로 유사하다/아니다를 결정하느냐,
> 유사도(similarity) : 얼마나 유사해야 유사하다고 할 수 있는가
유사한 정도를 수치로 표현할 수 있는가
전제는 100% 유사한 것, 100% 다른 것은 존재하지 않는다. 결국 1~99% 정도의 차이
유사하다/아니다의 경계(threshold)를 어떻게 정하느냐
2)유사도(simliarity) vs 거리(distance)
> 비슷하다 = 유사성이 높다 = 거리 값이 작다 https://brunch.co.kr/@gimmesilver/39
> 유사도를 어떻게 계산하는가?
+ 유사도의 종류 : 유클라디안 거리, 맨하탄 거리, 민코스키, 코사인, 마할라노비스, 자카드, 피어슨 등등
+ 참고할 블로그/사이트들이 참 많다.
https://goofcode.github.io/similarity-measure 유클라디안, 맨하탄, 민코스키, 코사인
https://m.blog.naver.com/PostView.nhn?blogId=cjh226&logNo=220810613028&proxyReferer=https:%2F%2Fwww.google.com%2F 유클라디안, 마할라노비스, 민코스키, 코사인,
https://wikidocs.net/24654 유클라디안, 자카드
https://www.fun-coding.org/recommend_basic3.html 평균제곱차이, 코사인, 피어슨
2.이미지
'AIFFEL 대전 > CS231N' 카테고리의 다른 글
K-NearestNeighbor (0) | 2021.01.05 |
---|---|
lecture2 linear classifier (0) | 2021.01.03 |
lecture2 이미지 분류의 어려움, 과거의 방식 (0) | 2021.01.03 |
lecture2 preview, keyword (0) | 2021.01.02 |
lecture3 preview, keyword (0) | 2021.01.02 |