반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- textmining
- 분석변수처리
- NLP
- ADsP3과목
- 데이터분석
- datascience
- 2023공공빅데이터청년인재양성후기
- 데이터전처리
- machinelearning
- 2023공빅데
- 공공빅데이터청년인재양성
- 공공빅데이터청년인턴
- Keras
- 텍스트마이닝
- data
- k-means
- 클러스터링
- DL
- ADSP
- 2023공공빅데이터청년인재양성
- 머신러닝
- 공빅
- Kaggle
- 빅데이터
- ML
- 오버샘플링
- DeepLearning
- decisiontree
- SQL
- 공빅데
Archives
- Today
- Total
목록맨해튼거리 (1)
愛林

K-NN 이나 우리가 이 다음에 알아볼 다른 머신러닝 기법들을 배우기 이전에, 먼저 데이터의 유사도와 비유사도 그리고 이를 측정하는 척도를 알아가는 것은 중요하다. 또한 군집분석을 할 때도 사용했었던 것들이다. 먼저 알아보도록 하자. 데이터 유사도, 비유사도 비유사도 ( Dis - Similarity , 거리(Distance) ) 두 개체(Object) 의 다른 정도에 대한 수치적인 척도로, 두 개체의 쌍이 더 닮을 수록 낮아진다. Distance(거리) 는 비유사도의 동의어이다. 하한은 0, 상한은 제한이 없다. 0에 가까우면 유사한 것 (거리가 가까운 것), 1에 가까우면 유사한 것이 아닌 것 (거리가 먼 것) 이다. 유사도 ( Similarity ) 두 개체(Object) 의 닮은 정도에 대한 수치..
Data Science/Machine Learning
2022. 8. 6. 00:44