반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 데이터분석
- textmining
- 2023공공빅데이터청년인재양성후기
- 오버샘플링
- SQL
- 2023공빅데
- decisiontree
- k-means
- 2023공공빅데이터청년인재양성
- DeepLearning
- 공빅데
- Kaggle
- 머신러닝
- 텍스트마이닝
- NLP
- 공공빅데이터청년인재양성
- datascience
- ADsP3과목
- ML
- 공빅
- data
- 공공빅데이터청년인턴
- machinelearning
- 데이터전처리
- 클러스터링
- 빅데이터
- ADSP
- 분석변수처리
- DL
- Keras
Archives
- Today
- Total
목록이상값처리 (1)
愛林

이상값 (Outlier) 이상값은 데이터의 나머지 부분과 상당히 다른 데이터 요소 집합을 말한다. 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰 극단값이다. 수집에서 문제가 생긴 Noise 와는 조금 다르다. (실무에서는 구별 안 한다고 한다.) 이상값의 유형에는 점 이상값(Point outlier), 상황값 이상값(Contextual outlier), 집단적 이상값(Collective outlier) 이 있다. 1) 점 이상값(Point outlier) : 다른 데이터와 비교하여 차이가 큰데이터가 발생하는 이상 2 ) 상황적 이상값 (Contextual outlier) : 상황에 따라 정상일 수도 있고 비정상일 수도 있는 데이터에 대해서 상황에 맞지 않는 데이터가 발생하는 이상 Ex ..
Data Science/DATA
2022. 7. 6. 22:29