반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- SQL
- 텍스트마이닝
- 2023공공빅데이터청년인재양성후기
- 공빅
- Keras
- datascience
- DL
- k-means
- 공공빅데이터청년인턴
- data
- 분석변수처리
- textmining
- 빅데이터
- 2023공빅데
- machinelearning
- Kaggle
- ADSP
- ML
- 2023공공빅데이터청년인재양성
- 머신러닝
- decisiontree
- 공공빅데이터청년인재양성
- 공빅데
- 데이터분석
- 클러스터링
- 오버샘플링
- DeepLearning
- ADsP3과목
- 데이터전처리
- NLP
Archives
- Today
- Total
목록이상값처리 (1)
愛林

이상값 (Outlier) 이상값은 데이터의 나머지 부분과 상당히 다른 데이터 요소 집합을 말한다. 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰 극단값이다. 수집에서 문제가 생긴 Noise 와는 조금 다르다. (실무에서는 구별 안 한다고 한다.) 이상값의 유형에는 점 이상값(Point outlier), 상황값 이상값(Contextual outlier), 집단적 이상값(Collective outlier) 이 있다. 1) 점 이상값(Point outlier) : 다른 데이터와 비교하여 차이가 큰데이터가 발생하는 이상 2 ) 상황적 이상값 (Contextual outlier) : 상황에 따라 정상일 수도 있고 비정상일 수도 있는 데이터에 대해서 상황에 맞지 않는 데이터가 발생하는 이상 Ex ..
Data Science/DATA
2022. 7. 6. 22:29