반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- decisiontree
- k-means
- 클러스터링
- machinelearning
- datascience
- 공공빅데이터청년인턴
- Kaggle
- Keras
- 데이터전처리
- 머신러닝
- ML
- DL
- 2023공빅데
- 공공빅데이터청년인재양성
- 2023공공빅데이터청년인재양성후기
- 분석변수처리
- ADsP3과목
- SQL
- 데이터분석
- DeepLearning
- data
- 텍스트마이닝
- NLP
- 빅데이터
- textmining
- 공빅데
- 2023공공빅데이터청년인재양성
- 공빅
- ADSP
- 오버샘플링
Archives
- Today
- Total
목록언더샘플링 (1)
愛林

Intro 데이터 전처리 과정에서 분석 변수 처리 과정에 대해 알아보고 있다. 분석 변수 처리에는 데이터 축소, 파생 변수 생성, 데이터 변환, 불균형 데이터 처리가 있다. 드디어 마지막, 불균형 데이터 처리(Imbalanced Data) 에 대해 알아보자. 불균형 데이터 (Imbalanced Data) 불균형 데이터란, 각변수가 가진 데이터에서 각 집단에 속하는 데이터의 수가 동일 하지 않은 상태이다. 많은 비율을 가진 집단의 정확도(Accuracy) 가 높아지고, 적은 비율을 가진 집단은 재현율(Recall) 은 작아지는 현상이 발생해 모형의 성능 판별에 어려움이 발생한다. - 정확도(Accuracy) : 전체 데이터 수 중 예측 결과와 실제 값이 동일한 건수가 차지하는 비율 - 재현율(Recall)..
Data Science/DATA
2022. 7. 10. 16:41