반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 2023공빅데
- NLP
- 텍스트마이닝
- 데이터분석
- DeepLearning
- ML
- data
- 데이터전처리
- 클러스터링
- Keras
- 공빅
- DL
- Kaggle
- k-means
- ADSP
- 분석변수처리
- 공공빅데이터청년인재양성
- textmining
- 2023공공빅데이터청년인재양성
- 2023공공빅데이터청년인재양성후기
- ADsP3과목
- 공공빅데이터청년인턴
- 공빅데
- decisiontree
- machinelearning
- datascience
- 빅데이터
- SQL
- 오버샘플링
- 머신러닝
Archives
- Today
- Total
목록차원축소 (1)
愛林

드디어 전처리가.. 끝나간다...! Intro 전처리에 대해 배우고 있다. 전처리란 데이터에서 중요한 요소를 뽑아내고, 데이터의 다양성과 데이터 형태의 품질을 확보하는 것이다. 데이터 전처리 과정에는 데이터 정제와 분석변수처리가 있는데, 우리는 분석변수처리에 대해 공부하고 있다. 분석변수처리에는 데이터 축소, 파생변수 생성, 데이터 변환, 불균형 데이터 처리가 있다. 이전 시간에는 불균형 데이터를 처리하는 법에 대하여 알아보았다.불균형 데이터를 처리하는 방법에는 오버샘플링과, 언더샘플링이 있었다. 직전에는 오버샘플링(OverSampling) 을 진행했다.오버 샘플링은 낮은 클래스의 데이터를 높은 클래스의 데이터 양만큼 데이터 수를 늘려서비율을 맞추어 주는 것이다. https://wndofla123.tis..
Data Science/DATA
2022. 7. 13. 23:23