'언더샘플링' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록언더샘플링 (1)

愛林

Python으로 배우는 데이터 전처리 이해(II) - 불균형 데이터 처리(Imbalanced Data) - 언더 샘플링(Under Sampling)

Intro 데이터 전처리 과정에서 분석 변수 처리 과정에 대해 알아보고 있다. 분석 변수 처리에는 데이터 축소, 파생 변수 생성, 데이터 변환, 불균형 데이터 처리가 있다. 드디어 마지막, 불균형 데이터 처리(Imbalanced Data) 에 대해 알아보자. 불균형 데이터 (Imbalanced Data) 불균형 데이터란, 각변수가 가진 데이터에서 각 집단에 속하는 데이터의 수가 동일 하지 않은 상태이다. 많은 비율을 가진 집단의 정확도(Accuracy) 가 높아지고, 적은 비율을 가진 집단은 재현율(Recall) 은 작아지는 현상이 발생해 모형의 성능 판별에 어려움이 발생한다. - 정확도(Accuracy) : 전체 데이터 수 중 예측 결과와 실제 값이 동일한 건수가 차지하는 비율 - 재현율(Recall)..

Data Science/DATA 2022. 7. 10. 16:41

이전 Prev 1 Next 다음

목록언더샘플링 (1)

愛林

티스토리툴바