일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 클러스터링
- Kaggle
- 공공빅데이터청년인턴
- Keras
- 2023공공빅데이터청년인재양성
- 빅데이터
- DL
- 오버샘플링
- 2023공빅데
- textmining
- ADSP
- k-means
- data
- decisiontree
- datascience
- 데이터전처리
- machinelearning
- 2023공공빅데이터청년인재양성후기
- ADsP3과목
- ML
- 분석변수처리
- 데이터분석
- 텍스트마이닝
- SQL
- 공공빅데이터청년인재양성
- 공빅데
- 머신러닝
- 공빅
- NLP
- DeepLearning
- Today
- Total
목록decisiontree (3)
愛林

저번 시간에는 배깅과 보팅에 대해서 알아보았다면, 배깅 https://wndofla123.tistory.com/67 [Python/MachineLearning] 앙상블 알고리즘 (Ensemble Algorithms) : 배깅 (Bagging) 이전에는 의사결정나무에 대해 알아보았다. 이번엔 앙상블 알고리즘에 대해 알아보자. 앙상블 알고리즘 (Ensemble Algorithms) 앙상블 알고리즘이란, 일련의 분류 기준을 구성한 후 예측 가중치 투표 wndofla123.tistory.com 보팅 https://wndofla123.tistory.com/68 [Python/MachineLearning] 앙상블 알고리즘 (Ensemble Algorithms) : 보팅 (Votting) https://wndofla..

Boston Housing Price Data (보스턴 주택 가격 데이터) 보스턴 주택 가격 데이터는 레코드 수 506개, 필드 개수 14개로, 보스턴 시의 주택가격에 대한 데이터이다. 주택의 여러가지 요건들과 주택의 가격정보가 포함되어 있는 데이터이다. 보스턴 주택 데이터는 여러 개의 측정 지표들 (범죄율, 학생/교사 비율) 을 포함한, 보스턴 인근의 주택 가격의 중앙값(median value) 이다. 필드 설명 - CRIM : 자치시(town) 별 1인당 범죄율 - ZN : 25000 평방피트를 초과하는 거주 지역의 비율 - INDUS : 비소매상업지역이 점유하고 있는 토지의 비율 - CHAS : 찰스강에 대한 더미변수 ( 강의 경계에 위치하면 1, 아니면 0 ) - NOX : 10ppm 당 농축 일..

Decision Tree (의사결정나무) 의사결정트리는, 데이터들이 가진 속성들로부터 분할 기준 속성을 판별하고, 분할 기준 속성에따라서 트리 형태로 모델링하는 분류 및 예측 모델이다. 불순도와 순수도, 트리 깊이(Depth) 를 설정한다. 의사결정나무는 나무 구조에 의해서 모델이 표현되기 때문에 해석이 쉬우며, 새로운 자료에 모델을 적합시키기가 쉽다. 두 개 이상의 변수가 결합하여 종속변수에 어떠한 영향을 주는 지에 대해 알기가 쉽다. 그리고 이상치에 또한 민감하지 않다. 그러나, 연속형 변수를 비연속적인 값으로 취급하기 때문에 예측 오류가 클 가능성이 높다. 그리고 선형 또는 주 효과 모델에서와 같은 결과를 얻을 수 없고 분석용 자료에만 의존하기 때문에 새로운 자료의 예측에는 불안정한 모습을 보인다...