일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- NLP
- DL
- 공공빅데이터청년인재양성
- k-means
- 머신러닝
- 오버샘플링
- ML
- decisiontree
- datascience
- 빅데이터
- Keras
- 데이터분석
- 2023공공빅데이터청년인재양성
- 클러스터링
- 공빅데
- SQL
- 공공빅데이터청년인턴
- machinelearning
- textmining
- DeepLearning
- ADSP
- Kaggle
- ADsP3과목
- 2023공빅데
- 공빅
- 분석변수처리
- 데이터전처리
- 텍스트마이닝
- 2023공공빅데이터청년인재양성후기
- data
- Today
- Total
목록데이터 (2)
愛林
1과목 정리 ■ 데이터와 정보 1) 데이터의 유형 정성적 데이터 : 언어, 문자 데이터. 저장&검색&분석에 많은 비용이 소모된다. 정량적 데이터 : 수치, 도형, 기호 데이터. 자체로 데이터 분석을 할 수 있으며 정형화되어있어 분석에 비용 소모 ↓ 2) 지식 경영의 핵심 이슈 암묵지 : 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식 형식지 : 문서, 매뉴얼 등 형상화 된 지식 (암묵지를 문서화, 형식화시키면 형식지가 된다. 표출화시킨다고 함) 공통화 : 암묵지를 다른 사람에게 알려주는 것. 암묵적 노하우를 다른사람에게 알려준다. 표출화 : 암묵적 지식 노하우를 형식화시켜 형식지로 만드는 것. 연결화 : 책이나 교본 (형식) 에 자신이 알고 있는 지식(형식 + 형식) 추가 내면화 : 만들어진 형식지를..

이상값 (Outlier) 이상값은 데이터의 나머지 부분과 상당히 다른 데이터 요소 집합을 말한다. 관측된 데이터의 범위에서 많이 벗어난 아주 작은 값이나 아주 큰 극단값이다. 수집에서 문제가 생긴 Noise 와는 조금 다르다. (실무에서는 구별 안 한다고 한다.) 이상값의 유형에는 점 이상값(Point outlier), 상황값 이상값(Contextual outlier), 집단적 이상값(Collective outlier) 이 있다. 1) 점 이상값(Point outlier) : 다른 데이터와 비교하여 차이가 큰데이터가 발생하는 이상 2 ) 상황적 이상값 (Contextual outlier) : 상황에 따라 정상일 수도 있고 비정상일 수도 있는 데이터에 대해서 상황에 맞지 않는 데이터가 발생하는 이상 Ex ..