일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- NLP
- data
- decisiontree
- machinelearning
- Kaggle
- datascience
- SQL
- 공빅데
- 2023공공빅데이터청년인재양성
- ADSP
- 2023공공빅데이터청년인재양성후기
- textmining
- 데이터전처리
- 오버샘플링
- 텍스트마이닝
- 공공빅데이터청년인재양성
- k-means
- DL
- ML
- 데이터분석
- 2023공빅데
- 클러스터링
- Keras
- 공빅
- 빅데이터
- 분석변수처리
- 머신러닝
- ADsP3과목
- 공공빅데이터청년인턴
- DeepLearning
- Today
- Total
목록Data Science/통계 (5)
愛林

카이제곱 검정(Chi Squaare test) 카이제곱검정은, 카이제곱분포에 기초한 통계적 방법으로, 관찰된 빈도가 기대되는 빈도와 의미있게 다른지의 여부를 검정하기 위해 사용되는 검정방법이다. 예를 들면, 남자와 여자의 성별에 따라서 선호하는 공부장소의 차이가 있는가 ? 귀무가설 : 성별에 따라 선호하는 공부장소의 차이가 없다. 대립가설 : 성별에 따라 선호하는 공부장소의 차이가 있다. (연관성이 있다.) 귀무가설 : 분할표의 행과 열은 독립적이다. 대립가설 : 분할표의 행과 열은 독립적이지 않다. (연관성,종속성이 있다.) 를 검정하기 위해, 이러한 검정 절차를 밟는다. 가설 세우기 -> 분할표 -> 관측값 및 기대값 도출 -> 검정 통계량 산출 -> 자유도 -> 유의수준, 기각역 수집하는 자료 데이..

기술통계 (Descriptive Statistics) 평균, 분산, 표준편차 등에 대해 알아보는 시간이었다. 기술통계 (Descriptive statistics) 는, 조사 및 측정된 자료를 통해 그 자료가 가지고 있는 특징을 수치, 표, 그래프로 정리하는 과정이다. 기술 통계 기법으로는 평균값, 중앙값, 최빈값, 최대값, 최소값, 범위, 분산, 표준편차, 그래프 등이 있다. 탐색적 데이터 분석이라고 하기도 한다. - > 기술통계이다. ● 탐색적 데이터 분석의 주제는 4가지가 있는데, 1. 저항성의 강조 저항성이란, 데이터의 일부가파손되었을 때 영향을 적게 받는 성질을 말한다. 2. 잔차의 해석 잔차란, 관찰값들이 주경향으로부터 얼마나 벗어나는 지를 알 수 있는 척도이다. 3. 데이터의 재표현 데이터의 ..

하 이 강의는 꽤나 길었음. 한 5시간짜리였나. 그래서 요약할려니까 또 힘드네 ㅎㅎ ;;; 그래도 .. 공부해야지 ..! 사실 옮겨적는 게 얼마나 도움이 되는 지는 잘 모르겠지만 .. 안 하는 것보다야 낫다고 생각한다 ! ;; 앞의 강의랑 겹치는 것도 있어서.. 조금 질리는 것도 있음 ㅠ 안 겹치는 부분만 적을까 ㅠㅠㅠㅠ;; 1. 표본과 정규분포 표본추출법(Sampling methods) 표본을 추출하는 방법에는 단순 무작위 추출법, 체계적 표본 추출법, 층화 표본 추출법, 군집 표본 추출법이 있다. 1) 단순 무작위 추출법 (Simple Random sampling) 가장 기본이 되는 추출법으로 무작위로 뽑는다. 시간이 많이 소요될 수 있고 표본이 편중될 가능성을 완전히 배제하기 힘들다. 어떤 한 개체..

어제에 이어 계속되는 통계 기초 이론 .. 이 강사님은 되게 강의를 체계적으로 ? 교수님같이 잘 해주셨다. 근데 진짜 교수님인 것 같았음. 1. 통계학 어디서든 데이터가 수집되고, 그 정보를 유용하게 하기 위해서는 통계적 지식이 요구된다. 직업에 상관없이 세상을 이해하고 본인의 직업에 정통하기 위해서는 통계학 지식이 필요하다. 통계학은 결국 좀 더 효과적인 개인적 및 전문적 의사결정에 기여한다. 통계(statistic) 란, 수치적인 사실이며 분석의 대상이 되는 집단에 대해 실시한 조사나 실험의 결과로 얻은 결과치, 혹은 그 결과치들이 요약된 상태이다. ex : 연간 물가상승률은 0.7%다. 주가지수, 물가지수, 일기예보, 실업률, 대학 입시 경쟁률 등등 모두 통계이다. 통계학(statistics) 은 ..

고등학교 때 배운 확통 이후로는 통계를 접해 본 적이 없던 나.. 통계 공부 시작하자 .. 1. 통계학의 중요 용어와 개념 모집단(Population) : 정보를 얻고자 하는 관심 대상의 전체 집합을 말함 표본(Sample) : 전체 집합의 데이터를 수집하는 것이 불가능하여 모집단 데이터의 일부만 수집한 것. 아무래도 전체 모집단은 큰 경우가 많기 때문에 .. 전수조사가 힘들 경우 표본을 추출해서 데이터를 수집한다. 여기서 모집단의 특성을 수치로 나타내면 모수(Parameters), 표본의 특성을 수치로 나타낸 것은 통계량 (statistic) 이라고 한다. 양적 변수 : 크기, 무게, 점수, 인구 수 등 수치로 나타낼 수 있는 변수. 양적 연수는 다시 연속형 변수, 이산형 변수가 있다. 연속형 변수는 ..