2022 공공빅데이터분석 청년인재 양성(공공빅데이터 청년인턴) 4주차
4주차 일정.
4주차 첫째날 (2022.07.11 Mon)
데이터 분석 알고리즘을 이해하는 날.. 이라고 하지만 사실 Python 으로 통계 관련 실습을 하는 날이다.
사전 교육 때 배웠던 내용들이나 우리가 이전에 실습할 때도 했던
여러가지 시각화들을 실습해본다.
표본추출, 기초통계, 통계 시각화, 다변량 데이터 탐색 실습을 진행한다.
표본 추출은 뭔가 내용이 낯설지 않은데 ..?
이전에 Sampling 실습에서 했던 내용과 유사했다.
거기선 불균형 데이터를 맞춰주기 위하여 오버 샘플링, 언더 샘플링 등을 실습했다면 ..
이번에는 우리가 통계 사전 교육에서도 배우고 했던
랜덤 표본 추출, 복원 랜덤 표본 추출, 계통 추출, 층화 확률 표본 추출 등을 실습한다.
기초 통계에서는 평균, 중앙값, 최빈값, 산포도등등 ..
데이터 표현 방법 ? 말 그대로 기초 통계를 실습한다.
이후 시각화 패키지를 통해서 시각화까지 진행함.
시각화 실습은 그냥 box-plot , 막대 그래프 등을 시각화 하는 실습을 한다.
다변량데이터 실습은 독립 변수가 여러 개인 다변량 데이터를 히트맵이나 산점도 행렬로 시각화한다.
이 날 했던 건 완전히 통계공부라서 ..!!
이전에 사전교육으로 들었던 통계강의들을 복습하고 오는 것을 추천한다 ..!
사전교육 열심히 들었으면 강의들으면서 기억남.
근데 4주차쯤 되면 솔직히 기억 잘 안 나니까 한번쯤 보고 오는 거 추천
+
그리고 .. 강사님의 설명이 조금 부족한 느낌을 받았다 ..ㅠㅠ(내 기준)
근데 당연할 수밖에 없는 게 우리는 이미 사전 교육으로 통계를 어느 정도 안다는?
가정 하에서 수업을 진행했기에..!
통계지식이 부족하다면 강의 내용보다
그냥 사전교육 강의를 듣는 것을 추천한다 ..ㅎ..
통계 측면에서는 사전교육 통계 강의 퀄리티가 훨 ~ 씬 좋은 느낌이었다.
4주차 둘째날 (2022.07.12 Tue)
둘째날에는 어제와 같이 통계 기반 데이터분석을 배운다.
사전교육을 잘 들었다면 생각이 날..
t분포나 카이제곱 분포 등을 배우고 실습하는 시간을 가진다 ..
강의듣고 실습하고 강의듣고 실습하고의 반복 ..
4주차 셋째날 (2022.07.13 Wed)
통계를 기반으로 한 데이터 분석을 진행하는 셋째날...
왜 지옥의 4주차라고 하는 지 알 것 같은 셋째날..
확실하게 저번보다 더 더 힘들다..
하루에 해야 하는 실습들도 양이 많고, 내용도 통계적인 부분이 들어가서 더 어렵다.
동시에 코드 해석까지 ..
그리고..무엇보다.. 4주차쯤 되니 그냥 힘들다...
체력적으로나.. 지식적으로나 ..ㅎㅎ ㅠㅠ
분명 중도포기가 나왔을 것이다...
몰아치는 코드들과 .. 몰아치는 통계들 ...^^
지옥주..맞네요 ㅋㅋ
통계 베이스가 없다면 .. 실습 시간을 내용을 이해하는 데만 다 쏟아부을 수 있다..
용어도 어렵다. p-value, t-검정, 카이제곱, 분산분석 ..ㅠㅠㅠ
시각화를 도와주는 Python 의 matplotlib 같은 라이브러리들도 이해해야 하기 때문에 ..
정보량도 많고 확실히 정말 어렵다.
통계는 정말 ... 사전교육을 잘 들어야 할 것 같다 .
파이썬도 중요하지만..
통계에 대한 이해도 아주 중요한 것 같다 ..
그리고 통계에 대한 설명도 부족하니..^^..
통계공부를 정말 열심히 해 오면 좋을 것 같다.
4주차 넷째날 (2022.07.14 Thu)
오늘은 Q-GIS 를 학습했다.
드디어드디어 GIS !
사전교육 때 들은 Q-GIS 수업이 가물가물할 때쯤
GIS 수업을 들었다.
오전에는 지루한 ..ㅎㅎ GIS 기본 원리 이론 수업 ..
강사님 ..
이론 수업 정말정말 진도가 잘 안 나가서 조금 지루하다
근데 오후 수업 시작하고 실습 진행하시는데 ..
강사님 진짜 실습은 세상 빠르게 진행하신다 ..
이 날은 간단한 것만 해서 괜찮았지만
그래도 세부적인 설명 같은 것을 놓치게 되는 것 같아 아쉬웠다.
강의를 보고 바로바로 따라하는 것이 제일 좋을 것 같은데 ,
그냥 쉴 틈 없이 바바바박 하셔서 정신이 아득해진다.
구글맵을 불러오는 실습을 진행했다.
이거 말고도 OpenStreetMap 도 있다.
나는 실습할 때 구글맵보다 OpenStreetMap 을 더 많이 사용했다.
레이어를 추가해서 point, line, polygon 객체까지 생성해보는..
간단한 실습을 했다.
확실히 Python 할 때보다는 사람들도 수월해보이고 ..
나도 수월했다 ..! 시각적으로도 훨씬 다채로워서 할 만 하다 !
일단 GIS 자체가 신기한 게 한 몫 하는듯.
4주차 마지막날 (2022.07.15 Fri)
지옥주 4주차 마지막 날.
이 날도 하루종일 Q-GIS 를 실습했다.
역시나 Python 만큼 실습할 게 많았지만, Python 만큼 딥한 이해를 바탕으로 하는 건 아니고
그냥 강의안에 나오는 걸 따라하는 거라서 조금 더 수월하다.
그렇지만 ..
뭐가 뭔지도 어렵고, 설정할 게 많음에도 불구하고 강사님께서
강의를 따라올 수 만큼 빠르게 하신다. (강의 끝나고 하려면 기억 안 난다.)
그리고 실습도 많고 ..
에러가 나기도 해서 힘들었다.
Python 에서는 뭐가 문제인 지는 알았는데 ,
Q-GIS 는 처음이라서 뭐가 문제인 지도 모르고 ..
그래서 어려움을 겪었던 것 같다.
프로그램이 좀 무거운 것 같기도 하고..?
아무래도 GIS 가 여러모로 좀 거대하다 보니까
노트북에서도 여러가지 에러가 나면서 ..
가끔 Q-GIS 가 예기치 않게 종료가 되곤 하는데 ..
그 때마다 힘들어진다...
물론 shp 파일로 중간중간 저장하면서 불러오기 때문에 돌이킬 수 없는 상황까지는 가지않지만 ..?
중간중간 저장하면서 하는 것을 추천한다.
레이어 같은 것도 바로바로 저장해야 에러도 안 나고,
갑자기 종료되었을 때 바로바로 불러올 수 있다 ..ㅠㅠ
그리고
Q-GIS 설치는 홈페이지 들어가서 하지 말고 꼭 꼭 실습파일 제공한 걸로 설치해야 한다.
교육을 받을 때는 하라는 대로 하는 게 중요하다.
개발환경이나 버전 등이 모두 잘 맞아야 안정적으로 실습할 수 있다.
오늘 이거 때문에 버전이 안 맞아서 나는 에러 때문에 한참을 잡고 있던 교육생분들을
정말정말 많이 봤다..
아무튼간에 Q-GIS 도 무사히 마무리 한 이번주도 끝이다.
왜 지옥의 4주차라고 하는 지 알 것 같았던 이번 한 주다..
이번 주는 특히나 길었던 한 주..

파이썬도 힘들고, 실습하는 것도 힘들고, 통계도 힘들고, Q-GIS도 재밌다고 해놓고 ..
힘들었다..ㅠㅠ 나만 그랬나 ..
아무튼 무사히 끝나서 다행이다.
다음 주엔 교육도 거의 끝나고 .. 프로젝트 조가 시작된다 !
벌써 조가 바뀌다니 시원섭섭해지는 것 같다.
곧 총괄평가도 다가오니, 공부도 열심히 해야한다 ..
이번 한 주만 해도 진짜 미친듯한 정보량들이 몰아쳤지만 ...
그래서 복습할 것도 너무너무 많지만 ...
힘내는 수 밖에 없다.
파이팅.