愛林

2022 공공빅데이터분석 청년인재 양성(공공빅데이터 청년인턴) 3주차 본문

Data Science/슬기로운 공빅생활

2022 공공빅데이터분석 청년인재 양성(공공빅데이터 청년인턴) 3주차

愛林 2022. 7. 9. 00:22
반응형

3주차 일정

이번 주는 전처리 대전이라고 불리더라 ..

데이터 전처리를 배웠다..

이틀밖에 안 했지만 이번 주 내내 전처리를 복습했다.. ㅠ

데이터 전처리에 탈 탈 털렸다 .... SQL 보고싶어.

 


3주차 첫째날 (2022.07.04 Mon)

 

 

처음으로 데이터 전처리라는 것을 배운 날 ..

머리가 아찔해지기 시작한다.

데이터 전처리 이해, 데이터 실수화, 결측값 처리, 이상값 처리, 변수선택까지 배웠다.

 

너무 짧은 시간에 너무 많은 진도를 나가는 느낌 ..?

그리고 지금부터는 정말로.. 복습을 하지 않으면 못 따라갈 것 같은 느낌이다.

그리고 비전공자들은 이제 슬슬 버거워지기 시작할 것 같다 ..

 

Python 도 어렵고..

처음에 코딩을 시작할 때는 오타와의 싸움이 시작되는데 ..?

(코드를 그대로 줌에도 에러가 나는 건 보통은 오타, 줄맞추기를 안 해서 발생하는 것 같다.)

 

한 번도 코딩을 해보지 않은 사람은 이런 오타를 발견하는 게 무척 어려워보였다..

나는 Python 을 몇 번 다루어보았고, 몇  개의 언어들을 접해본 (진짜 접해보기만 함)

경험이 있어서 에러 해결에는 큰 문제가 없었지만..

 

처음 코딩 하시는 분들은 무척 어려워보였다.

사실상 실습코드를 다 줌에도 불구하고 따라오기 힘들어 보이셨음.

실습시간도 넉넉하게 주시지만, 비전공자에게까지 넉넉한 느낌은 아니었다.

 

근데 이번 기수에는 일단 전공자들이 많다고 들었다.

그래서 좀 더 팽팽하게 진도를 나가는 느낌 ..?

 

그리고 단시간에 진도를 팍! 팍! 나가서 이 내용들을 모두 수업 시간 내에 완벽하게

머리에 넣어올 수는 없다 .. 꼭, 꼭.. 복습이 필요할 듯..

 

엄청 자세하게 알려주지도 않을 뿐더러,

강의를 듣다가도 이게 무슨 말이지 ? 싶다. 

SQL 할 때는 강의 들으면서 어느정도 이해가 갔었는데.. 데이터 전처리부터는...ㅠ

SQL 은 사전지식이 어느정도 있지만 내가 데이터 전처리는 경험이 얼마 없어서 그럴 수도 있음.

 

 


3주차 둘째날 (2022.07.05)

 

 

둘째날도 어김없이 데이터 전처리를 배운다.

파생변수 생성, 변수변환, 불균형 데이터 처리, 차원축소 를 배웠다.

 

첫째날과 같은 상태이다 ..

사실 그 전날에 한 것도 버거웠는데.. 그 전 날에 한 것도 이해가 잘 가지 않는 상태에서

더 어려운 걸 구겨넣으니 머리가 터진다 ㅠ

 

그렇지만 ..데이터 전처리는 분석에서 무척! 무척 중요하다고 하니 혼자서 복습을 해야겠지 ..

진짜 코드를 다 줌에도 불구하고 이해가 잘 안 간다 !

혼자서 구글링도 해보고, 계속 연습하면서 머리에 넣는 것이 방법일 것 같다.

 

강의도 길고, 앉아서 코딩만 하니 엉덩이랑 허리도 아프다 ..ㅠㅠ

점심 시간을 빼고는 거의 7-8시간을 내리앉아있으니 ...스트레칭 필수다. 

데이터 전처리 실습한 걸 제출하지 못하면 집에 못 가는데 ..

위에 적었듯이 비전공자들에게는 이해는 물론 실습하기엔 너무나도 짧은 시간이다.

(물론 한 차수당 1시간 가까이 주기는 한다.)

Python 에 대한 이해를 확실하게 하고 와야 무리가 없을 듯 하다! (그래도 진도 너무 빠름 ㅠㅠ)

 

비전공자분들은 뭔지는 모르지만 아무튼간에 집은 가야하니 ..

그리고 실습 시간이 터무니 없이 부족하니 강의시간에도 미리 실습을 하고 계신다 ㅠㅠ

(어쩔 수 없음 아니면 진짜 집에 못 갈 수도 있음)

(그래도 진짜 집에 못 가지는 않습니다)

 

너무 무서웡

 

강의를 들어도 감이 잘 안 잡히지만 그것마저 듣지 못하니 이해도는 더 떨어지고

공부할 건 더 많아질 수 밖에 ..ㅠㅠ 사실 나도 아직 잘 모르겠다 ㅠㅠㅠㅠㅠ

데이터 전처리 너무 어려워 살려줘..

 

실습파일

 

 


3주차 셋째날 (2022.07.06 Wed)

 

 

조가 바뀌었다 ㅠ

프로젝트 하는 조는 또 다르다고 ...

여러 사람들이랑 친해지라는 의미같다.

 

오늘은 공공빅데이터 시각화와 방법론 이해라는 것을 배웠다 !

그래프나 시각화에 대해서 배웠고,

이를 이용해서 그래프를 분석하는 워크샵을 진행했다.

뭐 딱 봤을 때 나오는 것들.. 다른 조 분들도 비슷하게 하셨더라.

 

오후 수업서는 빅데이터 분석 방법론 이해를 배웠다.

그냥 이론수업만 쭉~  하고,

분석 프로젝트 계획서 워크샵을 했다.

 

중간에 행정안전부 관계자분들이 오셔서 우리 뭐 불편한 점은 없는지 ,

질문할 거 있는 지 확인하러 오셨다 !

교육생들한테 진짜 신경 많이 써주시는 느낌이었다.

 


 

 

3주차 넷째날 (2022.07.07 Thu)

 

 

오늘은 공공데이터분석 방법론에 대한 강의를 듣고 워크샵을 진행했다.

 

Case Study 라고 직접 한 사례들을 보여주셨던 것 같다.

그래서 조금 지루한 감이..ㅎㅎㅎ;;;

그래도 나는 이론강의보다 직접 예시를 보여주는 게 나은 것 같다 !

 

이후에는 우리 선배 기수가 했던 데이터 분석 보고서를 보고 분석 결과 보고서를 작성했다.

솔직히 내가 하라고 하면 이거보다 못 할 것 같은데 ...
트집을 잡아야 해서 ..^^ 

아는 것도 없는 감자 주제에 보고서를 분석했다...

 

 

사실 너무 잘하셨어요 흑흑흑

이후에는 어제 했던 워크샵을 바탕으로 해서

마인드맵이랑 분석 논리 모형을 설계했다. 

 

 

이후에는 분석 프로세스를 를 바탕으로 발표하는 시간을 가졌다.

 

 


 

3주차 마지막날 (2022.07.08 Fri)

 

오늘은 다시 SQL 을 통한 정형데이터 다루기 를 했다 !

일주일 만의 SQL 이지만 ..

한 주에 배우는 것들이 너무 많다보니 앞에서 배우는 걸 거의 다 까먹는 것 같다..ㅠㅠ

복습을 필수로 해야 하는 이유...

 

아직 데이터 전처리 복습도 다 못 했는데 ...

SQL 복습은 언제 다 하나요 ..? 

복습 생각보다 얼마 안 걸린다고 하셨는데 나는 정말 오래 걸린다.

블로그까지 작성해서 그런 걸 수도 ..ㅠㅠ

 

이번 주차로 아마 워크샵은 끝인 것 같았다 !

워크샵이 조원분들이랑 친해지기에도 좋은 것 같고,

항상 말씀하시는 Soft Skill 향상에도 좋은 것 같다 (창의력이나.. 생각의 측면에서)

 


다음 주부터는 일주일 내내..

데이터 분석에 대해서 배운다 ...

후기를 둘러보니 지옥의 4주차라고 불리던데 ..? 

다들 같이 힘냈으면 좋겠다...

3주차라서 어느정도 다들 적응은 됐겠지만, 아무래도 체력적으로나 .. 

조금 지칠 수도 있을 것 같다.

 

아무튼 ..파이팅..

Comments