| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- 빅데이터
- ADSP
- decisiontree
- 머신러닝
- 2023공빅데
- 공빅
- 공빅데
- SQL
- 분석변수처리
- machinelearning
- textmining
- DL
- datascience
- 2023공공빅데이터청년인재양성후기
- ADsP3과목
- 2023공공빅데이터청년인재양성
- 오버샘플링
- 클러스터링
- 공공빅데이터청년인턴
- data
- 텍스트마이닝
- NLP
- 공공빅데이터청년인재양성
- DeepLearning
- k-means
- Keras
- ML
- 데이터전처리
- Kaggle
- 데이터분석
- Today
- Total
목록Data Science/Python (10)
愛林
Jupyter Notebook File 을 PDF 로 변환하고 싶을 때에는 File 탭에서 Download as PDF 를 해주면 된다. 그치만 관련 프로그램을 설치하지 않을 시 이와 같은 에러가 난다. 프로그램이 설치 되어 있지 않아 나는 오류인데, https://nbconvert.readthedocs.io/en/latest/install.html Installation — nbconvert 7.2.7 documentation Installation Supported Python versions Currently Python 3.7-3.9 is supported and tested by nbconvert. Installing nbconvert Nbconvert is packaged for both pi..
파이썬을 다운그레이드 시켜야 할 일이 생겼다. mecab 을 python 에서 사용하고 싶은데, 3.9 로는 진행할 수 없었다. Python version 이 높으면 안 돌아가는 것들이 생기기 마련이다. 그래서 나는 버전을 3.7.0 으로 낮추었다. 먼저 Anaconda Prompt 를 켜주고, Python version 을 확인해준다. 업데이트 해준 후, conda install python= 'version' 을 입력하면 된다. version 엔 본인이 원하는 버전을 입력하면 된다. 나는 3.7.0 입력했다. Solving environment: failed with initial frozen solve. Retrying with flexible solve. 에러가 발생했다. conda 가 최신 버전..
드디어 프로젝트를 진행하게 되었으나, 난생 처음 공공데이터 포털에서 OpenAPI 를 받아와서 쓰게 되었다. 자주 받아올 것 같으니 쓰는 포스팅. 이렇게 적어두는 것은 나중에 나에게 큰 도움이 될 것이다 ... 먼저, 공공데이터 포털에 접속해서, 내가 원하는 OpenAPI 를 활용신청한다. 아마 자동승인 될 것이다. 이후 내가 원하는 활용신청 상세기능 정보에 들어가서 미리보기로 내가 확인할 데이터 한 번 미리봐준 후에 , API 상세 페이지로 가서 내가 원하는 상세 데이터 정보를 조회한다. 이후 아래의 샘플코드를 받아와서, Python 에 입력한다. 나는 jupyter 노트북을 사용했다. 서비스키 안에는 서비스 정보에 있는 일반 인증키 번호를 넣어주면 된다. 위의 내용을 붙여넣기 한 것이다. 데이터의 정..
시각화 데이터 시각화를 통해 데이터를 그래프나 차트로 시각화함으로써 데이터 안에 숨겨진 정보를 효율적으로 파악하며, 데이터에 내재된 트랜드 이상치, 패턴 등을 파악할 수 있다. 긴 말 필요없이, 바로 실습을 진행하면서 시각화 데이터를 알아보도록 하자. 데이터 시각화 실습 import pandas as pd import numpy as np import scipy.stats as stats import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns # 깨짐 방지를 위한 Font 지정 import os if os.name =='nt' : font_family = "Malgun Gothic" else : font_family = "Appl..
Pandas 를 들어가기 전에, Table 은 Series 와 DataFrame 으로 이루어져 있다는 것을 알아두어야 한다 ~ import pandas as pd (사실 pd로 안 해도 되지만 저게 국룰인 것 같다) 로 불러오기가 가능하다 ~ Series 는 1차원데이터. 그러니까, 한 열을 말하는 것. 한 종류의 데이터이다. DataFrame 은 그와 달리 2차원 형태로, 데이터 표이다. 그냥 Series 를 모아놓은 것이라고 생각하면 될 듯 ~ Pandas 에는 많은 기능이 있는데, 우리가 강의에서 살펴본 내용은 데이터프레임 생성, 탐색, 정렬, 선택, 삭제, 연산, 변형, 저장 같은 기본적인 내용들이다 ! 먼저 데이터 프레임을 생성해보자. range(2000,2010) 은 2000부터 1씩 증가하게..
Numpy 를 배웠다. import numpy as np ~~ Numpy 가 뭐냐면.. Numerical Python 의 약자로 다차원 배열의 연산 기능을 모아놓은 라이브러리이다 .. 수치 연산을 위한 다양한 기능을 제공한다. 데이터를 연속된 메모리 블럭에 저장해줘서 메모리를 적게 차지하고, 내부 연산이 C언어로 작성되어서 메모리를 직접 조작하기 때문에 처리가 빠르다 ! np.arrray([1,2,3]) : 초기화할 값을 지정하여 배열 생성 np.zeros() : 값을 0으로 초기화하여 배열 생성 np.ones() : 값을 1로 초기화하여 배열 생성 np.arrange() : 수의 순차적인 증감을 이용하여 배열 생성 np.rand() : 랜덤한 숫자로 배열 생성 np.arrray([1,2,3]) : 초기..
ㅎ 너무 힘들다 첫 날 첫 수업 배운 것. 그냥 뭐 OT하고 Python 을 배웠다. jupyter Notebook 설치함 . 그리고 Python 기본 문법같은 거 했다. Numpy 도 배웠음 . ㅎㅎ 이렇게 게시물 쓰는 거 얼마나 더 하려나 ~ 여기서 또 알아두고 가야할 것들.. 컨테이너 타입을 알아두어야 한다. 자료형! 리스트 = 대괄호 사용[] 다양한 문장, 순서를 가지고 있다. 튜플 = 소괄호 사용() 보기만 할 수 있고 변경 및 삭제 불가. 순서는 가지고 있다. 세트 = 중괄호 사용{} 순서가 없는 집합 형태. 중복된 데이터를 가지는 것이 불가능하다. 추가/변경/삭제는 가능 딕셔너리 = 중괄호 사용{}, Key-Value 를 가진다. 순서를 가지고 있고, 변경/추가/삭제 가능. 함수를 정의하는 ..
아 힘들다 ... 파이썬 모듈(Module) 모듈은 파이썬 코드를 관리하기 위한 논리적 단위이다. 일반적으로 하나의 파이썬 .py 파일이 하나의 모듈이다. 이 모듈 내에는 함수, 클래스 혹은 변수들의 정의가능, 실행코드가 포함되어 있다. 파이썬 패키지(Package) 패키지 않에 모듈이 여러 개 들어가있다.. 파이썬 모듈의 종류에는 기본 모듈, 사용자 정의 모듈, 3rd party 모듈들이 있다. 기본 모듈에는 파이썬의 운영체제같은 OS 모듈, 시스템 모듈 등이 대표적이다. 사용자 정의 모듈은 개발자, 우리가 개발한 모듈들이다, 서브파티모듈은 가장 많이 쓰이는 numpy, pandas 모듈 등을 말한다. 우리가 모듈을 사용하기 위해서는 from, import 의 구문을 사용해야 한다. import [모듈..
흑흑 Python 머리아팡 아 나는 jupyter lab 에서 Notebook 을 만들어서 사용한다. 이게 뭔지는 아직도 모름 jupyter 도 써보고 anaconda 네비게이터 ? 암튼 이것도 써보고 .. visual studio 도 다 써봤는데 써보기만(?) 했다. 언어도 java, C, html, Python 다 써본 것 같은데 이것도 다 써보기만(?) 함 ; 접해본 건 많은데 머리에 남은 건 없는 전형적인 얼레벌레 케이스. 그래서 이번에는 배운 걸 꼭 머리에 남기겠다는 의지로 블로그 쓰는거임.. 복습 차원이랄ㄹ까 ㅎㅎ .. 파이썬 셋, 딕셔너리 Python 의 이해 I 에서도 나왔던 set .. 대괄호는 리스트 .. 소괄호는 튜플 .. 중괄호는 set 이다 ...... tuple 은 인덱싱, 슬라..
Python 오랜만에 하는데 낯익긴 한데 하라고 하면 잘 못 할 것 같음 ㅋㅋ print('Hello World') 는 국룰임. 나는 Hello Python ~ 수학의 첫 시작은 사칙연산부터 시작이지. 코딩도 비슷하다. 더하기는 + , 빼기는 - , 곱하기는 * , 나누기는 / 제곱은 **, 몫이 나오는 나누기는 // , 나머지를 보여주는 나누기는 % 몫 나오는 나누기가 // 라서 자꾸 %도 %%로 침. 헷갈령 ~ 그래 .. 첫걸음이라서 지루하다 .. 헬로헬로 .. 맨 밑에 건 Python 의 규칙(?) 이다. join 처음 보는 것 같은데 아닌가 split() 도 처음 보는 것 같은데 아닌가 ..... 암튼 그렇다. 중괄호를 쓰는 set() .. {} 내가 이걸 다 기억할 수 있을까? startswit..