愛林

Python Numpy 본문

Data Science/Python

Python Numpy

愛林 2022. 6. 26. 18:34
반응형

Numpy 를 배웠다. 

import numpy as np ~~

 


Numpy 가 뭐냐면..

Numerical Python 의 약자로 다차원 배열의 연산 기능을 모아놓은 라이브러리이다 ..

수치 연산을 위한 다양한 기능을 제공한다.

데이터를 연속된 메모리 블럭에 저장해줘서 메모리를 적게 차지하고,

내부 연산이 C언어로 작성되어서 메모리를 직접 조작하기 때문에 처리가 빠르다 !

 

np.arrray([1,2,3]) : 초기화할 값을 지정하여 배열 생성

np.zeros() : 값을 0으로 초기화하여 배열 생성

np.ones() : 값을 1로 초기화하여 배열 생성

np.arrange() : 수의 순차적인 증감을 이용하여 배열 생성

np.rand() : 랜덤한 숫자로 배열 생성

 

np.arrray([1,2,3]) : 초기화할 값을 지정하여 배열 생성

1,2,3 의 배열이 생겼다.

 

np.zeros() : 값을 0으로 초기화하여 배열 생성

np.zeors() 는 0 배열을 생성해준다.

 

np.ones() : 값을 1로 초기화하여 배열 생성

np.ones() 는 1배열을 생성해준다. 단위배열 ..?

 

np.arrange() : 수의 순차적인 증감을 이용하여 배열 생성

0부터 시작한다.

 

np.rand() : 랜덤한 숫자로 배열 생성

np.rand() 는 랜덤배열을 생성해준다.

 

배열 생성하기

reshape() 는 배열의 모양을 바꿔준다.

 

np.shape() 는 배열이 어떻게 구성되어있는지 보여준다 (행, 열)

dtype() 는 데이터타입,

astype() 데이터타입을 바꾸어준다(정수형, 실수형 등..)

 

인덱스를 활용해서 값을 선택하는 것도 가능하다. 

기본 인덱스

 

다차원배열에서도 물론 인덱스를 사용하여 선택할 수 있다.

이렇게도 쓸 수 있다.

불리언 인덱스를 사용하여 선택할 수도 있다.

 

주요연산 

 

그 외에도 주요 연산은

np.square() = 제곱

np.sqrt() = 루트

np.exp() = 지수승

np.log() = 로그

np.add() = 더하기

np.sum() = 합계

np.cumsum() = 누적합

np.mean() = 평균

np.var() = 편차

np.std() = 표준편차

 

가 있다 .. 다 외울 순 없을 것 같아 ~

 

저장을 하고 싶으면

np.save('저장명', arr(아까 내가 만든 배열)) 해주거나,

 

load_arr = np.load('저장명.npy')

load_arr

해주면 된다~


Numpy 는 데이터 전처리 과정에서 많이 사용된다고 하니까~

알아두기 ! (사실 저 함수들은 찾아서 써도 될 것 같음ㅎㅎ쓰다보면 외워지겠지)

안녕~

 

 

 ※ 저의 모든 데이터 분석 자료는 모두 공공 빅데이터 청년 인턴 교재들을 참고합니다.

Comments