집계 함수(Aggregate Functions) - 데이터를 종합하여 특정 연산을 적용하는 함수들을 총칭 - 합계: sum() - 최소값: min() - 최대값: max() - 누적합계: cumsum() - 평균: mean() - 중앙값: median() - 상관계수: corrcoef() - 표준편차: std() - 고유값: unique() - 집계 함수의 기능 이해와 사용법은 매우 단순함 # 방법1 array.sum() # 방법2 np.sum(array) - 중요한 것은 데이터의 집계 방향을 지정해야함 - axis=None(defalut): 대상 ndarray의 모든 요소가 연산 대상이 됨 - axis=0: 열을 기준으로 동일 인덱스의 요소를 그룹으로 연산함 - axis=1: 행을 기준으로 동일 인덱스..
NumPy의 기본 연산 - 연산자(+, -, *, /, >, b print('\nResult of comparison operator(>)') print(result) ''' # NumPy 의 비교연산(!=) ''' result = a != b print('\nResult of comparison operator(!=)') print(result) ''' # Python 코드 실행 시간 측정하기 ''' python_arr = range(10000000) start = time.time() for i in python_arr: i + 1 print("\nPython(ms):", (time.time() - start)*1000) ''' # NumPy 코드 실행 시간 측정하기 ''' numpy_arr = np..
np.reshape(array, reshape) - 기존 데이터는 유지하면서 차원과 shape만을 바꾼 배열을 반환 - array: reshape할 ndarray - newshape: 변경하고자 하는 shape값(튜플) np.reshape(array, newshape) array.reshape(newshape) array.reshape(-1, N) - 기존 데이터를 유지하면서, shape을 변경하는 방식 - shape은 주어진 N에 따라 자동으로 추정되어 변경됨 - -1의 자리는 가변적 array.reshape(-1, N)
NumPy의 데이터 타입 - np.int64: (64비트) 정수 - np.float64: (64비트) 실수 - np.complex: 복소수 - np.bool: 불리언(True, False) - np.object: 파이썬 객체 - np.str: 문자열 정수형(Integer) 데이터 타입 - numpy.int는 음수와 양수를 표현하는 정수형 데이터 타입 - 뒤에 오는 숫자는 bit의 개수를 의미함(int8 -> 2^8 = 256개만큼의 정수 표현이 가능함) 데이터 타입 변경 1) ndarray 생성 시, 인자로 dtype을 지정하는 방식 import numpy as np data = [1, 2, 3] cpx_arr = np.array(data, dtype=np.complex) str_arr = np.arra..
ndarray - NumPy는 다양한 차원의 배열을 효율적으로 다룰 수 있는 라이브러리 - NumPy는 ndarray(N-Dimension Array)라는 핵심 자료구조를 제공한다. - 대규모의 데이터 집합을 담을 수 있는 매우 빠르고 유연한 핵심 자료구조 1차원 ndarray의 구성요소: Vector - 형태(shape): (n,) - 원소의 수(size): n - 저장된 데이터 타입(dtype) 2차원 ndarray의 구성요소: Matrix - 형태(shape): (n, n) - 원소의 수(size): n * n - 저장된 데이터 타입(dtype) ndarray의 Attribute - 형태(shape): ndarray.shape - 원소의 수(size): ndarray.size - 저장된 데이터의 타..