프로젝트/코드프레소 체험단

파이썬으로 배우는 데이터 분석: NumPy - NumPy의 집계함수

KimCookieYa 2022. 4. 1. 00:52

집계 함수(Aggregate Functions)

 - 데이터를 종합하여 특정 연산을 적용하는 함수들을 총칭

 - 합계: sum()

 - 최소값: min()

 - 최대값: max()

 - 누적합계: cumsum()

 - 평균: mean()

 - 중앙값: median()

 - 상관계수: corrcoef()

 - 표준편차: std()

 - 고유값: unique()

 - 집계 함수의 기능 이해와 사용법은 매우 단순함

 

# 방법1
array.sum()
# 방법2
np.sum(array)

 

 - 중요한 것은 데이터의 집계 방향을 지정해야함

 - axis=None(defalut): 대상 ndarray의 모든 요소가 연산 대상이 됨

 - axis=0: 열을 기준으로 동일 인덱스의 요소를 그룹으로 연산함

 - axis=1: 행을 기준으로 동일 인덱스의 요소를 그룹으로 연산함

 

import numpy as np

# 샘플 데이터 생성
sample = np.arange(1,10).reshape(3,3)
print('Sample')
print(sample)

'''
# axis=None 실습 (default)
'''
print('\n[CASE-1]axis=None')
print('sum :', sample.sum())
print('mean :', sample.mean())
print('std :', sample.std())
print('max :', sample.max())
print('min :', sample.min())

'''
# axis=0 실습
'''
print('\n[CASE-2]axis=0')
print('sum :', sample.sum(axis=0))
print('mean :', sample.mean(axis=0))
print('std :', sample.std(axis=0))
print('max :', sample.max(axis=0))
print('min :', sample.min(axis=0))

'''
# axis=1 실습 (default)
'''
print('\n[CASE-3]axis=1')
print('sum :', sample.sum(axis=1))
print('mean :', sample.mean(axis=1))
print('std :', sample.std(axis=1))
print('max :', sample.max(axis=1))
print('min :', sample.min(axis=1))
Sample
[[1 2 3]
[4 5 6]
[7 8 9]]
[CASE-1]axis=None
sum : 45
mean : 5.0
std : 2.581988897471611
max : 9
min : 1
[CASE-2]axis=0
sum : [12 15 18]
mean : [4. 5. 6.]
std : [2.44948974 2.44948974 2.44948974]
max : [7 8 9]
min : [1 2 3]
[CASE-3]axis=1
sum : [ 6 15 24]
mean : [2. 5. 8.]
std : [0.81649658 0.81649658 0.81649658]
max : [3 6 9]
min : [1 4 7]