집계 함수(Aggregate Functions)
- 데이터를 종합하여 특정 연산을 적용하는 함수들을 총칭
- 합계: sum()
- 최소값: min()
- 최대값: max()
- 누적합계: cumsum()
- 평균: mean()
- 중앙값: median()
- 상관계수: corrcoef()
- 표준편차: std()
- 고유값: unique()
- 집계 함수의 기능 이해와 사용법은 매우 단순함
# 방법1
array.sum()
# 방법2
np.sum(array)
- 중요한 것은 데이터의 집계 방향을 지정해야함
- axis=None(defalut): 대상 ndarray의 모든 요소가 연산 대상이 됨
- axis=0: 열을 기준으로 동일 인덱스의 요소를 그룹으로 연산함
- axis=1: 행을 기준으로 동일 인덱스의 요소를 그룹으로 연산함
import numpy as np
# 샘플 데이터 생성
sample = np.arange(1,10).reshape(3,3)
print('Sample')
print(sample)
'''
# axis=None 실습 (default)
'''
print('\n[CASE-1]axis=None')
print('sum :', sample.sum())
print('mean :', sample.mean())
print('std :', sample.std())
print('max :', sample.max())
print('min :', sample.min())
'''
# axis=0 실습
'''
print('\n[CASE-2]axis=0')
print('sum :', sample.sum(axis=0))
print('mean :', sample.mean(axis=0))
print('std :', sample.std(axis=0))
print('max :', sample.max(axis=0))
print('min :', sample.min(axis=0))
'''
# axis=1 실습 (default)
'''
print('\n[CASE-3]axis=1')
print('sum :', sample.sum(axis=1))
print('mean :', sample.mean(axis=1))
print('std :', sample.std(axis=1))
print('max :', sample.max(axis=1))
print('min :', sample.min(axis=1))
Sample
[[1 2 3]
[4 5 6]
[7 8 9]]
[CASE-1]axis=None
sum : 45
mean : 5.0
std : 2.581988897471611
max : 9
min : 1
[CASE-2]axis=0
sum : [12 15 18]
mean : [4. 5. 6.]
std : [2.44948974 2.44948974 2.44948974]
max : [7 8 9]
min : [1 2 3]
[CASE-3]axis=1
sum : [ 6 15 24]
mean : [2. 5. 8.]
std : [0.81649658 0.81649658 0.81649658]
max : [3 6 9]
min : [1 4 7]
'프로젝트 > 코드프레소 체험단' 카테고리의 다른 글
파이썬으로 배우는 데이터 분석: NumPy - 데이터 정렬 (0) | 2022.04.01 |
---|---|
파이썬으로 배우는 데이터 분석: NumPy - 데이터 조회 (0) | 2022.04.01 |
파이썬으로 배우는 데이터 분석: NumPy - NumPy의 기본 연산 (0) | 2022.04.01 |
파이썬으로 배우는 데이터 분석: NumPy - NumPy의 reshape (0) | 2022.04.01 |
파이썬으로 배우는 데이터 분석: NumPy - NumPy의 데이터 타입 (0) | 2022.03.28 |