DataFrame - 행과 열을 가진 2차원 데이터를 저장할 수 있는 자료구조 - 데이터와 행/열에 대한 인덱스가 저장됨 - 각 컬럼은 서로 다른 데이터 타입으로 구성될 수 있음 - 1개의 컬럼은 Series 객체로 구성됨 pd.DataFrame(data, index, columns) - 다양한 형태로 저장된 파이썬 객체를 전달하여 DataFrame 생성 - Series 객체, 중첩된 딕셔너리 객체, 딕셔너리의 리스트, 리스트, 튜플의 리스트, ndarray, ... - data: DataFrame 에 저장할 데이터 객체 - index: DataFrame 의 행의 인덱스, 순서를 지정 - columns: DataFrame 의 열의 인덱스, 순서를 지정 DataFrame 의 주요 속성 - .index : ..
Pandas 시작하기 import pandas as pd print(pd.__version__) Series - 1차원 배열의 자료구조 - 인덱스를 통한 데이터 접근 가능 - 동일한 데이터 타입의 값을 저장할 수 있음 pd.Series(data) - 리스트, 튜플, 딕셔너리 등의 파이썬 객체를 data 인자로 전달하여 생성 - 인덱스를 지정하지 않는 경우, 정수 0부터 시작되는 인덱스가 생성됨 pd.Series(data, index, name) - index: Series 객체 생성 시, index 설정하기 - name: Series 객체 생성 시, 이름 지정하기 pd.Series(data=[딕셔너리], name) - 파이썬 딕셔너리: {key1: value1, key2: value2, ..., keyn..
Pandas 라이브러리 소개 - 데이터 분석을 위한 파이썬 기반의 라이브러리 - 2차원 데이터를 효율적으로 가공 및 처리할 수 있는 강력한 라이브러리 - https://pandas.pydata.org/ pandas - Python Data Analysis Library pandas pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool, built on top of the Python programming language. Install pandas now! pandas.pydata.org pandas is a fast, powerful, flexible and easy to us..
NumPy는 ndarray 내 저장된 데이터의 정렬을 위한 함수를 제공한다. np.sort(array) - 기본적으로 오름차순 정렬만 지원함 - 정렬된 결과를 반환하지만, 원본 데이터는 변경하지 않음 - 원본 데이터를 변경하려면 호출 순서를 다음과 같이 작성하면 됨 - array.sort(): 원본 데이터를 변경하고 none 값을 반환 - np.sort()를 활용한 내림차순 정렬 1) np.sort()를 통해 오름차순 정렬하여 저장 2) 오름차순 정렬된 배열을 역순으로 출력: array[::-1] np.sort(array, axis) - 기본적으로 1차원 정렬과 동일함 - 2차원 데이터의 정렬 시에는, axis를 통해 집계 방향을 결정함 np.argsort(array) - 입력된 배열을 오름차순으로 정렬..
NumPy의 Index(인덱스) - 배열 내 특정 데이터는 인덱스를 통해 접근할 수 있음 - Indexing을 통한 조회방법: array[index], array[index, index], array[index, index, index], ... import numpy as np # 1차원 샘플 데이터 생성 sample = np.arange(5,15) print('1D-Array Sample:', sample) print('sample[3] = ', sample[3]) # 인덱싱 값 변경 후 출력 sample[3] = 0 print('1D-Array Sample:', sample) # 2차원 샘플 데이터 생성 sample = np.arange(16).reshape((4,4)) print('\n2D-Arr..