본문 바로가기
데이터 분석

Pandas 패키지

by 핸들이없는8톤트럭 2022. 8. 12.
반응형

Numpy를 기반으로 하는 파이썬 데이터 분석 패키지가 바로 Pandas 패키지 입니다.

- DataFrame을 기반으로 하는 데이터 처리 패키지

- 데이터 분석과 클리닝, 전처리를 빠르게 할 수 있습니다.

- 생산성과 퍼포먼스 양 측면에서도 모두 뛰어납니다.

- 핵심코드는 cython과 c언어로 구현되었습니다.

- 간단한 데이터 시각화 기능이 가능합니다.

- 다양한 소스 데이터를 활용할 수 있습니다.

--> excel과 유사한 작업을 스크립트로 수행 가능합니다.

--> R언어와 Pandas가 무척이나 유사해서, pandas를 공부하면 r언어를 익히기 쉽습니다.

 

Pandas Series 클래스

여러 개의 인덱스된 값을 다루는 클래스입니다. 인덱스덴 값은 파이썬의 list 또는 dictionary 자료형과 유사한 자료구조를 의미합니다. 여러 개의 값과 각 값의 인덱스를 받아 객체를 생성합니다. 인덱스를 입력하지 않을 경우, 0-based index를 사용합니다.

 

import pandas as pd

data = [10,5,42,124]
indice = ['a','b','c','d']
print(pd.Series(data)) # 인덱스는 입력을 따로 입력하지 않아서 0부터 시작

x=pd.Series(data,indice)
print(x)
print(x.index)
print(x['a'])
x= pd.Series(data, index=indice, name ='order')
print(x)

data_dict = {k:v for k, v in zip(indice, data)}
print(data_dict)
x= pd.Series(data_dict)
print(x)
반응형

'데이터 분석' 카테고리의 다른 글

Pandas dataframe의 연산 - 1  (0) 2022.08.14
Pandas Dataframe 클래스  (0) 2022.08.13
array의 저장 / 불러오기  (0) 2022.08.11
Array의 연산  (0) 2022.08.11
Array 인덱싱과 슬라이싱  (0) 2022.08.10

댓글