본문 바로가기
반응형

데이터 분석17

dataframe의 연산 - 자료의 제거 import numpy as np import pandas as pd data = np.random.rand(10,5) indices = list(range(101,111)) columns = ['a','b','c','d','e'] df = pd.DataFrame(data=data,columns=columns,index=indices) print(df) print(df.drop('a', axis=1)) # default = 행방향 --> axis =1 열방향 print(df) # 그대로 df = df.drop('a', axis=1) # or df.drop('a', axis=1, inplace = True) print(df.drop(['b','c'],axis=1)) df = df.drop(['b','c'].. 2022. 8. 14.
Pandas dataframe의 연산 - 1 import numpy as np import pandas as pd data = np.random.rand(10,5) indices = list(range(101,111)) columns = ['a','b','c','d','e'] df = pd.DataFrame(data=data,columns=columns,index=indices) print(df) print(df.head()) print(df.head(10)) print(df.tail()) print(df.at[108,'b']) df.at[108,'b'] = 0.5 print(df.at[108,'b']) df.iat[0,0] = 1 print(df.iat[0,0]) print(df['b']) print(df[['b']]) # 데이터프레임으로 출력 .. 2022. 8. 14.
Pandas Dataframe 클래스 여러 개의 Series 객체를 묶어서 만드는 표 형식의 클래스입니다. 표 형식의 데이터와 각 column 및 row의 이름을 입력 받아 생성합니다. 각 column은 series의 객체로 구성되어 있습니다. DataFrame import numpy as np import pandas as pd data ={'col1':[1,2,3,4],'col2':[5,6,7,8]} print(data) df = pd.DataFrame(data) print(df) # 이쁘게 나온다. 자동으로 index 붙음 data = np.random.rand(10,5) print(data) indices = list(range(1,11)) columns = ['A','B','C','D','E'] df = pd.DataFrame(da.. 2022. 8. 13.
Pandas 패키지 Numpy를 기반으로 하는 파이썬 데이터 분석 패키지가 바로 Pandas 패키지 입니다. - DataFrame을 기반으로 하는 데이터 처리 패키지 - 데이터 분석과 클리닝, 전처리를 빠르게 할 수 있습니다. - 생산성과 퍼포먼스 양 측면에서도 모두 뛰어납니다. - 핵심코드는 cython과 c언어로 구현되었습니다. - 간단한 데이터 시각화 기능이 가능합니다. - 다양한 소스 데이터를 활용할 수 있습니다. --> excel과 유사한 작업을 스크립트로 수행 가능합니다. --> R언어와 Pandas가 무척이나 유사해서, pandas를 공부하면 r언어를 익히기 쉽습니다. Pandas Series 클래스 여러 개의 인덱스된 값을 다루는 클래스입니다. 인덱스덴 값은 파이썬의 list 또는 dictionary 자료형과.. 2022. 8. 12.
반응형