본문 바로가기
데이터 분석

Pandas dataframe의 연산 - 1

by 핸들이없는8톤트럭 2022. 8. 14.
반응형
import numpy as np
import pandas as pd

data = np.random.rand(10,5)
indices = list(range(101,111))
columns = ['a','b','c','d','e']
df = pd.DataFrame(data=data,columns=columns,index=indices)
print(df)
print(df.head())
print(df.head(10))
print(df.tail())
print(df.at[108,'b'])
df.at[108,'b'] = 0.5
print(df.at[108,'b'])
df.iat[0,0] = 1
print(df.iat[0,0])
print(df['b'])
print(df[['b']]) # 데이터프레임으로 출력
print(df[['b','c']])
print(df['b'].at[109])

print(df.loc[101])
print(df.loc[[101,102,103]])
print(df.loc[101]['b'])
print(df.loc[101].at['b'])
print(df.loc[101].iat[1])
print(df.iloc[0])

# 조건에 의한 자료의 선택
print(df)
print(df[df>0.5])
print(df['a']>0.5)
print("자료의 삭제")
print(df[df['a']>0.5]) # a열의 기준으로 조건보다 작은 행은 삭제함

print(df.loc[105]>0.5) # 가능
# df.loc[df.loc[105]>0.5 ] # 불가능

print(df)
print(df['b'] > 0.5)
print(df['c']<0.2)
print((df['b']>0.5) & (df['c']<0.2))
print(df[(df['b']>0.5) & (df['c']<0.2)])
print(df[(df['b']>0.5) | (df['c']<0.2)])  # or
print(print(df[(df['b']>0.5) ^ (df['c']<0.2)])) # 하나만 true
# print(df[~(df['b'])>0.5]) 파이참 x --> jupyter notebook ok
반응형

'데이터 분석' 카테고리의 다른 글

DataFrame의 연산 - 인덱스 설정  (0) 2022.08.15
dataframe의 연산 - 자료의 제거  (0) 2022.08.14
Pandas Dataframe 클래스  (0) 2022.08.13
Pandas 패키지  (0) 2022.08.12
array의 저장 / 불러오기  (0) 2022.08.11

댓글