반응형
import numpy as np
import pandas as pd
data = np.random.rand(10,5)
indices = list(range(101,111))
columns = ['a','b','c','d','e']
df = pd.DataFrame(data=data,columns=columns,index=indices)
print(df)
print(df.head())
print(df.head(10))
print(df.tail())
print(df.at[108,'b'])
df.at[108,'b'] = 0.5
print(df.at[108,'b'])
df.iat[0,0] = 1
print(df.iat[0,0])
print(df['b'])
print(df[['b']]) # 데이터프레임으로 출력
print(df[['b','c']])
print(df['b'].at[109])
print(df.loc[101])
print(df.loc[[101,102,103]])
print(df.loc[101]['b'])
print(df.loc[101].at['b'])
print(df.loc[101].iat[1])
print(df.iloc[0])
# 조건에 의한 자료의 선택
print(df)
print(df[df>0.5])
print(df['a']>0.5)
print("자료의 삭제")
print(df[df['a']>0.5]) # a열의 기준으로 조건보다 작은 행은 삭제함
print(df.loc[105]>0.5) # 가능
# df.loc[df.loc[105]>0.5 ] # 불가능
print(df)
print(df['b'] > 0.5)
print(df['c']<0.2)
print((df['b']>0.5) & (df['c']<0.2))
print(df[(df['b']>0.5) & (df['c']<0.2)])
print(df[(df['b']>0.5) | (df['c']<0.2)]) # or
print(print(df[(df['b']>0.5) ^ (df['c']<0.2)])) # 하나만 true
# print(df[~(df['b'])>0.5]) 파이참 x --> jupyter notebook ok
반응형
'데이터 분석' 카테고리의 다른 글
DataFrame의 연산 - 인덱스 설정 (0) | 2022.08.15 |
---|---|
dataframe의 연산 - 자료의 제거 (0) | 2022.08.14 |
Pandas Dataframe 클래스 (0) | 2022.08.13 |
Pandas 패키지 (0) | 2022.08.12 |
array의 저장 / 불러오기 (0) | 2022.08.11 |
댓글