pandas
-
series는 벡터, Dataframe은 행렬과 대응
- indexer( index는 행과 같음)
✓ loc 인덱서: 명시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함
- 행 조회: df.loc[‘index’]
- 열 조회: df.loc[‘index’ , ‘column’]
- ’[[]]’을 쓰면 df형태로 반환
df.loc[df['color']=='R', ['species']] ->해설: color가 R인 행 , species인 열 선택
✓ iloc 인덱서: 묵시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함
- df.iloc[m,n] : m행 n열 반환
- df.size: 행렬크기
- series.values: Series의 값을 반환 (ndarray) -> array([list],dtype=)구조
- series.to_list(): Series를 List 형태로 반환
- series.to_dict(): Series를 Dict 형태로 반환
- drop_duplicates(column, keep)
->column: 중복을 제거하고자 하는 기준 컬럼 keep: 중복을 제거한 뒤 남길 행의 위치
- series.unique(): series 내의 유일한 값만 남김
- series.value_counts(): series 내의 유일한 값의 빈도
- pd.merge( df1, df2, on=’기준’): on을 기준으로 두 df를 병합
- pd.concat([df1,df2], axis=0 or 1) 0일 때 행을 병합(세로), 1일 때 열을 병합(가로)
댓글남기기