pandas

2024-03-04 최대 1 분 소요

series는 벡터, Dataframe은 행렬과 대응
indexer( index는 행과 같음) ✓ loc 인덱서: 명시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함
- 행 조회: df.loc[‘index’]
- 열 조회: df.loc[‘index’ , ‘column’]
- ’[[]]’을 쓰면 df형태로 반환
```
   df.loc[df['color']=='R', ['species']]
   ->해설: color가 R인 행 , species인 열 선택
```
  ✓ iloc 인덱서: 묵시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함
- df.iloc[m,n] : m행 n열 반환
df.size: 행렬크기
series.values: Series의 값을 반환 (ndarray) -> array([list],dtype=)구조
series.to_list(): Series를 List 형태로 반환
series.to_dict(): Series를 Dict 형태로 반환
drop_duplicates(column, keep) ->column: 중복을 제거하고자 하는 기준 컬럼 keep: 중복을 제거한 뒤 남길 행의 위치
series.unique(): series 내의 유일한 값만 남김
series.value_counts(): series 내의 유일한 값의 빈도
pd.merge( df1, df2, on=’기준’): on을 기준으로 두 df를 병합
pd.concat([df1,df2], axis=0 or 1) 0일 때 행을 병합(세로), 1일 때 열을 병합(가로)

참고