최대 1 분 소요

  • series는 벡터, Dataframe은 행렬과 대응

    image image

  • indexer( index는 행과 같음) ✓ loc 인덱서: 명시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함
    • 행 조회: df.loc[‘index’]
    • 열 조회: df.loc[‘index’ , ‘column’]
    • ’[[]]’을 쓰면 df형태로 반환
         df.loc[df['color']=='R', ['species']]
         ->해설: color가 R인  , species인  선택
      

      ✓ iloc 인덱서: 묵시적인 인덱스를 참조하는 인덱싱과 슬라이싱을 가능하게 함

    • df.iloc[m,n] : m행 n열 반환
  • df.size: 행렬크기
  • series.values: Series의 값을 반환 (ndarray) -> array([list],dtype=)구조
  • series.to_list(): Series를 List 형태로 반환
  • series.to_dict(): Series를 Dict 형태로 반환
  • drop_duplicates(column, keep) ->column: 중복을 제거하고자 하는 기준 컬럼 keep: 중복을 제거한 뒤 남길 행의 위치 image
  • series.unique(): series 내의 유일한 값만 남김
  • series.value_counts(): series 내의 유일한 값의 빈도
  • pd.merge( df1, df2, on=’기준’): on을 기준으로 두 df를 병합
  • pd.concat([df1,df2], axis=0 or 1) 0일 때 행을 병합(세로), 1일 때 열을 병합(가로)

카테고리:

업데이트:

댓글남기기