2.Data handling 2
- drive.mount(): drive의 파일을 노트북 파일 시스템과 연결 시킴
- pd.read_csv(): 파일을 읽어 가져옴
- .head(n): 파일에서 상위 n개의 행 가져옴
- .merge(df, on=기준, how=)
- inner: 두 데이터 세트의 공통된 키(열)에 대해서만 합치고, 일치하지 않는 행은 제외
- outer: 두 데이터 세트의 모든 키(열)을 합치고, 일치하는 정보가 없는 경우에는 결측치로 채움
-
- test_df.iloc[0:int(len(test_df) * 0.6),:]
- test_df:102개, 102X0.6=61개의 행만 가져옴
- test_df.loc[(test_df[‘ratio1’] > 40.0) & (test_df[‘ratio2’] > 30.0)]
- ‘and’와 ‘&’차이
- ‘and’: 논리 연산자, 두 값 다 T여야지 T 반환 -‘&’: 비트 연산자 7 & 2: )7 = 0000 0111 +)2 = 0000 0010 ->2 = 0000 0010
댓글남기기