2.Data handling 2

2024-03-06 최대 1 분 소요

drive.mount(): drive의 파일을 노트북 파일 시스템과 연결 시킴
pd.read_csv(): 파일을 읽어 가져옴
.head(n): 파일에서 상위 n개의 행 가져옴
.merge(df, on=기준, how=)
- inner: 두 데이터 세트의 공통된 키(열)에 대해서만 합치고, 일치하지 않는 행은 제외
- outer: 두 데이터 세트의 모든 키(열)을 합치고, 일치하는 정보가 없는 경우에는 결측치로 채움
test_df.iloc[0:int(len(test_df) * 0.6),:]

test_df:102개, 102X0.6=61개의 행만 가져옴
test_df.loc[(test_df[‘ratio1’] > 40.0) & (test_df[‘ratio2’] > 30.0)]
- ‘and’와 ‘&’차이
- ‘and’: 논리 연산자, 두 값 다 T여야지 T 반환 -‘&’: 비트 연산자 7 & 2: )7 = 0000 0111 +)2 = 0000 0010 ->2 = 0000 0010

코드 유사성 판단 경진 대회- private 3위

2024-04-08 8 분 소요

라이브러리 및 seed고정

2024-03-27 9 분 소요

[목적] Support Vector Machine 실습 One-Class Support Vector Machine 실습 Multivariate variable (다변량)일 때 사용

2024-03-27 최대 1 분 소요

[목적] Robust Random Cut Forest Code 실습 Multivariate variable (다변량)일 때 사용 각 Data마다 Score를 계산하여 Abnormal을 산출 할 수 있음

2024-03-27 3 분 소요

[목적] Isolation Forest Code 실습 Multivariate variable (다변량)일 때 사용 각 Data마다 Score를 계산하여 Abnormal을 산출 할 수 있음