extracting
시계열 데이터에서 특징 변수 추출 →날짜형 데이터에서 년, 월, 일, 요일, 주말여부, 휴일여부 등을 추출 2024-03-25- 구간별 평균, 합계, 기울기 등 구하기 예) 7일간 평균, 합계, 기울기 추출을 통한 feature trend를 학습데이터에 추가 Convo...
시계열 데이터에서 특징 변수 추출 →날짜형 데이터에서 년, 월, 일, 요일, 주말여부, 휴일여부 등을 추출 2024-03-25- 구간별 평균, 합계, 기울기 등 구하기 예) 7일간 평균, 합계, 기울기 추출을 통한 feature trend를 학습데이터에 추가 Convo...
undersampling oversampling combination sampling
결과에 대한 분산을 줄이기 위해 사용하는 기법 -> K-fold Cross validation이 대표적으로 많이 사용됨 K-fold Cross validation? -> 전체 데이터를 K개의 fold로 나눔 -> fold간 데이터는 서로 겹...
실전에서는 역시 한가지 방법만 시도하지 않음 SMOTEENN, SMOTETOMEK 등 SMOTEENN은 SMOTE(Over) 방법과 ENN(Under)을 조합하는 방법 → SMOTE를 통해 소수 클래스 데이터를 Oversampling하고 ENN을 통해 다수 클래스...
분류 모델 Classification은 데이터를 가장 잘 나누는 함수를 찾는 방법 SVM(Support Vector Machine)은 Binary classification 문제에 좋은 성능을 보이는 알고리즘 -> 2개 클래스의 데이터를 가장 잘 나눌 ...