anomaly detection
공정 프로세스 관리, 금융 사기 거래 탐지에서 많이 사용 현업에서 정의한 Normal을 벗어나는 데이터를 Abnomal라 정의 단순히 Outlier detection 그리고 Out-of-Distribution, One Class Classification
공정 프로세스 관리, 금융 사기 거래 탐지에서 많이 사용 현업에서 정의한 Normal을 벗어나는 데이터를 Abnomal라 정의 단순히 Outlier detection 그리고 Out-of-Distribution, One Class Classification
XGBoost 란? XGBoost는 eXtreme Gradient Boosting의 약자임 (극한 변화도 부스팅) Boosting 기법을 이용하여 구현한 알고리즘은 Gradient Boosting Machine이 대표적임 이 알고리즘은...
타겟 Y는 없고, 독립변수 X만 있는 경우 Topic Modeling, Clustering
Topic Modeling은 텍스트 데이터에서 숨겨진 주제 구조를 찾아내는 통계적 모델링 기법입니다. 이 기술은 대량의 문서 집합에서 주제를 자동으로 추출하여, 문서들이 어떤 주제를 다루고 있는지를 파악하는 데 사용됩니다. Topic Modeling은 자연어 처리(Natural L...
Tomek Links는 데이터 전처리, 특히 불균형 데이터셋을 다룰 때 사용되는 기법 중 하나입니다. 불균형 데이터셋은 한 클래스의 샘플이 다른 클래스에 비해 상대적으로 매우 적은 경우를 말합니다. 이런 경우, 모델이 다수 클래스에 편향되는 문제가 발생할 수 있습니다. Tomek ...