2 3. Explainable method
Black Box
- 내부 구조나 작동 원리를 모르더라도 입력과 출력을 할 수 있는 장치나 회로, 또는 과정
- 여객기, 수송기와 같은 항공기 안에 비치하는 데이터 자동 기록 장치. 비행 기록 장치와 조종실 음성기록 장치가 들어 있음, 사고가 났을 때 그 원인을 밝히는데 중요한 구실을 함
- performance가 오르면 explainability가 낮아짐
- deep learning-> per은 높지만 exp가 낮음
- linear model-> exp는 높지만 per이 낮음
- Model Complexity가 높은 (해석력이 낮은) Model에 대해 해석을 얻으려는 연구가 많이 이루어짐
- eXplainable Artificial Intelligence (XAI)
- Interpretable Models
- Linear Regression, Logistic Regression, Generalized Linear Models, Generalized Additive Models
- Generalized Linear Models: 종속변수의 분포를 여러 분포로 확장
- Generalized Additive Models: 비선형 관계도 학습가능
- Generalized Linear Models: 종속변수의 분포를 여러 분포로 확장
- Decision Tree, Naïve Bayes Classifier, K-Nearest Neighbors(KNN)
- Naïve Bayes Classifier: P(AㅣB)사용
- Naïve Bayes Classifier: P(AㅣB)사용
- Local Model-Agnostic Methods : LIME, SHAP
- Linear Regression, Logistic Regression, Generalized Linear Models, Generalized Additive Models
Global vs Local Interpretability
Global | Local |
---|---|
종속변수 Y 전체 | 특정 종속변수 Y(Locality) |
종속변수 Y 영향을 미치는 중요도 | 특정 종속변수 Y에 영향을 미치는 중요도 |
효율에 영향을 미치는 중요도 | 저효율에 영향을 미치는 중요도 |
공부에 영향을 미치는 중요도 | 고득점에 영향을 미치는 중요도 |
운전에 영향을 미치는 중요도 | 고속도로 운전에 영향을 미치는 중요도 |
- 기존 분석의 중요인자 추출 기법은 전체 데이터를 대변하는 중요 인자를 추출함
- **데이터 분석의 목적에서 특정 Y(Local, 고효율) 군을 결정 짓는 중요 인자를 추출할 수 있음
- 더 나아가 0.01%(불량 등) 데이터를 결정 짓는 중요 인자를 추출
- 전체 Y를 대변하는 중요 인자(Global Interpretability)와 특정 데이터에 대한 중요 인자(Local Interpretability)는 다른 결과를 불러올 수 있음
- 특정 Y(내가 원하는 데이터)에 대한 해석력을 얻기 위해서는 **Black Box Model을 열어 봐야함
- Interpretable Machine Learning(IML)을 통해 Black Box Model을 열어 봄
댓글남기기