최대 1 분 소요

  • 연속형 변수들은 왜도가 높거나 정규분포가 아닐 가능성 높음 * **왜도: 한쪽으로 치우침
  • 데이터에 따라 변수의 값들을 단순한 몇 개의 그룹(Bin)으로 나누는게 효율적
  • 이산화를 적용하기 위해서는 변수에 결측치가 존재하지 않아야 함
  • 왜도가 작은 경우, 왜도 < 1의 경우 Equal Width Binning(동일 너비 분할) 사용
  • 왜도가 큰 경우 |왜도| > 1의 경우 Equal Frequency Binning(동일 빈도 분할) 사용 image

카테고리:

업데이트:

댓글남기기