transforming
Linear regression 또는 Gaussian Naïve Bayes와 같은 ML 알고리즘들은 연속형 변수에 대해 정규 분포를 가정하는 경우가 많음 정규분포가 아닌 변수들을 Power Transforming을 사용하여 정규분포 또는 정규분포에 가까운 데이터로 변환 가...
Linear regression 또는 Gaussian Naïve Bayes와 같은 ML 알고리즘들은 연속형 변수에 대해 정규 분포를 가정하는 경우가 많음 정규분포가 아닌 변수들을 Power Transforming을 사용하여 정규분포 또는 정규분포에 가까운 데이터로 변환 가...
imp = SimpleImputer(missing_values=np.nan, strategy='constant', fill_value=-9999) imputed = imp.fit_transform(df2.loc[:, ['age', 'measurement']].values) pd.D...
확률에서의 연산은 곱셈 연산이 많기 때문에 값의 범위가 클 경우, 연산 결과가 발산하게 됨 거기에 더불어서 연산속도도 느려지고 메모리를 많이 차지하게 됨 다양한 문제가 있지만, 주된 목적은 연산 결과가 발산하는 것을 방지하기 위해 scaling을 함 대표적인 sca...
Regression은 데이터를 가장 잘 표현하는 함수를 찾는 방법 장점 • Model이 간단하기 때문에 모델의 학습시간이 짦음 • 선형 데이터에 적합 • 직관적 해석이 가능함 단점 • 비선형 데이터에 부적합 • 다차원의 데이터의 경우에는 결과...
netflix prize-> 작품 추천 collaborative filtering : 취향이 비슷한 사람을 찾아주는 방법 content based filtering: 비슷한 컨텐츠를 찾아주는 방법 factorization 기반: Matrix Factori...